服务近2000家客户,人工智能掘金热中,他选择做卖水人,想把AI做成人人能用的应用
2018-07-23 17:06:08爱云资讯阅读量:521
“
掘金热时,挖金人无数,卖水的赚了钱。在AI热潮中,戴文渊想让第四范式做那个卖水人。
”
撰稿:贾 宁
01
想做AI界的甲骨文
第四范式,戴文渊所有的野心就嵌在这个名字里。
范式是科学用语,人类科学研究的发展经历了四个范式,第四种范式是数据科学,即让计算机总结规律的数据密集型科学。第四范式的名称就来源于此。
范式也是计算机专业术语,数据库通过三大范式来优化数据存储方式。在数据库企业解决方案领域,市值1900多亿美元的甲骨文,是一座难以攀越的高山。
第四范式创始人兼CEO戴文渊希望做人工智能时代的甲骨文,为企业及合作伙伴服务产业的公司提供既好用又有壁垒的技术服务。
「大部分人想做服务器,因为壁垒不高,好用归好用,我可以再做一个和你竞争。但是,好用的甲骨文数据库没有人想着再做一个。」戴文渊对新经济100人说。
▲第四范式创始人兼CEO 戴文渊
他意识到,企业服务不仅要产品好用、有价值,还得有技术壁垒。「甲骨文作为传统的企业服务公司,仍然有这样的收入、这样的估值。我认为AI的天花板不会比这个低。」按照他的设想,像甲骨文有个数据库体系一样,第四范式未来将有个AI体系。
这个体系不是「烟囱式」的创新,按垂直行业划分,从头做到尾,提供端到端的解决方案。而是不同要素像积木一样叠加,成为通用的平台。
02
「先知」的进化
第四范式所有产品线围绕一个名为「第四范式先知」(以下简称「先知」)的平台。
「先知」的设计,来源于学习圈理论。学习圈是大卫·库伯总结了前人经验之后提出的经验学习模型,包括具体经验、反思性观察、抽象概念化、主动实践四个环节,体现了学习的完整流程。
▲学习圈理论
以「先知」平台上的反欺诈为例,如何训练机器自动识别一笔交易是正常交易,而不是盗刷信用卡呢?
首先输入很多历史交易数据,这些交易行为会有反馈,盗刷会有电话投诉,没有被投诉的交易可以判断是正常的。这些反馈交给机器学习做反思,反思不是剖开机器大脑做神经元连接,而是运用AutoML技术,把行为数据和反馈数据导入机器,反思出一个模型,自动产生理论总结,知道什么情况是正常交易,什么情况是欺诈。最后,把这个模型做成线上系统。新的交易数据过来,机器就会判断它是否是欺诈。
这就是完整的学习圈过程,其中,反欺诈可以替换成医疗、金融、政府、能源等各行业的应用。
类似纺织业从手工缝制变成了工厂流水线生产,AI的落地演进也会走上社会化分工再提炼的必由之路。
第四范式联合创始人兼产品负责人胡时伟打了个比方,现在一些公司给客户提供AI解决方案,相当于裁缝上门给客户量衣服。在某个行业落地相当于预先做好一些版型,批量生产。
而第四范式想做的,是打造制衣厂生产线,多个版型的衣服都能在这条生产线上生产。
要实现这个目标,第四范式花费了三年时间来摸索路径,让「先知」升级换代。
机器学习的核心是模型具备判断能力,建模技术门槛比较高,一般都由AI专家来做,「先知」1.0就是取代AI专家的建模工具。
在企业落地的时候,第四范式发现只是建模还不够,数据的来源、生成的模型如何上线都需要解决。于是,「先知」2.0向前向后各增加一环节,前接数据进来,后可生成服务。
从「先知」1.0到2.0,从建模工具到全流程开发平台,由于没有对功能抽象提炼,导致后来出现问题:作为一个工具,每个部分都要单独做,项目太多了。
AI在一家企业里的应用,应该是一片森林,而不只是一棵树。那么如何批量植树造林?
到了「先知」3.0,第四范式提出核心系统的概念,把数据和应用之间的关系都连接在这个核心系统上,从获客到营销,从风控到留存,从安全到员工体验,到上下游的供应链等各个环节,全部都用一套系统。
「1.0相当于我们造了一个发动机,结果发现发动机开不了,自己还得手动组装车,2.0相当于我们弄了一个生产车的手工作坊,一辆一辆地造车,3.0相当于弄了一套生产线,可以生产各种不同型号的车,是一个再扩展的过程。」胡时伟对新经济100人说。
「先知」3.0另一个重要改变是,把开发和运行区隔开了。AI企业做企业服务业务,通常派人去客户现场做,大家对于AI外包的业务形态有过不少激烈的争执。
「软件知识产权的开发和运行没有分开,缺少一套方法论和语言去定义,什么叫AI应用。比如手机上的App,下载就可以使用。但是AI现在还做不到下载一个营销应用就可以直接使用。先知3.0就是要定义一种可下载使用的AI应用,实现行业内的复制。」胡时伟说。
同时,第四范式提供开发工具,让合作伙伴在各自行业内开发应用。应用开发出来后,通过相关载体,企业拿去安装即可,不需要派人到每家企业部署实施。
这种方式成为第四范式商业化的重点。
没有甲骨文之前,企业想用数据库,就需要自己开发。甲骨文首先推出了商用SQL(结构化查询语言),后来,大家都做SQL语句,语句最后形成了应用。第四范式认为AI应用的发展,也将类似。
那么,一个AI应用应该是怎样的?
「我们利用学习圈理论,通过数据的采集、标注、机器学习和模型上线四个部分,定义一个AI应用。最早企业做信息化都是外包,没有SAP,没有eHR,这些软件后来才出现。各行各业定义出AI应用后,推而广之,就可以解决现在做AI就是外包的问题。」胡时伟说。
做toB业务,难免会遇到客户提出各种需求。在AI应用早期,客户的理解经常会有偏差,有时候客户提出来的需求需要转化。
第四范式团队经常遇到这种情况:客户说要A,第四范式说你要的是B。客户马上说,对对对,我要的是B。
举例来说,客户对第四范式提过一个需求,能不能把公司数仓数据导入进来,用数仓数据来建模。实际上,数仓数据是为BI设计的,用BI里的数据做AI,基本都惨不忍睹。因为BI是报表数据,是给人看的,AI的数据是给机器看的。
于是,第四范式给客户分析投入产出比,用数仓数据不如直接从生产系统上重新采集数据。从生产线拿过来的原始数据,不需要预处理,最适合机器学习。BI的数据经过复杂的聚合,信息量丢失了,机器反而训练不好。
对企业来说,解决方案的方法论和交互越简单越好。第四范式的工程和算法团队很大一部分精力,是为了减少客户的操作步骤,为了让模型更普适,让应用更广泛。
当前,第四范式产品按照学习圈理论,构建数据、算法和生产三大核心,给企业客户提供包括行为数据、反馈数据、模型训练和模型应用在内的全流程应用。客户点击进去进行简单操作,就可以得到想要的应用服务。
▲第四范式先知界面图
AI能够发挥作用的关键是数据。企业接入「先知」平台之前,如果没有数据积累,往往有一个收集数据的过程。
「我们认为一千万条以上的数据很大概率能达到比人好的效果,一千万条数据意味着机器可以写一千万条规则。人最多可能写几十到几百条,如果机器写的规则数比人写的规则数多几个量级时,就能达到一个比较好的效果。」第四范式首席研究科学家陈雨强说。
按照戴文渊的设想,「先知」平台的发展,将从数据输入变为业务输入。只需要把企业的业务目标告诉机器,机器就可以从企业数据仓库中创造出业务价值。
其产品设计的逻辑在于,内部越做越复杂,对外越来越简单。
03
从竞争走向合作
2015年初,第四范式公司刚成立,戴文渊就想着做银行。周围的人觉得他异想天开,银行不可能和一家刚成立的小公司合作。
戴文渊直接与招商银行营销部的一位负责人沟通,介绍互联网公司的营销方式,他在百度时是如何做营销的。当时,百度采用了机器学习的方式,带来效益8倍的提升。
戴文渊问对方,招行模型如何制定,得到的回答是有专家在写营销规则,两百多条。
戴文渊说,你知道百度有多少条吗?一千亿条。通过机器,我现在能给你做到一千万条。
银行需要在持卡群体里找到有分期需求的客户,通过打电话、发短信或者微信推送的方式进行营销。银行的营销渠道资源容量有限,只能从数千万持卡人中挑出一小部分意愿比较强、有较大分期需求的客户,做出投入产出比更高的选择。
机器学习可以从几千万人里精准找到这类客户,优先拨打他们的电话。同样打十万个电话,有多少客户响应了电话营销,这个响应率或者营销成功率是最终判断机器学习模型是否有效的核心业务指标之一。
后来,第四范式为招行信用卡中心做了五千万条营销规则,上线以后收入提升60%。
有了招商银行作为标杆案例,第四范式陆续拿下了国内几家大型信用卡中心,为它们提供精准营销服务。
之后,第四范式不断扩张业务,从精准营销扩散到反欺诈、定价等银行业务的各个环节,再从银行扩展到能源、政府、医疗、零售等各个行业,如今客户近2000家。
企业服务依赖公司交付团队的规模,第四范式试图通过合作伙伴模式打破限制。
「交付团队的规模决定我们业务成长的速度,我们需要一个生态圈帮助我们更快速、更大范围地落地。靠自身能力扩张市场,边界总是有的,合作伙伴帮我们弥补了自身能力覆盖不到的边界外部分。」 第四范式咨询合伙人柴亦飞说。
选择合作伙伴这种模式,也是为了在各行业快速落地的变通。
对创业公司来说,风卷残云般「洗劫」某个行业,并不现实。原有供应商在行业内盘根错节,拥有自己的一方地盘,对于横插一杠子的新竞争者,他们会制造各种各样的障碍。
所以,第四范式从竞争转向合作。「做商业共赢,让所有公司都觉得跟你合作有饭吃。要帮到别人,不要说比别人强。就算我真的没办法帮到你,那我跟你也是两个不同的东西,咱俩没竞争关系。」戴文渊如此划分阵营。
现在第四范式的不少合作伙伴都曾经与其有过竞争。例如,现在有一合作伙伴,曾跟他们竞争过广发银行的标。广发银行的需求是反欺诈加平台,合作伙伴做的是反欺诈,第四范式是平台,最终第四范式中了标。
后来第四范式拉上对方,形成联合体,在第四范式平台上开发反欺诈应用,共同完成之后的大单。
这好比掘金热时候,挖金子的人无数,卖水的商人大赚了一笔。戴文渊想让第四范式做掘金人背后的卖水人。
但是在卖水之前,第四范式也掘金,以此来告诉其他人,掘金是赚钱的。在通过合作伙伴渗透行业之前,第四范式自己也会做行业标杆案例,推动平台在行业落地。
对手依然存在,戴文渊也有自己的竞争思路,那就是拿下行业所有标杆。
「我们在拿下第一个标杆招行以后,第一件事情不是去扩大收入,而是看行业内还有什么其他的标杆,比如工商银行、建设银行、中国银行、民生银行、中信银行等。」戴文渊说。
戴文渊带着黑色框镜,穿着黑色衬衫,透着一股理工科生的气质。他曾是百度最年轻的高级科学家。和新经济100人交流当天,因为嗓子不舒适连喝了三四瓶水。他努力说话,声音不大,有些沙哑。
2005年,还在上海交通大学读书的戴文渊,和两位搭档一起夺取了ACM大学生程序设计竞赛世界冠军。这项赛事由美国计算机协会(ACM)主办,经过四十多年发展,已经成为全球最具影响力的大学生程序设计竞赛。
捧回冠军的戴文渊来不及高兴,他发现,热门的计算机图像学已经被同学选完,人工智能是剩下的为数不多方向之一。他因此结缘香港科技大学计算机系主任杨强——华人界首位AAAI Fellow、唯一执委,IJCAI理事会主席。2015年,戴文渊创业,杨强担任第四范式首席科学家。
在大三参加ACM比赛之前,戴文渊成绩一直不太稳定,每每到了关键比赛就发挥不出应有水平。
后来他调整自己的心态,控制自己的情绪,不去想那些对结果没有帮助的事情,让自己达到最佳状态。
「你经历过最残酷的竞争,你越是想得到,你越得不到。最高水平的竞争,大家差距是非常微小的,胜负只在一念之间。」
他发现,比赛最重要的事情不是把自己发挥到极致,而是把团队发挥到极致。以前他们团队三个人比赛,每个人都把自己那部分做到最好,戴文渊尝试自己做得弱一点为代价,让队友做得更好。结果,团队强大了很多,也如愿收获了世界冠军。
由此,戴文渊学会了变通。如果方向清晰,那就一直往那个方向走,用什么方法都行,不是非要用某个方法才行。
一如第四范式的商业逻辑,无论是自己做,还是经由合作伙伴,只要能够进入到企业客户,哪一条路都行。
世界级竞赛残酷,创业更是。
相关文章
- 商汤科技董事长徐立:强化创新,以人工智能助力高质量发展
- 携手出海,浩鲸科技参加2024·人工智能+未来产业发展大会
- 云从科技出席昇思人工智能框架峰会 发布原生大模型成果
- 人工智能浪潮下赋能虚拟人热度攀升,Meta/微美全息集聚技术创新激发产业发展活力
- 双桅扬帆:钛动科技亮相两场重磅AI大会,与MiniMax、智源人工智能研究院、阿里巴巴等共话数字未来
- OpenAI宣布向所有用户开放ChatGPT人工智能搜索功能
- 传音旗下人工智能项目荣获2024年“上海产学研合作优秀项目奖”一等奖
- 金智塔科技联合浙大人工智能研究所发布全新“智信”可信行业数据空间,共促数字金融创新发展!
- 声网 Conversational AI Agents 荣获 2024 人工智能年度杰出解决方案
- 2024·人工智能+未来产业发展大会在广州召开
- 亚马逊Prime Video推出了AI Topics功能,利用人工智能来推荐内容
- 赋能应用体验“智”变,火山引擎智能美化特效等人工智能类SDK适配原生鸿蒙
- 海泰方圆荣获全球弗雷德人工智能应用能力认证(GFC-AIAS)
- 苏州全球人工智能产品博览会开幕,清睿数学GPT老师闪亮登场
- 谷歌DeepMind发布Gemini 2.0人工智能模型
- Yokee无人驾驶观光车亮相 2024全球人工智能产品应用博览会-苏州