汇量科技集团副总裁朱亚东:数据智能驱动用户增长
2019-06-13 16:01:04爱云资讯阅读量:453
以下是汇量科技集团副总裁朱亚东发表题为“数据智能驱动用户增长”的演讲实录。
汇量科技集团副总裁 朱亚东
今天我们不断提人工智能,人工智能是怎么产生的呢?首先我们会做一个简要回顾。最早人工智能这个概念很早提出来了,大概是在1956年达特茅斯会议我们提出这样的概念,正式提出这个概念之后,我们会有一系列算法的创新,包括感知的算法,在这之后,我们进入低谷,我们发现很多大的任务,复杂的任务是没法解决和计算的。
在这之后,整个人工智能方向发展进入一个偏差,我们基于专家系统,基于一定规则做预测。这之后,我们有一个标志性的就是反向传播的算法,这个算是今天神经网络的奠基性算法,这之后,人工智能发展又进入低谷,这个过程是因为什么?有它的历史原因,包括我们的数据不够多,包括我们当时的芯片,以及通用计算力,都不太足够。
其实最后到2006年,最终提出了多神经网络,深度学习,完整的解决算法中无法收敛这一系列问题。回顾60多年发展过程当中,一直伴随三个因素,就是前面吴总提到就会有数据、平台和算法。
做这样一个回顾以后,我们可以给人工智能简短的定义,我们认为它是数据+平台+算法。为什么这么说?首先今天大量事实产生的数据,已经成为人工智能产生的基础,我们今天会说,尤其是在今天5G移动互联网的时代,我们有大量实时产生的数据,这一切都是产生我们人工智能的基础,有这些数据,怎么算怎么处理,对我们平台提出更高的要求,我们现在有GPU还有定制芯片的发展,我们云上的处理平台,大家都能很好的做数据处理。最后算法这个元素,我们单独拿出来,机器学习的算法,是整个人工智能最终落地的引擎。最近的深度学习和强化学习,进一步促使我们人工智能和商业去做进一步的落地。
通过这样的回顾,我们看到,今天基于一个AI+大数据大脑赋能,包括传统的电子商务、金融科技、互联网教育,移动信息分发,已经渗透到各行各业,在这样一个赋能趋势之下,我们有什么,我们是一个具有一个技术中台,类似于大脑的角色,在这样的技术中台底下,它必须有一个核心的元素,比如说我们的数据平台,计算平台,以及一些机器学习的平台。这个里面展示了几个名字,我们数据平台,大数据计算中台、大规模机器学习中台,只是我们汇量科技研发的核心组件。
今天这样一个趋势情况下,我大概罗列一下现在的趋势。阿里收购了一个专注于Apache Flink的公司,我们对外提供收费的机器学习服务Amazon AWS推广收费机器学习平台云服务。包括最近这个周期,SaleForce花了157亿美金收购数据分析公司Tableau。他们做大量的调整,与此同时在外部做平台化的收割,对自己的产业赋能。这个图片是AmazonCTO的一个架构,在这样的情况下,我们看到AI+大数据,对各行各业赋能是一个必然趋势。怎么赋能?其实大家都知道我们要赋能,怎么去赋能?我们需要把人工智能擅长的地方,跟我们商业有价值的地方去做结合,但与此同时,他也说到第二点,我们怎么去结合?AI是系统性的工程,不是泛泛而言,怎么是系统工程?就回到拆解60多年的历史回顾,伴随着数据、平台、算法三个核心元素。
回到今天,汇量科技,专注于海外营销,用户增长,这样一个垂直领域,我们怎么去做这样一个赋能,首先我们也是看,我们今天这样一个AI+大数据的架构是怎样的?Datatory是我们发布的产品,现在全球日活设备数950M,用户来自200多个国家,包括兴趣标签,行为标签,国内头条公司都会用我们的数据,我们Datatory这样的产品,会做可视化的数据分析,我们可以跟我们运营和产品同学提供一个我们在最近一段时间用户的兴趣分布,人口属性的分布。
第二个,我们看一下我们有这么多数据,比如说百亿的数据或者十亿的DAU怎么去计算,我们也做了自己定制了通用的计算平台,这个平台有几个特点,我们是出海用户,我们也是重度的云端用户,这个用户在我们基础上做了一些分装,首先EnginePlus可以做粉状,我们做统一的调度,我们可以依据当前做一个智能最优的调度,在这之上,我们也可以支持混合云的存储,无论你的数据存在S3,还是阿里云OSS,本地云SS我们提供统一分装接口,对用户是透明的,我们进一步提供多泛式计算架构。我们都是可以进行大规模有效实时处理。在这之上,可以支持我们各种数据挖掘分析的应用。
接下来第三个AI+大数据的组件,去年年底发布的MindAlpha平台,可以进行秒级实时学习,大家有很多疑问,今天有很多互联网,已经有很多机器学习平台,面对我们今天工业级,这是我们汇量科技为什么做这样一个平台,这样一个平台有一个特点,它是一站式的,大家通过这个图片可以看到,我们从原始数据流接入到分布式超大分布式模型训练,到线上模型加载,这个加载包括实时预测,到最后的模型实时学习,形成完整的闭环。这里面有很大的挑战,比如说我们这样一个百亿如何在10毫秒级做呢?这样都是做定制化的机器学习平台。
有了这样一个,我们会让自己的AI+大数据的架构以后,接着我们会去做属于我们自己领域用户增长,怎么做增长呢?首先基于这样一个技术中台,由我们的Datatory、MindAlpha,我们比如说它希望玩一个轻度游戏,和高付费人群,首先我们会基于这样的技术中台,给出人群的预估,我们会圈出一部分人群,这部分人群符合某种标签属性,以及高付费的倾向,在这之上,我们可以进一步进入我们程序化广告平台,做进一步人群扩展,我们通过用户行为相似,把目标和种子人群做进一步的扩散。如果我们开发者有多个产品矩阵推广,我们进行千人千面投放,最终实现了用户增长的闭环链路,在这个当中,无论数据统计平台,程序化广告平台,我们逐渐地数据反馈,都能很好的沉淀在我们技术中台上。通过这样一个用户增长飞轮,今天汇量科技服务了600多家企业出海。
第二个应用场景,就是前面程序化平台提到的千人千面的智能投放,这个词最早是在阿里在收条提出来的,今天在出海营销用户增长同样适合。今天这样的移动互联网迸发的时代,我们对于每个用户,对于当前的时刻,我们一定要给出他最适合的信息需求,同时以他最喜欢的创意形式做广告展现,依据我们AI+大数据架构,我们要看它的实时兴趣,通过机器学习平台,百亿级的深度模型做预测,最终通过用户行为反馈,可以进一步闭关调整长期兴趣以及深度网络模型,通过这样的模型,我们通过AI+大数据架构,对千人千面体系做很好的赋能。
最后讲一下,关于我们公司,今天汇量科技,大家比较陌生,我们已经有800名员工,超过50%都是技术研发,其实包括算法团队,很多都是博士,以及来自于Google和BAT的公司,去年在年底港股上市,我们客户分布60多个国家,包括中国的广州、北京、香港以及美国,在欧洲和阿姆斯特丹都有办公室。
这是我们服务应用开发者部分开发者,目前有两万家开发者,做全世界范围的营销,从横向维度,我们这个品类涉及到游戏、电商、出行、资讯,包括我们社交的工具。纵向维度,无论是中国、亚太、美国、欧洲,都会有我们客户。这里有不同的特点。今天中国的应用开发者,更多会去出海,亚太到欧美到本地,又从欧美进中国,对于汇量科技来说,对于所有开发者来说,提供这样一个对世界维度的服务。谢谢大家!