打破次元壁,建立深度情感联系,AI最终将成为虚拟偶像的“灵魂”?
2018-11-11 10:26:26爱云资讯阅读量:655
在第五届世界互联网大会开幕上,搜狗联合新华社发布了以主持人邱浩为原型的“AI合成主播”。展示视频中,“主播”标准流畅的播报方式、微妙的肌肉牵引与精确的嘴唇张合,几乎让人难辨真假。
搜狗随后揭示了背后的技术原理:声音合成、表情合成、唇形合成,并结合语音、图像等多模态信息进行联合建模训练后,生成与真人无异的AI分身模型。这两个顶尖科技术语的结合为新闻主播事业带来的新形式,给媒体带来的惊喜同时也带来了焦虑:“AI合成主播的推出,会不会让很多人失业?”
其实,在AI合成主播出现之前,“虚拟主播”这个词,早已火遍二次元圈了。
“虚拟主播”席卷二次元圈,与AI技术结合仍为市场盲点
2016年,一个亚麻色长发、绑着粉色蝴蝶结发带、穿着白色裙子的二次元少女形象出现在Youtube上。在首发的自我介绍视频中,她称自己是一位“虚拟的Youtuber”。就这样,全球第一位虚拟主播——“绊爱”(Kizuna AI)诞生了。
这个账号名称为“A.I.Channel”的频道,目前粉丝数已超180万,单个作品最高播放量突破320万。而那支视频,则被很多网友称为“梦开始的地方”。
绊爱之后,Youtube上的虚拟主播开始激增,根据“三文娱”6月统计的数字,2018 年 2月,Youtube上虚拟主播频道数量还只有 500 个,仅 3 个月就增加到了 3000 个。观众人数上,2017 年 12 月 VTuber Top 50 频道订阅人数为 162 万人,2018 年 6 月这一数字增长 5 倍达到 825 万人。
数据来源:三文娱
绊爱其实与普通的Youtuber一模一样,上传唱歌、脱口秀等视频,也会直播打游戏与粉丝实时互动,粉丝送爱称“人工智障”。她的背后是一整支团队在运作,用演员的表情捕捉,以及声优同步配音塑造出一个鲜活的二次元少女形象,再由专业人事在平台上运营。
随后,国内的虚拟主播也开始陆陆续续出现。B站上的“虚拟次元计划”账号发布国内首个虚拟UP主形象——小希;随后抖音也推出了“宇宙高智慧少女”MOMO酱;不久前刚获1.2亿融资的“克拉克拉”也即将推出二次元虚拟直播功能。
随着技术的成熟,现在不少“虚拟主播”已经可以完全映射真人演员:通过完善的肢体动作、面部表情捕捉设备与精致的3D建模进行实时输出。而AR与全息投影技术则让观众与“虚拟主播”之间的距离更近了一步。
但实际上,目前还并没有虚拟主播引入AI技术,也就是说虚拟主播本身不具备真正的学习、互动与感知能力。“AI主播”只是绊爱、小希们扮演的人设,与真正的人工智能还相去甚远。
目前国内能够称之为AI虚拟形象的其实很少,微软亚洲研究院设计的微软小冰算一个。人工智能与深度学习技术让微软小冰可以理解对话的语境与语义,实现超越简单人机问答的交互,甚至已经可以作词演唱,但微软小冰到目前为止还并没有动态的人物形象出现。
与此同时,小米也在为AI虚拟形象的输出作着努力。你或许没有注意到,小米于2017年首发的人工智能音箱“小爱同学”,已经从缩小版的小米空气净化器到有了初版的人物形象。不过,以智能家庭生态链为重点的小米,未来是否会让小爱同学进军泛娱乐圈还存在着争议。
若要说真正将“宅男乐趣”发扬光大,则不得不提到位于深圳的Gowild狗尾草公司。2016年,狗尾草发布了虚拟偶像“琥珀”与全息投影智能音箱“HoloEra琥珀虚颜”,这其实是一条并行战略。“琥珀”采取虚拟偶像运作模式:签约羽泉工作室、发布单曲、担任主播、开演唱会、举行线下生日会……与初音和洛天依一样,参与偶像养生粉丝生态。
而智能音箱“HoloEra琥珀虚颜”则作为一款家庭产品,能通过声音和画面与人进行交互,达到与人建立情感联系。实际上,日本一家叫Vinclu的公司2015年推出过一款Gatebox产品“逢妻光”,定位为“全息AI女友”,在日本颇受欢迎。这不禁让人想起《银翼杀手2049》里那位全息AI女友Joi,除了没有切实的肉体,精确的算法让她变成为每个人量身定制的商品。
狗尾草公司产品“HoloEra琥珀虚颜”
如果说,“初音未来”代表“虚拟形象1.0”时代,那么AI合成主播已进入“虚拟形象3.0”时代。
取代真人为时尚早,“AI+虚拟形象”有待在个行业突破
目前国内AI+虚拟形象的案例较少的原因,大致可以从以下几个方面来解释:
第一,技术方面门槛颇高。AI研发前期需要投入巨大的成本,其次技术需要能够快速找到落地的场景、行业。小爱同学能够推出市场,正是基于它作为小米智能家居生态链中的一部分,如果单单只是作为一款音箱产品出售,那足够高的研发成本不适合公司的长尾运营。
第二,虚拟形象的重要发源地——二次元文化,仍未跳出小众文化圈,饭圈生态也不够成熟。国内为二次元文化不如日本深厚,二次元爱好者大量集中于特定的年龄阶段,虚拟偶像仍只是小范围圈层的自嗨。另外,一个形象变成一个“偶像”需要长线规划,那么AI+虚拟形象就不具备快速变现的能力。
第三,如有捷径可走,没必要用AI。比如洛天依,她由YAMAHA集团发行的歌声合成器技术以及应用程序VOCALOID的软件制作而成,依靠粉丝不断再创作赋能,即所谓的“养成”,已经在虚拟偶像领域取得了一定的成功。也就是说,目前所拥有的技术,已足够打破许多场景,如网剧、网综、社区等。
AI+虚拟形象,必然有需要它存在的场景。搜狗从需要主持人出镜的新闻播报事业着手,推出AI合成主播,既可以缓解这个行业“不容出错”带来的压力,又可以大幅度提高工作效率。此外,搜狗CEO王小川在接受媒体采访时,谈到该技术未来的运用场景,也认为该技术可以深入到“主播、翻译、个人助理”等领域。
而对于导语中,媒体的疑问:“AI合成主播的推出,会不会让很多人失业?”,王小川则认为目前以目前的技术来说,还不至于可以实现。“AI合成主播和人类的关系是取代还是配合这个问题,如果只是感知问题,不涉及到后面的语言组织、撰写深度稿件的话,它是可以去跟真人接近的。”
AI+虚拟形象在垂直领域的应用,市场仍然需要抱着期望的态度。毕竟小时候大家都曾幻想过,《空中大灌篮》的场景会发生在自己身上。