专访新译科技CEO田亮:把翻译文本做到更好 构建共赢语言生态系统
2018-07-24 18:54:49爱云资讯阅读量:923
“Qingdao"和"Tsingtao"哪个才是青岛真正的英文名?6月9日-10日,上合组织青岛峰会将举行,“青岛”英文译名在网络引热议。每逢国际盛会,机器翻译服务必不可少。怎么样让机器翻译更快速、准确,新译科技CEO田亮一直在追求把文本做到极致。
2018年5月的一天,田亮刚从深圳出差回来,上午见完客户,连水都没来得及喝上一口,在约定时间和记者见面。
就在上个月,他们又完成了新一轮融资。
新译科技CEO 田亮
对机器翻译,百度百科这样描述:机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
新译科技正是一家利用人工智能和大数据技术提供互联网以及移动互联网服务与应用的科技公司,拥有智能翻译、辅助翻译、语言检索、语音识别、图像识别、问答系统六大技术,成立于2014年,在2016年10月完成天使轮融资,2017年再次获得Pre-A轮融资。
记者在田亮办公室体验了新译科技的机翻产品“新译翻译”、“智译”和“新译同传”,并展示了即将上线的限定性神经网络机器翻译系统和译前译后编辑平台。从功能看,可以指定关键词译文,实时翻译个性化风格结果,这款产品已经能够满足用户需求。但田亮认为,只有把文本做完美,才能获得更大的市场。
事实上,在机器翻译领域,有很多难点,比如译文调序、准确翻译术语、时间、专有名词、数字等等。
基于神经网络的机器翻译天然不可克服的缺点是“黑盒子过程”,“无法知道为什么经过训练后,翻译出来是这样的结果,原因无法探求。我只知道原文输进去译文就出来了,输入和输出有个关系,至于为什么翻译成这样,谜底不可知。”“能够干预神经网络是最大的难题,如果干预不了,术语翻译问题就很难。我们联合卡耐基梅陇和澳门大学实验室的专家和博士生们,花很多时间去解决,好在两周前刚解决完。”——用限定性神经网络干预神经网络底层,并实时增量达到快速训练的目的。同时七月中旬前,打通辅助翻译和机器翻译模块,让非计算机专业人士可以持续性提高机器翻译质量,是团队的研究成果。“我们用了6个多月的时间来解决这个问题。”
把文本做到极致
从技术的角度,人工智能分为三类:语音、图像和文本。其中文本是最难的,“文本有两个典型的应用就是搜索引擎和机器翻译,我们对搜索引擎的容忍度很高,比如用一个关键词或者一句话进行搜索,就会得到一系列结果,用户只需要根据结果判断即可。但给机器翻译输入一句话,如果翻译的不正确,用户尤其是专业译员可能就弃用了,对机器翻译的容忍很低。”正因如此,田亮觉得把文本做好是机器翻译的核心所在。
“把翻译文本做到极致也要分阶段,每个阶段目标不同。前一段目标是要尽可能的调整语序,让翻译文本读起来很流畅;接着解决术语翻译,我们要解决人名、地名和一些关键的术语,解决数字、日期等翻译正确,尽可能提高机器翻译的准确性。”第三阶段,解决翻译上下文的指代关系。“最难攻克的难关是语义层面,如何让计算机理解语义,都需要去研究和突破。”
“我们的核心竞争力就是文本。”田亮对企业的定位十分明确,“我们就要在文本领域,集中精力把机器翻译做好,继而把机译衍生品做到极致。”他们下一步追求的目标是让机器翻译能够理解上下文的指代。”
新译科技致力于打造“沟通无障碍的城市”。“我们想建的无障碍城市就是,用我们的机器翻译,帮助人们在其它城市克服语言障碍。让他从下飞机,到乘坐出租车,到入住酒店,在城市里的吃喝玩乐实现沟通顺畅。”田亮非常期待5G时代的到来,“一旦网络有所突破,机器翻译将更加快速、顺畅。”
共赢才能长久
从澳门大学自然语言处理专业毕业的田亮,对如何建立共赢的语言系统有自己的理解。“一是我们内部共赢。从产品层面,打通机器翻译、辅助翻译和语言自成,形成闭环的小生态;从外部看,我们的产品服务满足不同类型用户的需求,让服务方活起来。”田亮的理念是,“我们不仅要自己赚钱,更要时刻想着帮客户赚钱,不共赢会陷入一些其他创业公司的尴尬境地,我们一定是以帮助对方赚钱为前提,只有共赢才能长久。”
下一步,新译科技还要在打造企业文化下一番功夫。田亮认为,团队在一百人左右的规模时,可能喊一嗓子大家都能收到,下一阶段组建300多人团队时,企业文化的建设必不可少,“这是做企业最基本的发展之道”。
“一个人相信什么,他未来的人生就会靠近什么。你相信什么,才能看见什么。你看见什么,才能拥抱什么。你拥抱什么,才能成为什么。”我们多少能从创始人2018年开年一封内部信的这句话中,看到一个走在机器翻译前沿,却时刻保持“冷静和清醒”的人工智能公司。
推荐阅读:
“数智”谁与争锋?海归大咖成都“论剑”!
中国工程院院士李德毅:我不太相信机器人会把人类打翻