讯飞翻译机机器翻译系统挑战六级翻译 成绩优秀
2018-12-20 15:51:20爱云资讯阅读量:866
今年的六级考试有位特殊的考生, 极短的时间内就将六级翻译测试题全部解答完毕,来自上海交通大学外语学院两位专家现场评分--优秀。六级考试每次通过率只有30%左右,这位特殊的考生正是讯飞翻译机2.0搭载的科大讯飞机器翻译系统。
特殊的六级考生,优秀的成绩
回到今年的考试现场,12月18日下午,合肥师范学院一间特殊的考场内,考官分别打开三道考题,由人工将考题输入电脑,随后科大讯飞的机器翻译系统进行作答,每道题不到2秒便作答完毕。
最终科大讯飞机器翻译系统拿下13分的优秀成绩。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。
面向不同领域的讯飞神经机器翻译系统
机器翻译系统何以在大学英语翻译权威评测中获得好成绩?
“一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已更新有三代技术、取得了长足的进步。
“最新一代技术是基于端到端的神经机器翻译。” 神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。
大规模平行语料的积累则是基础。目前对于汉语和英语等大语种,业界积累的类似汉语和英语对齐的翻译句对已经达到千万甚至数亿级别,这成为机器翻译学习的语料。
面对数亿级的模型参数和训练数据,以图形处理器为代表的高性能计算硬件的提出和发展,也必不可少。
“六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。”科大讯飞为了破解这一难题,对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。
其中一项技术是领域个性化。“传统翻译模型一般针对具体应用场景搜集该领域相关语料,但在实际应用中,由于‘精力不够’会导致其他领域的翻译效果受影响。”这就好比学习中的“偏科”,从而影响了总分。为此,科大讯飞研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,“可最大程度实现目标领域和其他领域翻译性能的兼顾。”
方案内的另一项技术是术语词典拼接融合。“翻译中常会遇到行业术语,有的机器可能没有见过、有的见过却在不同行业有不同翻译方式。”科大讯飞给出的解决方案是:提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。
基于上述领域翻译技术,科大讯飞推出了面向行业的翻译解决方案。
更多机器翻译的实用场景也正在到来——
在某跨国医疗技术峰会现场,你可以拿出最新升级的讯飞翻译机2.0,和与会外宾专家畅聊。
环保论坛会前,你也不必忙着为听见智能会议系统定制领域术语,或者在会上为翻译效果提心吊胆;有了最新的机器翻译技术,不仅领域和行业术语定制的又准又好,整体的翻译效果也不会打折扣。
即便你是职场新人,当上司给你布置了厚厚一叠出口产品说明书的翻译时,你也不必挑灯夜战了。因为最新的机器翻译技术可以辅助笔译,“可让机器先翻译一遍、人工再精修。”
人类VS人工智能:用人工智能建设美好世界
值得说明的是,尽管机器翻译技术已取得大幅进步,但由于语言本身的复杂性,机器翻译还有很长的路要走。对翻译技术的研究是为了更好地辅助人类进行语言沟通,帮助普通人达到一定的外语水平;但也需要人工来帮助机器完成无法处理的问题、更好的解决自身局限。
技术的发展并不是要取代人工,而是要让人站在人工智能的肩膀上去做更有意义的事。科大讯飞相信:未来比人类更强大的不是A.I.,而是掌控了A.I.的人类。机器翻译技术的发展,也正在是实现着用人工智能建设美好世界的愿景。
回到今年的考试现场,12月18日下午,合肥师范学院一间特殊的考场内,考官分别打开三道考题,由人工将考题输入电脑,随后科大讯飞的机器翻译系统进行作答,每道题不到2秒便作答完毕。
最终科大讯飞机器翻译系统拿下13分的优秀成绩。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。
机器翻译系统何以在大学英语翻译权威评测中获得好成绩?
“一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已更新有三代技术、取得了长足的进步。
“最新一代技术是基于端到端的神经机器翻译。” 神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。
大规模平行语料的积累则是基础。目前对于汉语和英语等大语种,业界积累的类似汉语和英语对齐的翻译句对已经达到千万甚至数亿级别,这成为机器翻译学习的语料。
面对数亿级的模型参数和训练数据,以图形处理器为代表的高性能计算硬件的提出和发展,也必不可少。
“六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。”科大讯飞为了破解这一难题,对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。
其中一项技术是领域个性化。“传统翻译模型一般针对具体应用场景搜集该领域相关语料,但在实际应用中,由于‘精力不够’会导致其他领域的翻译效果受影响。”这就好比学习中的“偏科”,从而影响了总分。为此,科大讯飞研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,“可最大程度实现目标领域和其他领域翻译性能的兼顾。”
方案内的另一项技术是术语词典拼接融合。“翻译中常会遇到行业术语,有的机器可能没有见过、有的见过却在不同行业有不同翻译方式。”科大讯飞给出的解决方案是:提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。
基于上述领域翻译技术,科大讯飞推出了面向行业的翻译解决方案。
专业领域的应用:“行业A.I.翻译官”
今年12月,讯飞翻译机重点推出A.I.行业翻译功能,在通用翻译模式下新增行业翻译模式,金融,在医疗、计算机三大领域行业专业场景下都可以实现中文与英文的即时互译。更多机器翻译的实用场景也正在到来——
在某跨国医疗技术峰会现场,你可以拿出最新升级的讯飞翻译机2.0,和与会外宾专家畅聊。
环保论坛会前,你也不必忙着为听见智能会议系统定制领域术语,或者在会上为翻译效果提心吊胆;有了最新的机器翻译技术,不仅领域和行业术语定制的又准又好,整体的翻译效果也不会打折扣。
即便你是职场新人,当上司给你布置了厚厚一叠出口产品说明书的翻译时,你也不必挑灯夜战了。因为最新的机器翻译技术可以辅助笔译,“可让机器先翻译一遍、人工再精修。”
值得说明的是,尽管机器翻译技术已取得大幅进步,但由于语言本身的复杂性,机器翻译还有很长的路要走。对翻译技术的研究是为了更好地辅助人类进行语言沟通,帮助普通人达到一定的外语水平;但也需要人工来帮助机器完成无法处理的问题、更好的解决自身局限。
技术的发展并不是要取代人工,而是要让人站在人工智能的肩膀上去做更有意义的事。科大讯飞相信:未来比人类更强大的不是A.I.,而是掌控了A.I.的人类。机器翻译技术的发展,也正在是实现着用人工智能建设美好世界的愿景。
相关文章
- 搭载自研星火大模型,讯飞翻译机4.0星火版全面升级翻译体验
- 讯飞智作首发超拟人数字人,一张照片可快速创建你的专属数字人
- 以AI赋能全球语言科技普惠,讯飞翻译机4.0星火版正式上市
- 四川大学华西医院联合讯飞医疗发布“华西黉医”医学大模型
- 重新弄定义多模AIUI标准,科大讯飞首发语音视觉虚拟人交互“三合一”
- 讯飞星火深度赋能科研,加速AI for Science成为科技变革新引擎
- 科大讯飞出席2024年度AFC专委会高峰论坛
- 讯飞输入法14周年:每个人的AI输入 亿万用户乐享表达
- 科大讯飞AI黑板上新,星火智慧黑板2.0更公平、更高效、更智慧、更安全
- 科大讯飞引领大模型规模化应用,200余项技术成果亮相1024科博展
- 超拟人数字人重磅发布,讯飞智作引流数字人新纪元
- 讯飞输入法14.0 打造每个人的AI输入
- 讯飞汽车:星火多语言大模型发布 助力更智能的汽车走向世界
- 讯飞汽车:星火多语言大模型发布,助力更智能的汽车走向世界
- 科大讯飞AI文娱论坛,为文娱产业注入新活力
- 讯飞星火与华为数据存储强强联手,“以存强算” 助力AI集群算力利用率飙升30%