星火语音大模型首发讯飞输入法AI能力将获提升-爱云资讯

1月30日，科大讯飞举办星火认知大模型V3.5升级发布会，展示大模型底层能力到应用场景的新发展，同时也发布了讯飞语音大模型。科大讯飞董事长刘庆峰表示，“今天的通用人工智能必将像PC和互联网的诞生一样，深刻改变人类的生产生活方式。”随着星火认知大模型V3.5的发布，讯飞输入法借新技术持续赋能，不断升级生成式AI输入能力，在万物互联时代带来更出众的人机交互体验。

2023年8月，讯飞输入法推出“AI创作助手”，覆盖6大表达场景，适配60多款应用，使亿万用户感受大模型的“模”力。同年10月，讯飞输入法全新发布13.0，量身定制“高情商沟通”、“润色达人”、“智能回复”、“帮你扩写”等场景化功能，提供生成式AI输入服务。2024年1月30日，讯飞星火V3.5已在语言理解、数学能力上超过了GPT-4 Turbo。与此同时，讯飞输入法基于星火大模型的底座和用户新生需求，生成式AI能力再提升，匹配更多元的场景，拥有更深层的理解，生成更丰富的表达。

“讯飞星火的技术进步，来源于真实世界刚需。”

创业之初，科大讯飞的梦想和使命就是要实现人机信息沟通无障碍。当下的大模型带来了语音技术发展的全新机会，使语音识别可以进一步突破高噪、远场、多人说话这些传统的“鸡尾酒会语音识别”重大难题。这一次基于大语言模型框架，结合讯飞多维度语音属性解耦表征预训练，正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，全新升级助力更自由的沟通，推动万物互联时代下的人机交互变革。

科大讯飞创业25年来，在智能语音这条赛道上一路驰骋，持续走在世界前列。2006-2019年，连续十四年蝉联国际语音合成大赛冠军;2016-2023年，连续4届获得国际多通道语音分离和识别比赛CHIME冠军;2021-2023年，连续三年获得国际语音翻译比赛IWSLT赛道冠军;还参与承建首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心等，在语音领域持续积累。

此次星火语音大模型将识别、翻译和多语种分类等多种功能统一交换并进行训练，实现了多种任务信息的共通，会对整体任务产生促进作用，使语音识别效果大幅提升。其中，多语种自动识别已覆盖37种，端到端语音翻译超过13个。在训练层面，通过两种方式，即多模态理解和多模态生成两种任务的协同训练，来实现多模态的协同。

深耕互联网行业14年，讯飞输入法搭载AI语音输入，支持26种方言、5种民族语言以及30种外语，令表达更方便、更透彻，同时能够理解上下文语义关联。在星火语音大模型赋能下，全语音自然交互的讯飞输入法旨在实现智慧表达，智能连接。

当下，生成式AI的赋能已经成为一种趋势。对于大众而言，一款生成式AI输入法，是最方便、最直接、最轻量的大模型使用端口，打字就能使用生成式AI的多模态服务。可以看到，源于真实世界刚需的产品创新，在应用场景和社会价值方面潜力巨大。

星火语音大模型首发 讯飞输入法AI能力将获提升

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业

星火语音大模型首发讯飞输入法AI能力将获提升