星火语音大模型首发 讯飞输入法AI能力将获提升
2024-01-31 12:05:24爱云资讯阅读量:905
1月30日,科大讯飞举办星火认知大模型V3.5升级发布会,展示大模型底层能力到应用场景的新发展,同时也发布了讯飞语音大模型。科大讯飞董事长刘庆峰表示,“今天的通用人工智能必将像PC和互联网的诞生一样,深刻改变人类的生产生活方式。”随着星火认知大模型V3.5的发布,讯飞输入法借新技术持续赋能,不断升级生成式AI输入能力,在万物互联时代带来更出众的人机交互体验。
2023年8月,讯飞输入法推出“AI创作助手”,覆盖6大表达场景,适配60多款应用,使亿万用户感受大模型的“模”力。同年10月,讯飞输入法全新发布13.0,量身定制“高情商沟通”、“润色达人”、“智能回复”、“帮你扩写”等场景化功能,提供生成式AI输入服务。2024年1月30日,讯飞星火V3.5已在语言理解、数学能力上超过了GPT-4 Turbo。与此同时,讯飞输入法基于星火大模型的底座和用户新生需求,生成式AI能力再提升,匹配更多元的场景,拥有更深层的理解,生成更丰富的表达。
“讯飞星火的技术进步,来源于真实世界刚需。”
创业之初,科大讯飞的梦想和使命就是要实现人机信息沟通无障碍。当下的大模型带来了语音技术发展的全新机会,使语音识别可以进一步突破高噪、远场、多人说话这些传统的“鸡尾酒会语音识别”重大难题。这一次基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,全新升级助力更自由的沟通,推动万物互联时代下的人机交互变革。
科大讯飞创业25年来,在智能语音这条赛道上一路驰骋,持续走在世界前列。2006-2019年,连续十四年蝉联国际语音合成大赛冠军;2016-2023年,连续4届获得国际多通道语音分离和识别比赛CHIME冠军;2021-2023年,连续三年获得国际语音翻译比赛IWSLT赛道冠军;还参与承建首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心等,在语音领域持续积累。
此次星火语音大模型将识别、翻译和多语种分类等多种功能统一交换并进行训练,实现了多种任务信息的共通,会对整体任务产生促进作用,使语音识别效果大幅提升。其中,多语种自动识别已覆盖37种,端到端语音翻译超过13个。在训练层面,通过两种方式,即多模态理解和多模态生成两种任务的协同训练,来实现多模态的协同。
深耕互联网行业14年,讯飞输入法搭载AI语音输入,支持26种方言、5种民族语言以及30种外语,令表达更方便、更透彻,同时能够理解上下文语义关联。在星火语音大模型赋能下,全语音自然交互的讯飞输入法旨在实现智慧表达,智能连接。
当下,生成式AI的赋能已经成为一种趋势。对于大众而言,一款生成式AI输入法,是最方便、最直接、最轻量的大模型使用端口,打字就能使用生成式AI的多模态服务。可以看到,源于真实世界刚需的产品创新,在应用场景和社会价值方面潜力巨大。
相关文章
- 科大讯飞与重庆市人社局签署框架合作协议 星火大模型助力重庆“数字人社”建设
- 北电数智:以“星火”点亮数字化中国的前进之路
- 搭载自研星火大模型,讯飞翻译机4.0星火版全面升级翻译体验
- 以AI赋能全球语言科技普惠,讯飞翻译机4.0星火版正式上市
- 讯飞星火深度赋能科研,加速AI for Science成为科技变革新引擎
- 科大讯飞AI黑板上新,星火智慧黑板2.0更公平、更高效、更智慧、更安全
- 讯飞汽车:星火多语言大模型发布 助力更智能的汽车走向世界
- 讯飞汽车:星火多语言大模型发布,助力更智能的汽车走向世界
- 讯飞星火与华为数据存储强强联手,“以存强算” 助力AI集群算力利用率飙升30%
- 讯飞星火4.0 Turbo正式发布,7项“第一”引领大模型规模化应用落地
- 哈勃望远镜拍摄到壮观的恒星火山景象
- 科大讯飞携手中国移动,以星火助智,共创AI+新未来
- 科大讯飞10月24日举行开发者节,讯飞星火大模型底座能力再升级
- 星火网关激活医疗耗材数据要素可信流通,赋能医院高效运营和中小企业融资
- 为商通全球蓄势赋能,讯飞星火大模型产品组团亮相第三届全球数贸会
- 华为与科大讯飞进一步深化合作,“昇腾”+“星火”加速大模型应用落地