科大讯飞AI播报员:中关村论坛年会上的“声音”担当
2024-05-02 06:48:00爱云资讯阅读量:760
在刚刚落幕的2024年中关村论坛年会上,来自全球100多个国家和地区、150余家外国政府部门和国际组织机构的上百位顶尖专家、上千名演讲嘉宾齐聚一堂,世界的目光聚焦中国,共同见证一场科技创新的盛宴。
全球首个通用人工智能系统原型“通通”、驾驭激光的利器“转角菱方氮化硼”材料、拓展“心有灵犀”边界的“北脑二号”智能脑机系统……在2024中关村论坛年会重大成果发布环节,10项具有创新性、前瞻性、颠覆性的重大科技成果亮相,涉及基础研究、前沿技术、科技基础设施等各方面。
“就像是真人在说话一样。”科大讯飞运用先进的语音合成技术,为成果亮相视频环节进行AI配音,为传统会议模式带来了创新突破。
借助深度学习技术,科大讯飞将文本转化成拟人化的语音,赋予机器像人一样自然流畅说话的能力,成为语音交互、语音翻译的关键接口能力。
作为人工智能领域的龙头企业,科大讯飞在智能语音技术领域的深耕已有25年之久。自上世纪90年代开始探索语音领域以来,科大讯飞始终坚持源头技术创新,连续14年蝉联国际语音合成大赛冠军,并在语音识别、机器翻译等领域多次在国际大赛上夺冠。
如今,科大讯飞不仅将中文语音技术做到了最好,还将多语种语音技术做到了最好。2020年,科大讯飞60个语种的语音识别、翻译和37个语种的语音合成技术已达到国际领先水平,超越了谷歌、微软等国际巨头,达到国际领先水平。2021年,科大讯飞在美国国家标准与技术研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中,获得全部受限赛道的15个语种冠军及7个语种非受限赛道冠军。目前,科大讯飞的多语种技术已经可以满足60余种语言的智能语音技术需求。
今年1月份,科大讯飞结合语音属性解耦、多语种共享建模等技术创新发布讯飞星火语音大模型,在多语种语音识别方面首批37个主流语种效果超过OpenAI Whisper V3。星火语音大模型首批覆盖语种中,24个主要语种识别率达到了90%,13个重点语种识别率更是超过了94%。在多语种语音合成能力方面,27个主要语种MOS评分达到了4.4,13个重点语种MOS评分高达4.6。
4月26日,讯飞星火大模型V3.5春季上新,科大讯飞发布业界首个支持长文本、长图文以及长语音的大模型产品。在此次升级中,面对广泛的音视频信息高效获取需求,科大讯飞推出长语音功能,将语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。
科大讯飞进一步升级星火语音大模型,首发多情感超拟人合成,情绪表达的可感知度达到 85% 以上,对高兴、抱歉、安慰、撒娇、困惑等语气表达更加生动,可以满足用户在各种场景下的自我减压、释放情绪等需求,并推出一句话声音复刻功能。
在2024中关村论坛年会上,科大讯飞智能语音技术的出色表现,展示了中国科技企业在人工智能领域的技术实力和创新能力。在科大讯飞等中国企业的努力下,智能语音技术将为人类带来更多便捷和智慧,引领科技创新的未来。
相关文章
- 科大讯飞与重庆市人社局签署框架合作协议 星火大模型助力重庆“数字人社”建设
- 科大讯飞获得2024年PMI(中国)项目管理大奖杰出项目奖
- 重新弄定义多模AIUI标准,科大讯飞首发语音视觉虚拟人交互“三合一”
- 科大讯飞出席2024年度AFC专委会高峰论坛
- 科大讯飞AI黑板上新,星火智慧黑板2.0更公平、更高效、更智慧、更安全
- 科大讯飞引领大模型规模化应用,200余项技术成果亮相1024科博展
- 科大讯飞AI文娱论坛,为文娱产业注入新活力
- 科大讯飞亮相GITEX GLOBAL 2024,多场景AI应用为中东注入AI动力
- 科大讯飞全球1024开发者节举办在即,重磅发布多模态视觉交互及超拟人虚拟人交互能力
- “国芯一号”智算中心正式上线,科大讯飞与竹溪共筑算力未来
- 中国海油携手科大讯飞共建“海能”人工智能模型,助力能源行业焕新
- 科大讯飞携手中国移动,以星火助智,共创AI+新未来
- 科大讯飞携手合肥科技馆打造“AI科普音乐会”,AI虚拟歌手Luya“唱”出科学知识
- 无缝对接多场景,科大讯飞AI虚拟人交互平台引领智能应用新潮流!
- 科大讯飞10月24日举行开发者节,讯飞星火大模型底座能力再升级
- 科大讯飞助阵联合国教科文组织特别演出——《我的梦》沟通无障碍