语音识别上难度 讯飞输入法免切换识别多语种多方言不迷糊!
2024-07-02 11:37:22爱云资讯阅读量:57,981
近日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,国内大模型全面领先。同时,本次星火语音大模型再升级,发布国际领先的多语种多方言免切换语音识别能力。讯飞输入法现场演示了方言外语免切换语音输入,大大提升用户的输入效率。
刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准,并于2023年5月发布。
在讯飞星火4.0发布之际,星火语音大模型升级发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。发布会现场,工作人员演示了讯飞输入法免切换识别模式下多种方言和多种外语的语音输入,让输入效率大大提高。
作为中文语音输入的开创者,讯飞输入法通过语音的持续迭代,不断革新人机交互方式,从单一的普通话到方言,从方言免切换再发展到多语种多方言免切换,旨在满足不断发展变化的用户需求。进入大模型时代,输入法与大模型的能力深度耦合,表现出超乎想象的智能化和个性化。可以期待,未来的语音识别不仅能听懂我们的语言,更能感受我们的情绪,甚至预测我们的需求。
相关文章
- 量身定制 精准识别,标贝科技语音识别定制方案助力企业智慧升级
- vivo携手昆仑芯、wenet助力提升语音识别效果与性能,共建开源生态
- 说话秒变笔记!讯飞语记能“连续语音识别速记”
- 出门问问联合发布全球最大多领域中文语音识别数据集WenetSpeech
- 从语音识别到AI拍摄,骁龙人工智能算力覆盖手机体验方方面面
- AI助手查余额,思必驰语音识别支持10多种方言
- 197亿美元现金!微软宣布收购语音识别巨头Nuance
- 谷歌发布新一代定向人声分离系统,2.2MB模型提升设备端语音识别
- 小米MIUI新增字幕模式,语音识别更加懂你
- 用人工智能打通K12语音识别市场,「先声智能」实力加码在线教育细分赛道
- 讯飞智能键盘首发离线语音识别,颠覆你对键盘的所有想象
- 讯飞输入法安排上了AI语音新引擎 树立语音识别新标杆
- AI赋能新版搜狗输入法:语音识别支持9种语言,多种外语键盘一键切换
- 支持语音识别游戏指令!腾讯黑鲨游戏手机3全新JOYUI系统迎来全面升级
- 讯飞输入法安卓V9.1.9575 大幅提升武汉话语音识别准确率
- 灵云语音识别:给你便捷生活、高效工作新体验