AI show|点赞!云知声音频文件转写准确率提升超3%
2022-06-09 07:51:42爱云资讯722
无论是会议、访谈录音的整理,还是各种视频的字幕制作与语音质检,快速解决各类场景下的音频转文字的需求,都离不开音频文件转写服务。
音频文件转写服务,是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用,将长段音频文件(5小时以内或文件大小在2G以下)转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。
近期,云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚,云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级,尤其声学模型方面,首次使用了基于注意力机制的端到端模型,在准确率方面有了明显提升;同时,在快速纠错和热词识别等方面也进行了功能优化与实时更新,进一步满足了各使用场景用户的需求,提升音频文件转写使用体验。
01全新技术升级准确率提升超3%
最新的版本中,云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统(Attention-based Encoder Decoder),又创新性的提出了SMAD(Self-and-Mixed attention Decoder)技术,即在解码中,采用文本和声学的混合注意力机制,从而得到识别的最优结果。
无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音,都可以实现准确转写。在通用场景测试中,云知声准确率绝对提升超3%。达到行业顶尖水平。这不仅能带给终端用户更好的体验;对开发者来说,也是一次效率以及质量的升级,大大满足开发者精0益求精的诉求。
02 更简单易用开发者0成本接入先进语音识别技术
音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口,具备流式传输能力和轻量、跨平台的特点,方便开发者直接调用、快速集成。
云知声作为国内头部的人工智能独角兽企业,以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。
本次升级只是技术提升,并不改动接口,所以原来对接过云知声音频文件转写服务的开发者没有任何影响。
此外, 我们为新接入的开发者准备了免费体验包,注册即可认领;实名认证的个人开发者和企业开发者,还可以获得一大份认证礼包。
新手 3步 集成:
作为新一代智能语音识别引擎,云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线,以优质的性能对外提供AI开放式服务,赋能更多对音频文件转写有需求的开发者与合作伙伴。
未来,团队会在继续打磨技术的基础上,赋能更多应用场景,加速语音识别技术的快速落地!
相关文章
- 云知声受邀参加2025中国数字经济产业发展大会,携手多方共筑苏州人工智能战略生态
- 拒绝机械化互动!云知声兽牙AI Agent功能上新,开启智能协作新时代
- 云知声董事长、CTO梁家恩应邀参加广西南宁“邕城科技讲坛”,共话 AGI 产业未来
- 云知声深度参与三项大模型国家标准编写,助力行业规范发展
- 云知声上市积极筹备中,玄铁大会彰显AI芯片实力
- AIGC技术赋能,云知声获雅马哈 “感谢信” 开启新程
- 云知声荣膺2024胡润中国AI企业TOP50,领航智能体创新浪潮
- 云知声 Atlas 超算平台入选《分布式统一大数据虚拟文件系统Alluxio原理、技术与实践》
- 【再携手】云知声xTCL,共铸新风空调语音交互新篇章
- 云知声斩获多项年度大奖,彰显AI技术创新实力
- 智慧赋能丨云知声入选“2024年度中关村科学城人工智能全景赋能典型案例”
- 再创新辉丨云知声斩获2024高工智能汽车金球奖
- 中国科大&云知声联合团队斩获ACM MM 2024竞赛5冠2亚
- 三方共建促发展,云知声携手元翔厦门空港、兆翔科技成立智慧空港联合创新实验室
- 云知声再度入选北京民营企业科技创新百强榜
- 为国际盛会注入智慧基因,云知声“AI顾问”上岗投洽会