AI show|点赞！云知声音频文件转写准确率提升超3%-爱云资讯

无论是会议、访谈录音的整理，还是各种视频的字幕制作与语音质检，快速解决各类场景下的音频转文字的需求，都离不开音频文件转写服务。

音频文件转写服务，是自动语音识别Automatic Speech Recognition(ASR)技术的一种应用，将长段音频文件（5小时以内或文件大小在2G以下）转换成文本数据。适用于会议转写、字幕生成、音频内容分析等场景。

近期，云知声音频文件转写发布最新版本。经过不断地努力与算法攻坚，云知声团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级，尤其声学模型方面，首次使用了基于注意力机制的端到端模型，在准确率方面有了明显提升；同时，在快速纠错和热词识别等方面也进行了功能优化与实时更新，进一步满足了各使用场景用户的需求，提升音频文件转写使用体验。

01全新技术升级准确率提升超3%

最新的版本中，云知声的音频文件转写在语音识别技术上采用最先进的AED 端到端系统（Attention-based Encoder Decoder），又创新性的提出了SMAD（Self-and-Mixed attention Decoder）技术，即在解码中，采用文本和声学的混合注意力机制，从而得到识别的最优结果。

无论是不同设备录制、不同网络传输、还是带有一定噪声和干扰的语音，都可以实现准确转写。在通用场景测试中，云知声准确率绝对提升超3%。达到行业顶尖水平。这不仅能带给终端用户更好的体验；对开发者来说，也是一次效率以及质量的升级，大大满足开发者精0益求精的诉求。

02 更简单易用开发者0成本接入先进语音识别技术

音频文件转写通过 Web API 的方式给开发者提供通用 HTTP 接口，具备流式传输能力和轻量、跨平台的特点，方便开发者直接调用、快速集成。

云知声作为国内头部的人工智能独角兽企业，以人工智能语音技术为核心，通过全栈式技术链条，为企业和用户提供智能语音技术和综合解决方案。

本次升级只是技术提升，并不改动接口，所以原来对接过云知声音频文件转写服务的开发者没有任何影响。

此外，我们为新接入的开发者准备了免费体验包，注册即可认领；实名认证的个人开发者和企业开发者，还可以获得一大份认证礼包。

新手 3步集成：

作为新一代智能语音识别引擎，云知声音频文件转写最新版本已经在官网及AI开放平台焕新上线，以优质的性能对外提供AI开放式服务，赋能更多对音频文件转写有需求的开发者与合作伙伴。

未来，团队会在继续打磨技术的基础上，赋能更多应用场景，加速语音识别技术的快速落地！

AI show|点赞！云知声音频文件转写准确率提升超3%

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业