灵云语音合成:追求极致真实,高度自然的语音合成效果
2020-02-28 19:06:06爱云资讯阅读量:1,089
近日,捷通华声推出搭载最新引擎的灵云语音合成技术,声线细腻、情感丰富、语速真实。得益于核心引擎的深度学习化与高音质声码器,最新灵云语音合成技术的合成效果得到全面提升。
新版灵云语音合成技术采用一体化智能文本分析算法,结合统计和规则等处理手段,让文本处理前端拥有强大的分词、多音字、韵律环境预测能力,使合成的语音听起来更加符合人类发音习惯和说话节奏。它还具备自动识别和处理日期时间、数值金额、电话号码等文本的能力,使得数字发音更自然,“年月日元”、“百分之”、“点”等分词朗读时的发音也更加顺畅。
升级后的语音合成技术在各项指标上都达到了历史新高。测评人员给出的MOS值达4.5分,属行业领先。
注:MOS(Mean Opinion Score),平均主观意见分。在国际标准中,统一使用MOS值来评价系统接收到的话音质量。(满分5分)合成速度方面,灵云语音合成技术同样毫不逊色。从实际体验来说,用户几乎感受不到任何等待时间,语音合成从点击“播放”开始即刻完成。为了在各个专业领域都能够有良好稳定的语音合成表现,满足不同行业的特殊需求,灵云语音合成针对特定词汇和语句进行个性化定制,通过用户词表、定制录音以及调整判断规则等方法,提高读音、读法和韵律的准确性。经过十多年不同行业的实践经验,捷通华声积累了大量的专业领域词库、预选音库,可为金融证券、天气预报、体育赛事、公交汽运、航空、税务、POI、排队叫号等众多领域提供更专业的语音合成播报,客户能够快速、轻松定制与自己产品属性、形象相匹配的声音,为产品赋能。
为满足各种应用场景对语音合成的需求,捷通华声推出了完善的语音合成产品体系:
a.由灵云公有云平台提供灵云语音合成能力
针对手机app、智能手表、智能机器人等产品,开发者可通过从云端调用能力的方式,搭建轻量化终端。
b.基于windows系统的灵云语音合成软件
车站、医院、广播站的语音播报,可以直接使用安装在电脑上的灵云语音合成软件,一键播放。
c.私有化部署的灵云语音合成能力平台
在客服中心、呼叫中心等场景,用电话机器人来服务海量用户,需要高并发的语音合成能力。捷通华声提供可私有云部署的语音合成能力平台,与客户IVR系统对接,提供稳定高效的语音合成服务。
灵云语音合成技术拥有包含多国语种的音库,持普通话、英语、维语、粤语等20多个语种的语言合成,配合捷通华声的语音识别和机器翻译技术,能够实现多国语音面对面翻译。
音色方面,除了提供男声、女声、童声等基础音色库外,还有更多个性化、饱含情感的音色,包括柔美动听、干净利落、甜美可爱、纯真自然、成熟稳重、热情洋溢、措辞严厉等等,可为各种应用场景提供合适的声音,全面满足企业个性化需求。例如,银行的智能客服需要温柔动听的声音,从而给客户良好的服务体验,而金融行业的欠款催收场景,则需要选择相对严厉的声音,起到警示和催促的作用。
自从2001年在国内率先推出面向市场的语音合成技术以来,捷通华声已广泛服务金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各领域,并出口美国、法国、西班牙、日本、韩国、新加坡等国家。捷通华声愿携手更多产业伙伴,为软件开发商、系统集成商、解决方案供应商等合作伙伴提供优质的产品和全面的技术支持,让更多的企业及个人享受到智能语音合成为生活带来的便利体验。
相关文章
- 灵云智能客服“懂你”式人机交互,推动金融服务再升级
- 灵云AI:全面推动智慧城市建设
- 传统IVR真的过时了吗?灵云智能语音导航给你答案
- 灵云语义理解:不断学习成长的人工智能
- 灵云语音合成:追求极致真实,高度自然的语音合成效果
- 以AI赋能政企,灵云智会开启高效会议模式
- 灵云语音识别:给你便捷生活、高效工作新体验
- AI战“疫“,筑安全防线——灵云疫情防控智能机器人在行动
- 灵云语音分析系统:帮助企业提升市场洞察力
- 全新灵云语音分析系统:构建自动化、智能化、数据驱动的客服中心
- 灵云语音识别:为智能终端插上“双耳”
- 灵云智能输入法重磅升级:新增语音速记+快捷翻译+跨屏输入
- 灵云语音识别:用AI赋予产品智能“双耳”
- 灵云AI服务器:为小型办公场景提供AI能力
- 刷脸时代:灵云人脸识别能力平台为企业提供安全、高效的身份认证服务
- 灵云四川话语音识别,这个技术很“要得”