当前位置: 首页 > 资讯 > 科技 > 阿里通义实验室推出CosyVoice 2.0:语音生成大模型的全新升级
  • 0
  • 0
  • 分享

阿里通义实验室推出CosyVoice 2.0:语音生成大模型的全新升级

阿里巴巴 2024-12-19 09:08:02 爱吃爆米花

近日消息,阿里巴巴通义实验室的语音团队对外宣布了一个好消息:他们旗下的开源语音生成大模型CosyVoice已经成功升级到2.0版本。这次升级不仅代表了语音生成技术在多个关键领域的显著提升,还为用户带来了更为出色和自然的体验。

在发音准确性方面,CosyVoice2.0相比于前一版本错误率下降了30%至50%,在Seed-TTS测试集的hard测试集上取得了当前最低的字错误率,尤其在合成绕口令、多音字、生僻字方面表现出色。此外,2.0版本在零样本语音生成和跨语言语音合成上保持了音色一致性,特别是跨语言语音合成能力相较于1.0版本有了明显提升。

CosyVoice2.0在合成音频的韵律、音质、情感匹配方面也有所增强,MOS评测分从5.4提升至5.53,接近某商业化语音合成大模型的评分。同时,2.0版本支持更多细粒度的情感控制和方言口音控制,为用户提供了更丰富的语言选择,包括粤语、四川话、郑州话、天津话和长沙话等主要方言,以及角色扮演功能,如模仿机器人、小猪佩奇的风格讲话等。

CosyVoice2.0的升级,不仅提升了语音合成的技术和体验,也进一步推动了开源社区的发展,鼓励更多的开发者参与到语音处理技术的创新和应用中来。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/105597.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换