当前位置：首页 > 资讯 > 科技 > 微软革新Azure AI语音技术，新增9款超逼真语音模式

微软革新Azure AI语音技术，新增9款超逼真语音模式

微软（Microsoft） 2024-04-04 10:15:27 爱吃爆米花

微软Azure AI语音服务迎来显著提升，最近发布的9种全新拟人化语音方案标志着用户体验的又一飞跃。此次关键性更新依托于先进的零样本学习技术，在文本转语音（TTS）过程中，系统无需预先训练就能捕捉并复制各种情境下的语音特质，从而生成高度贴合真实对话风格的合成语音。

Azure AI语音服务的Personal Voice功能通过这些新模型，使得个性化语音的创建变得快速而简单。用户只需提供一小段语音样本，即可在几秒钟内生成能模仿其独特语音特征的AI语音。这种高度自然的语音输出，不仅流畅自然，还能精准捕捉到人类语音的细微差别，如语调、节奏和情感表达，极大地提升了合成语音的生动性和真实感。

微软的这项服务支持超过400种神经语音，覆盖了140多种语言和地区，使得文本到语音的转换不仅快速，而且无障碍。此外，通过自定义神经语音功能，用户可以轻松为其业务创建独特的品牌声音，无论是个人化应用还是跨语种配音，都能满足需求。

Azure AI语音服务的应用场景非常广泛，包括个性化的语音助手、沉浸式游戏体验、多语言配音、媒体和娱乐内容的创作，以及语音翻译等。这些新的Zero-shot TTS模型不仅适用于个人化应用，也能为需要实时互动的场景提供支持。

微软还特别强调了负责任的AI使用，对于Zero-shot TTS模型的使用实施了严格的指导原则和访问控制，以确保技术的负责任部署和使用，保护个人和社会的权利。

此外，微软还发布了9种针对对话优化的AI语音，这些语音覆盖了多种语言，为用户提供了更多的选择和多样性。这些语音在阅读对话和非正式文本时听起来更自然、更引人入胜，甚至包括笑声和填充停顿等插入语，为虚拟对话增添了人性化的触感。

新的通用可用（GA）语音包括多种语言选项，如英语、德语、法语和中文等，这些语音都经过了针对对话风格的优化，扩展了微软在91种语言及其变种中传达内容的能力，体现了微软克服语言障碍、促进全球交流更加包容和无障碍的坚定承诺。

用户可以通过Azure AI语音服务的在线语音库查看详细介绍和演示效果，并通过更新体验链接进一步探索这些新功能。微软的这次升级，无疑将为各种业务场景提供更加丰富和真实的语音交互体验。

扩展阅读

微软公测Translator Pro翻译应用：消除职场语言障碍，支持本地运行

微软（Microsoft）昨天

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/30946.html

文章标签

微软 Azure AI

文明上网，理性发言，共同做网络文明传播者

提交