近日消息,ElevenLabs近期在其官方博客上宣布,他们最新推出的Turbo v2.5文本转语音技术,现已全面升级支持包括普通话在内的32种国际语言,服务覆盖全球约80%地区的用户,致力于提供更自然、更低延迟的AI语音交互体验,进一步推动了人工智能语音技术的边界。
Turbo v2.5 模型首次支持越南语、匈牙利语和挪威语,这些语言的使用人数分别为 8500 万、1300 万和 530 万。
本次更新还重点提高了印地语、法语、西班牙语、普通话和其他 27 种语言的响应速度,最高提升了 3 倍;英语的速度提高了 25%。
Turbo v2.5 模型结合了先进的文本到语音技术和最新的低延迟模型架构,用户基本上不需要等待,就能提供高质量的 AI 生成音频输出。
Turbo 模型实现了快速语音合成,同时保持流畅和自然的高品质音质,响应时间不超过 400 毫秒。
ElevenLabs 成立于 2022 年,总部位于伦敦,专注于开发人工智能语音模型和工具,可以创建不同语言、口音和情感的合成语音。
公司首席执行官 Mati Staniszewski 表示,ElevenLabs 目前拥有约 40 名远程办公员工,分布在全球各地,并计划到年底将团队扩大至 100 人。
ElevenLabs 非常重视人工智能内容的透明度,并开发了 AI Speech Classifier 等工具帮助识别合成音频,同时也在开发用于电影配音的工具,并正在开发一个允许用户生成 AI 语音并通过授权赚钱的平台。
文明上网,理性发言,共同做网络文明传播者