当前位置: 首页 > 资讯 > 科技 > 阿里通义实验室推出开源语音处理技术ClearerVoice-Studio:消除背景噪声
  • 0
  • 0
  • 分享

阿里通义实验室推出开源语音处理技术ClearerVoice-Studio:消除背景噪声

阿里巴巴 2024-12-07 13:17:25 爱吃爆米花

近日消息,阿里巴巴旗下达摩院的通义实验室正式宣布,将一项名为 ClearerVoice-Studio 的语音处理技术进行开源。这一举措旨在显著提升语音的质量以及可理解程度。

在当前语音技术被广泛应用的背景下,语音质量逐步成为众人关注的焦点。特别是在环境噪声干扰、混响效果以及设备拾音效果不尽如人意等多种状况下,对于语音处理技术的需求愈发迫切。

ClearerVoice-Studio集成了语音增强、语音分离和音视频说话人提取等功能,通过融合复数域深度学习算法,大幅提升了语音降噪和分离的性能。该技术能够最大限度地消除背景噪声,保留语音清晰度,同时保持语音失真最小化。

ClearerVoice-Studio的核心模型与算法包括在2022年IEEE/INTER Speech DNS Challenge中获得整体第二的FRCRN模型,以及在语音分离任务中表现卓越的MossFormer系列模型。基于MossFormer2的48kHz语音增强模型在有效抑制噪声的同时,大幅降低了语音失真。

阿里巴巴通义实验室希望通过ClearerVoice-Studio平台,为开发者、研究者和企业提供强大的语音处理工具,助力创新应用落地。用户可以通过在线体验Demo,准备一段包含噪声的语音文件,上传至指定页面,一键处理后在线试听或下载处理结果,即刻获得清晰的音质和卓越的降噪效果。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/104091.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换