当前位置：首页 > 资讯 > 科技 > 阿里通义千问开放Qwen2-Audio 7B模型，语音交流新时代：无障碍互动

阿里通义千问开放Qwen2-Audio 7B模型，语音交流新时代：无障碍互动

通义千问 2024-08-18 09:32:43 爱吃爆米花

近日消息，阿里通义千问宣布开源其Qwen2-Audio系列的两项最新成果：Qwen2-Audio-7B与Qwen2-Audio-7B-Instruct模型。

这标志着在音频理解和生成技术领域的重要进展，两个模型分别针对基础的音频处理任务和指令导向的音频生成任务进行了优化，旨在为研究人员和开发者提供强大的工具，促进语音技术的创新与应用落地。

作为一个大规模音频语言模型，Qwen2-Audio 能够接受各种音频信号输入，并根据语音指令执行音频分析或直接响应文本，有两种不同的音频交互模式：

语音聊天：用户可以自由地与 Qwen2-Audio 进行语音互动，而无需文本输入

音频分析：用户可以在互动过程中提供音频和文本指令对音频进行分析

官方在一系列基准数据集上进行了测试，Qwen2-Audio 超越了先前的最佳模型。

扩展阅读

通义千问开源Qwen2.5-Coder全系列，代码能力比肩GPT-4

通义千问 10天前

所属资源

通义千问

应用 / 工具 /

阿里巴巴自研AI大模型

去下载

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/76125.html

文章标签

通义千问

文明上网，理性发言，共同做网络文明传播者

提交