当前位置: 首页 > 资讯 > 科技 > 阿里通义千问公布Qwen2.5模型开源版:Qwen2-VL-72B比肩GPT-4技术前沿
  • 0
  • 0
  • 分享

阿里通义千问公布Qwen2.5模型开源版:Qwen2-VL-72B比肩GPT-4技术前沿

通义千问 2024-10-01 10:39:31 爱吃爆米花

近日消息,通义千问团队在Qwen2成功发布仅三个月后,再度发力,正式揭开Qwen系列新秀——Qwen2.5系列语言模型的开源序幕。

此次开源行动被誉为历史上规模最大之列,不仅涵盖了全能型通用语言模型Qwen2.5,还囊括了专为编程及数学领域定制的Qwen2.5-Coder与Qwen2.5-Math模型,此举无疑将进一步推动AI技术的边界与应用深度。

Qwen2.5系列模型在最新的大规模数据集上进行了预训练,数据集包含高达18T tokens,相较于Qwen2,新模型在知识获取、编程能力和数学能力方面均有显著提升。模型支持长文本处理,能够生成最多8K tokens的内容,并保持了对29种以上语言的支持。

Qwen2.5系列模型的开源,不仅采用了Apache2.0许可证,还提供了多种不同规模的版本,以适应不同的应用需求。此外,通义千问团队还开源了性能媲美GPT-4的Qwen2-VL-72B模型。

新模型在指令执行、长文本生成、结构化数据理解以及生成结构化输出方面取得了显著改进。特别是在编程和数学领域,Qwen2.5-Coder和Qwen2.5-Math模型在专业数据集上进行了训练,展现了更强的专业领域能力。

所 属 资 源
通义千问
通义千问
应用 / 工具 /
阿里巴巴自研AI大模型
去下载
来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/89109.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换