4月8日消息,阿里云在人工智能领域持续发力,其自主研发的大规模语言模型平台“通义千问”宣布正式开源其最新研发成果——拥有320亿参数的高性能模型Qwen1.5-32B。
此举不仅进一步丰富了通义千问的开源模型矩阵,更标志着该平台已实现了从5亿至720亿参数区间内共计七款大语言模型的全面开源。
在此之前,通义千问已陆续向全球开发者贡献了六款不同规模的预训练模型,参数量分别涵盖5亿、18亿、40亿、70亿、140亿以及顶级规格的720亿级别。这些模型各具特色,适应不同的应用场景与计算资源条件,为学术研究、企业应用及个人开发者提供了丰富的选择空间。
此次开源的 320 亿参数模型,将在性能、效率和内存占用之间实现更理想的平衡。例如,相比通义千问 14B 开源模型,32B 在智能体场景下能力更强;相比通义千问 72B 开源模型,32B 的推理成本更低。
通义千问团队希望 32B 开源模型能为企业和开发者提供更高性价比的模型选择。目前,通义千问共开源了 7 款大语言模型,在海内外开源社区累计下载量突破 300 万。
文明上网,理性发言,共同做网络文明传播者