当前位置：首页 > 资讯 > 科技 > 元象超大规模模型开源30种量化版本，助力用户实现更为经济高效的部署方案

元象超大规模模型开源30种量化版本，助力用户实现更为经济高效的部署方案

元象 2024-03-28 17:12:05 爱吃爆米花

元象大模型团队于3月28日宣布正式开源涵盖30种量化处理版本的大模型集合，此举旨在赋能广大开发者及企业无缝对接vLLM和llama.cpp等前沿深度学习框架进行高效量化推理工作，并延续其一贯承诺，所有量化版本均无条件允许免费用于商业用途。

对量化前后的模型能力、推理性能进行评估，以 XVERSE-13B-GPTQ-Int4量化版本为例，量化后模型权重压缩了72%，总吞吐提高了1.5倍，同时保留了95% 的能力。

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限，可以直接调用元象大模型的 API 服务（chat.xverse.cn）。

总体来说，元象大模型的开源量化版本提供了方便快捷的部署方式，可以根据需求选择不同的框架和精度模型进行部署和推理。

扩展阅读

元象 01-24 14:47

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/29639.html

文章标签

元象

文明上网，理性发言，共同做网络文明传播者

提交

暂无评论内容