当前位置: 首页 > 资讯 > 科技 > 元象超大规模模型开源30种量化版本,助力用户实现更为经济高效的部署方案
  • 0
  • 0
  • 分享

元象超大规模模型开源30种量化版本,助力用户实现更为经济高效的部署方案

元象 2024-03-28 17:12:05 爱吃爆米花

元象大模型团队于3月28日宣布正式开源涵盖30种量化处理版本的大模型集合,此举旨在赋能广大开发者及企业无缝对接vLLM和llama.cpp等前沿深度学习框架进行高效量化推理工作,并延续其一贯承诺,所有量化版本均无条件允许免费用于商业用途。

对量化前后的模型能力、推理性能进行评估,以 XVERSE-13B-GPTQ-Int4量化版本为例,量化后模型权重压缩了72%,总吞吐提高了1.5倍,同时保留了95% 的能力。

开发者可以根据技能、软硬件配置和具体需求选择不同推理框架和数据精度的模型。如果本地资源有限,可以直接调用元象大模型的 API 服务(chat.xverse.cn)。

总体来说,元象大模型的开源量化版本提供了方便快捷的部署方式,可以根据需求选择不同的框架和精度模型进行部署和推理。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/29639.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换