当前位置: 首页 > 资讯 > 科技 > 魔搭社区新入驻明星:幻方DeepSeek-V2系列模型开源亮相
  • 0
  • 0
  • 分享

魔搭社区新入驻明星:幻方DeepSeek-V2系列模型开源亮相

魔搭社区 2024-05-08 10:23:19 爱吃爆米花

5月8日消息,ModelScope魔搭社区正式揭晓,幻方DeepSeek-V2系列模型现已加入其开源阵容。

据悉,幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE,以236B 总参数、21B 激活,实际部署在8卡 H800机器上,输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。

性能方面,在目前大模型主流榜单中,DeepSeek-V2均表现出色:

中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B知识、数学、推理、编程等榜单结果也位居前列支持128K上下文窗口

和DeepSeek67B相比,DeepSeek-V2节约了42.5%训练成本,推理的KV Cache节约了93.3%,最大吞吐是之前的576%。

来源:it之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/41119.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换