当前位置：首页 > 资讯 > 科技 > 魔搭社区新入驻明星：幻方DeepSeek-V2系列模型开源亮相

魔搭社区新入驻明星：幻方DeepSeek-V2系列模型开源亮相

魔搭社区 2024-05-08 10:23:19 爱吃爆米花

5月8日消息，ModelScope魔搭社区正式揭晓，幻方DeepSeek-V2系列模型现已加入其开源阵容。

据悉，幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2，并开源了技术报告和模型权重，该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE，以236B 总参数、21B 激活，实际部署在8卡 H800机器上，输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。

性能方面，在目前大模型主流榜单中，DeepSeek-V2均表现出色：

中文综合能力（AlignBench）开源模型中最强，与GPT-4-Turbo，文心4.0等闭源模型在评测中处于同一梯队英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral8x22B知识、数学、推理、编程等榜单结果也位居前列支持128K上下文窗口

和DeepSeek67B相比，DeepSeek-V2节约了42.5%训练成本，推理的KV Cache节约了93.3%，最大吞吐是之前的576%。

扩展阅读

DashInfer：阿里魔搭社区发布开源推理引擎，引领AI技术新潮流

DashInfer：阿里魔搭社区发布开源推理引擎，引领AI技术新潮流

魔搭社区 2024-05-26 09:14

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/41119.html

文章标签

魔搭社区

评论

文明上网，理性发言，共同做网络文明传播者

验证码

提交

暂无评论内容

猜你喜欢

科学家团队发现已知的最大恐爪龙类足迹，体长至少5米

中国地质大学评论：0 2024-05-08
《Outlook》将迎来更新，新增邮件草稿最小化功能

Microsoft Outlook 评论：0 2025-02-12

最新

DashInfer：阿里魔搭社区发布开源推理引擎，引领AI技术新潮流

魔搭社区评论：0 2024-05-26
魔搭社区新入驻明星：幻方DeepSeek-V2系列模型开源亮相

魔搭社区评论：0 2024-05-08
魔搭Data-Juicer与lite-Sora项目崭新发布，引领社区共建类Sora模型生态

魔搭社区评论：0 2024-03-25
魔搭社区倾力开源：新一代多智能体框架AgentScope，开启协同智能新篇章

魔搭社区评论：0 2024-02-28
用DeepSeek买彩票真中奖了，奖金5元

DeepSeek 评论：0 2025-02-11

显示更多

热榜

百度热搜微博热搜抖音热搜

1买到《哪吒2》手写票的观众发声，质疑偷票房多渠道进行举报

2曝《哪吒2》被偷票房，损失了几千万？

3特朗普停铸1美分硬币：太浪费

4特朗普签令：对输美钢铝征收25%关税

5Meta“AI读心术”准确率可达80%，不开颅、不植入

6朝鲜此时撤军，俄乌释放何种信号

7外交部：中方对努乔马逝世表示深切哀悼

8美国2架飞机跑道上相撞，已致1人死亡

热门游戏

第五人格
手游 / 角色扮演
去下载
王者荣耀
手游 / 角色扮演
去下载

换一换

热门软件

微信
应用 / 社交
去下载
支付宝
应用 / 工具
去下载
抖音
应用 / 视频
去下载

换一换