当前位置：首页 > 资讯 > 科技 > 智谱AI开源重磅：端侧大语言与多模态模型GLM-Edge系列

智谱AI开源重磅：端侧大语言与多模态模型GLM-Edge系列

智谱AI 2024-12-02 09:30:41 爱吃爆米花

近日消息，智谱科技正式宣布开源其端侧大语言和多模态模型GLM-Edge系列。这一重大举措代表了公司在端侧实际应用场景中的一次关键性尝试，旨在推动端侧AI技术的广泛应用和发展。

智谱科技希望通过开放这些先进的模型，鼓励更多的开发者和研究者参与到端侧AI技术的创新和应用中来，共同推动AI技术在各个领域的落地和发展。

GLM-Edge系列由四种不同尺寸的模型组成，包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B，分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。

基于GLM-4系列的技术积累，智谱的研究团队对模型结构和尺寸进行了调整，以实现模型性能、实机推理效果和落地便利度之间的最佳平衡。通过与合作伙伴的深入合作和推理优化，GLM-Edge系列模型在一些端侧平台上展现出了卓越的运行速度。特别是在高通骁龙8Elite平台上，借助NPU算力和混合量化方案，1.5B对话模型和2B多模态模型能够实现每秒60tokens以上的解码速度，应用投机采样技术后，解码速度更是能达到每秒100tokens以上。

智谱开源的GLM-Edge系列模型不仅展示了公司在人工智能领域的技术实力，也为开发者和研究者提供了强大的工具和资源，以促进端侧AI应用的发展和创新。

扩展阅读