近日消息,商汤科技强势推出了其日日新系列的最新迭代版本——日日新5.0大模型。据悉,这一创新成果的核心设计在于运用了先进的MOE(Mixture of Experts)混合专家架构,旨在全方位提升模型在知识理解、数学运算、逻辑推理以及代码生成等关键领域的表现。
该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,更号称“全面对标 GPT-4 Turbo”。其提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。
文科能力方面,其在创意写作、推理总结等方面能力均有提升,可为教育、内容产业等垂直应用场景提供辅助;理科能力方面,其数理、代码及推理等方面能力也进行了增强,官方表示可为金融、数据分析等场景落地提供基础。
目前,日日新 5.0 大模型已经正式面向全网用户开放,点此直达
商汤方面表示,在小米汽车 SU7 的智能座舱内也应用了商汤大模型技术,小爱同学采用了基于商汤端云大模型的解决方案,可为车主提供智能化交互体验。
文明上网,理性发言,共同做网络文明传播者