近日消息,上海人工智能实验室携手商汤科技,协同香港中文大学与复旦大学,共同揭开了人工智能领域的新篇章,正式推出了备受瞩目的新一代大语言模型——书生·浦语2.5(InternLM2.5)。
InternLM2.5-7B模型已开源,其他规模的模型也将陆续开源。上海人工智能实验室承诺继续提供免费商用授权,并通过高质量开源模型支持社区创新。
该模型在以下方面有显著提升:
推理能力:InternLM2.5的推理能力显著增强,部分维度超越了Llama3-70B模型,特别在数学评测集MATH上实现了100%的性能提升,准确率达到60%,与GPT-4Turbo1106版本相当。
长文本支持:模型支持高达1M tokens的上下文,即能处理约120万汉字的长文,通过增加上下文长度和合成数据,优化了长文档理解与智能体交互。
自主规划与工具调用:具备搜索和整合上百个网页信息的能力,通过MindSearch多智能体框架,模拟人的思维过程,有效整合网络信息。
文明上网,理性发言,共同做网络文明传播者