近日消息,自 POINT 1.0 版本成功发布至今已满两个月,腾讯公司今日正式宣布推出其升级版——POINTS 1.5。这一重要更新标志着腾讯在多模态大模型领域的持续进步与创新,为用户带来了更为出色的使用体验和功能拓展。
POINTS1.5 仍然沿用了 POINTS1.0 中使用的经典的 LLaVA 架构,由一个 vision encoder,一个 projector 和一个大语言模型组成。
据官方介绍,这一代 POINTS 模型,不仅兼顾了 POINTS1.0 中所坚持的效率优先的思想,同时极大了增强了模型的性能。
腾讯表示,POINTS1.5-7B 位居全球 10B 以下开源模型的榜首,超越诸如 Qwen2-VL, InternVL2 和 MiniCPM-V-2.5 等业界领先的模型。
实际应用方面,POINTS1.5 在复杂场景的 OCR,推理能力,关键信息提取,Latex 公式提取,数学,图片翻译,物体识别等几个方面中都有不错的表现。
文明上网,理性发言,共同做网络文明传播者