当前位置: 首页 > 资讯 > 科技 > 微软Phi-3-vision性能比拼:与Claude 3-haiku、Gemini 1.0 Pro齐头并进的基准测试结果
  • 0
  • 0
  • 分享

微软Phi-3-vision性能比拼:与Claude 3-haiku、Gemini 1.0 Pro齐头并进的基准测试结果

微软(Microsoft) 2024-05-28 09:39:35 爱吃爆米花

5月28日消息,微软在年度Build开发者盛会上揭晓了Phi-3系列的最新力作——Phi-3-vision,该产品亮点聚焦于“先进视觉识别技术”,能够深入解析图像与文本信息,且令人瞩目的是,它被设计成即便在移动设备上也能确保流畅且资源高效的运行体验。

Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。

那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。

微软在论文中对比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的参数虽然不多,但性能非常优秀。

微软提供了 Phi-3-vision 相较于字节跳动 Llama3-Llava-Next(8B)、微软研究院和威斯康星大学、哥伦比亚大学合作的 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 模型等竞品模型的比较图表,其中显示 Phi-3-vision 模型在多个项目上表现优异。

来源:it之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/48293.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换