当前位置：首页 > 资讯 > 科技 > 阿里巴巴国际发布Ovis多模态大模型新成果：一图即得烹饪秘籍

阿里巴巴国际发布Ovis多模态大模型新成果：一图即得烹饪秘籍

阿里巴巴 2024-09-28 09:26:21 爱吃爆米花

近日消息，阿里国际AI团队骄傲地宣布了他们的最新成果——多模态大模型Ovis，为各行各业的智能化转型铺设了新的道路。Ovis凭借其在图像解析与数据分析领域的卓越性能，为业界注入了一股新鲜活力，开启了AI应用的新篇章。

Ovis 的多模态能力极其强大，它能够处理文本、图像等多种数据，展现出优秀的综合实力。与传统的大语言模型相比，Ovis 不仅能理解文本，还能对图像等非文本信息进行深入分析。

比如说，用户只需上传一张菜品的照片，Ovis 便能迅速识别并提供详细的烹饪步骤，帮助用户轻松做出美味佳肴。

根据多模态评测平台 OpenCompass 的数据，Ovis1.6-Gemma2-9B 在30B 参数以下的模型中，取得了综合排名第一，超越了 MiniCPM-V-2.6等一系列优秀模型。这项成就证明了 Ovis 在市场中的竞争力。

此外，Ovis 在数学推理、物体识别和复杂决策等领域表现出色。例如，它能精准地解答数学题、识别花卉品种，甚至在手写文本的翻译上也毫不逊色。Ovis 的五大核心优势中，最引人关注的是其创新的架构设计和高分辨率图像处理能力，使得它在多模态任务中的表现大幅提升。

Ovis 的开源策略同样令人称道。它的 License 采用 Apache2.0协议，意味着用户可以自由使用和改进这个模型。Ovis 系列的模型和代码都已在 GitHub 上开源，开发者们可以轻松获取并进行二次开发。

在自动驾驶、医疗诊断、视频内容理解等广泛应用场景中，多模态大模型 Ovis 都显示出了巨大的潜力。阿里国际团队透露，近半年的数据显示，商家对 AI 的需求不断增长，平均每两个月调用量翻一番，Ovis 无疑将助力更多商家提升运营效率。

扩展阅读

阿里巴巴昨天

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/89691.html

文章标签

阿里巴巴

文明上网，理性发言，共同做网络文明传播者

提交