当前位置：首页 > 资讯 > 科技 > 月之暗面Kimi多模态图片理解模型API发布：开启图像理解新领域

月之暗面Kimi多模态图片理解模型API发布：开启图像理解新领域

月之暗面 2025-01-19 10:03:12 爱吃爆米花

近日消息，北京月之暗面科技有限公司做出了一项令人瞩目的举措，那就是全新推出多模态图片理解模型moonshot-v1-vision-preview。这一模型的诞生，对整个moonshot - v1模型系列而言意义非凡。

Vision模型具备强大的图像识别能力，能准确识别图像中的复杂细节和细微差别，无论是食物还是动物，都能区分出相似但不相同的对象。例如，面对16张相似的人眼较难区分的蓝莓松饼和吉娃娃图片，Vision模型能精确地区分和识别。

Vision模型还拥有国内领先的高级图像识别能力，在OCR文字识别和图像理解场景中表现优异，比普通文件扫描和OCR识别软件更加准确，能识别收据单、快递单等潦草的手写内容。

Vision视觉模型支持多轮对话、流式输出、工具调用、JSON Mode、Partial Mode等特性，但暂不支持联网搜索，不支持创建带有图片内容的Context Cache，但支持使用已创建成功的Cache调用Vision模型，不支持URL格式的图片，目前仅支持使用base64编码的图片内容。

扩展阅读

月之暗面推出Kimi k1.5多模态思考模型，达SOTA级多模态推理水准

月之暗面 01-21 09:25

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/110306.html

文章标签

月之暗面

文明上网，理性发言，共同做网络文明传播者

提交