9月12日消息,法国人工智能领域的新秀Mistral公司宣布推出其首个多模态AI巨量模型——Pixtral 12B,该模型标志着其在技术上的重大突破,能够无缝融合图像和文本数据处理能力,为多模态应用场景开启了新纪元。
Pixtral 12B 模型拥有 120 亿参数,大小约为 24GB,参数大致对应于模型的解题能力,拥有更多参数的模型通常比参数较少的模型表现更优。
Pixtral 12B 模型基于文本模型 Nemo 12B 构建,能够回答关于任意数量、任意尺寸图像的问题。
与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等其他多模态模型类似,Pixtral 12B 理论上应能执行诸如为图像添加描述和统计照片中物体数量等任务。
用户可以下载、微调 Pixtral 12B 模型,并能依据 Apache 2.0 许可证使用。
Mistral 开发者关系负责人 Sophia Yang 在 X 平台的一篇帖子中表示,Pixtral 12B 很快将在 Mistral 的聊天机器人和 API 服务平台 Le Chat 及 Le Plateforme 上开放测试。
文明上网,理性发言,共同做网络文明传播者