近日消息,面壁智能推出了其最新端侧全模态模型MiniCPM-o 2.6,该模型以其8B的参数规模在多模态能力上与GPT-4o等业界领先模型相媲美,被称为“端侧GPT-4o”。
其采用了端到端多模态架构,可同时处理文本、图像、音频和视频等多种类型的数据,生成高质量文本和语音输出。官方表示,其总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、性能最佳的模型之一。
MiniCPM-o 2.6 支持可配置声音的中英双语语音对话,还具备情感 / 语速 / 风格控制、端到端声音克隆、角色扮演等进阶能力。
文明上网,理性发言,共同做网络文明传播者