10月10日消息,2024 vivo开发者大会亮点频出,特别是在开幕式上,vivo隆重揭晓了其自主研发的创新“蓝核大模型矩阵”。这一突破性进展不仅标志着vivo在语言大模型和终端侧大模型技术上的全面跃升,还意味着vivo现已涉足自研语音识别、图像解析及多模态融合大模型领域,为用户带来前所未有的AI交互与智能体验革新。
据了解,全新蓝心大模型矩阵包括语言大模型、端侧大模型、语音大模型、图像大模型、多模态大模型。vivo 推出了全新的 30 亿蓝心端侧大模型 3B,官方称在对话写作、摘要总结、信息抽取等能力上,蓝心 3B 可以越级比肩行业 7B-9B 模型。相比蓝心 7B,蓝心 3B 极致性能提升 300%,平衡模式下功耗优化 46%,内存减小 63%,实现极致出词速度 80 字/s,系统功耗仅 450mA,内存占用仅 1.4GB。在 SuperCLUE 和 Equal Eval 的小模型综合能力评测中,蓝心 3B 均排名第 1,同时获得泰尔实验室端侧大模型综合能力认证以及 AIIA 安全防范能力认证。
vivo 还推出了全新自研的蓝心语音大模型,可以准确理解自然语义,模拟人声,表达情感,支持同声传译。
vivo 还升级了蓝心图像 & 多模态大模型,其中蓝心图像大模型强化了中国特色与东方美学的融合生成能力,官方称是国内最懂中文语境的图像模型之一,区别于其他的大模型,支持国风水墨,支持在图片生成过程中,增加汉字相关的创作;蓝心多模态大模型,今年升级了视觉的感知和理解能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。蓝心语音大模型、图像大模型和多模态大模型,在多家专业榜单上位列第一。
文明上网,理性发言,共同做网络文明传播者