近日消息,智谱AI在知识发现与数据挖掘领域的顶级会议KDD 2024上,骄傲地推出了他们的新一代基础模型,宣称该模型在相关领域已跻身国际顶尖水平。
更令人振奋的是,他们决定在MaaS平台上无偿开放GLM-4-Flash API的使用权,此举无疑将促进AI技术的普及与创新合作,为研究人员和开发者提供强大的工具支持,加速AI技术在各行各业的应用探索和实践。
语言模型 GLM-4-Plus:在语言理解、指令遵循、长文本处理等方面性能得到全面提升。
文生图模型 CogView-3-Plus:具备与当前最上面的 MJ-V6 和 FLUX 等模型接近的性能。
图像 / 视频理解模型 GLM-4V-Plus:具备卓越的图像理解能力,并具备基于时间采集的视频理解能力。该模型将上线开放平台(bigmodel.cn),并成为国内首个通用视频理解能力模型 API。
视频生成模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源,其性能进一步增强。
GLM-4-Flash API:推理服务免费,并提供完全强大的服务。
除此之外,智谱还宣布在清言 App 上线了视频通话功能,这是国内首个面向 C 端用户开放的视频通话服务。
智谱表示,GLM-4-Plus 基础模型在各项指标上,实现与 GPT-4o 等第一梯队模型持平。此外,在 GLM-4-Plus 模型的训练过程中,智谱通过采用更精准的长短文本数据混合策略,显著增强了模型在长文本推理方面的表现。
对于 CogView-3-Plus,智谱采用 Transformer 架构替代了传统的 UNet 架构来训练扩散模型,并深入研究了扩散模型的噪声规划,其效果目前接近一线水平的 MJ-V6 和 FLUX 等模型。
目前 GLM-4-Plus 模型已正式上线开放平台(bigmodel.cn),对外提供 API 服务;同时也即将在清言 App 中上线;CogView-3-Plus 模型已经正式上线清言 App 供大家使用。
文明上网,理性发言,共同做网络文明传播者