近日消息,腾讯公司正式宣布,备受瞩目的混元大模型现已正式上线,并且其强大的文生视频功能已经对外开源。这一模型拥有高达130亿的参数量,能够处理复杂的任务和数据。更值得一提的是,它还支持中英文双语输入,为用户提供了更为广泛和便捷的操作体验。
官方宣称,腾讯混元视频生成大模型可以生成“超写实的”高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。
据介绍,腾讯混元视频生成大模型采用 DiT 架构,适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。
在“腾讯元宝 App”,进入“AI 应用”,选择“AI 视频”,可申请试用。
腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。
文明上网,理性发言,共同做网络文明传播者