近日消息,腾讯正式揭晓了混元文生图大模型(混元DiT模型)的全面开源计划,不仅对外开放了珍贵的训练代码,还特别配套发布了LoRA与ControlNet两款高效插件,为AI生成艺术与多模态内容创作领域注入新活力。
这一举措无疑将促进创意技术的普及与革新,让开发者与艺术家们能更自由地探索文生图技术的无限可能。
LoRA 是一种用于微调大型语言模型的技术,可以在不修改原有模型或增加模型大小的情况下,利用少量数据训练出具有特定特征的模型。
ControlNet 是一种可控化生成算法,允许用户通过添加额外条件来更好地控制图像生成。腾讯混元提供了三个首发 ControlNet 模型,可以提取与应用图像的边缘、深度和人体姿势等条件。
此外,混元 DiT 发布了专属加速库,提升推理效率并简化使用方式。混元 DiT 已被广泛用于素材创作、商品合成、游戏出图等多个领域,包括腾讯广告妙思平台和多家媒体使用混元 DiT 模型进行内容生成。
文明上网,理性发言,共同做网络文明传播者