近日,腾讯混元文生图大模型(HunyuanDiT)再度展现创新实力,携手社区发布了三款新ControlNet插件:tile(针对图像高清放大的解决方案)、inpainting(实现图像修复与内容扩充的利器)以及lineart(专注于线稿生成的高效工具)。
这三大插件的加入,不仅丰富了ControlNet功能矩阵,也为用户提供了更广泛、更精细的创意控制能力,推动图像生成技术迈向新高度。
Tile插件能够为画面扩充信息,实现超清放大,甚至达到4K至8K的清晰度,适合对图片细节有极致追求的场景。Inpainting插件则能够根据创作者的需求填充图片中的涂抹和斑驳部分,实现背景更换、人物主体改变等效果,处理大面积的图像重绘。Lineart插件则利用不同线条类型创作真人、动漫和建筑图片,适用于建筑效果图生成和手稿上色。
此外,腾讯混元DiT此前已发布canny(边缘)、depth(深度)、pose(人体姿势)等条件的ControlNet模型,支持开发者进行推理,并开源了ControlNet的训练方案,使开发者和创作者能够训练自定义的ControlNet模型。
自5月宣布全面升级并开源以来,混元DiT作为业内首个中文原生的DiT架构文生图开源模型,持续建设开发者生态,发布了专属加速库,提升了推理效率,缩短了生图时间,并进一步开源了推理代码。7月,混元DiT升级至1.2版本,开源了小显存版本,仅需6G显存即可运行,对个人电脑本地部署的开发者更为友好。
目前,混元DiT在Github上的Star数已超过3.1k,成为最受欢迎的国产DiT开源模型。
文明上网,理性发言,共同做网络文明传播者