当前位置: 首页 > 资讯 > 科技 > 腾讯混元文生图模型开源新篇章:三大ControlNet插件,重塑图像可控创造
  • 0
  • 0
  • 分享

腾讯混元文生图模型开源新篇章:三大ControlNet插件,重塑图像可控创造

腾讯 2024-08-18 10:07:40 爱吃爆米花

近日,腾讯混元文生图大模型(HunyuanDiT)再度展现创新实力,携手社区发布了三款新ControlNet插件:tile(针对图像高清放大的解决方案)、inpainting(实现图像修复与内容扩充的利器)以及lineart(专注于线稿生成的高效工具)。

这三大插件的加入,不仅丰富了ControlNet功能矩阵,也为用户提供了更广泛、更精细的创意控制能力,推动图像生成技术迈向新高度。

Tile插件能够为画面扩充信息,实现超清放大,甚至达到4K至8K的清晰度,适合对图片细节有极致追求的场景。Inpainting插件则能够根据创作者的需求填充图片中的涂抹和斑驳部分,实现背景更换、人物主体改变等效果,处理大面积的图像重绘。Lineart插件则利用不同线条类型创作真人、动漫和建筑图片,适用于建筑效果图生成和手稿上色。

此外,腾讯混元DiT此前已发布canny(边缘)、depth(深度)、pose(人体姿势)等条件的ControlNet模型,支持开发者进行推理,并开源了ControlNet的训练方案,使开发者和创作者能够训练自定义的ControlNet模型。

自5月宣布全面升级并开源以来,混元DiT作为业内首个中文原生的DiT架构文生图开源模型,持续建设开发者生态,发布了专属加速库,提升了推理效率,缩短了生图时间,并进一步开源了推理代码。7月,混元DiT升级至1.2版本,开源了小显存版本,仅需6G显存即可运行,对个人电脑本地部署的开发者更为友好。

目前,混元DiT在Github上的Star数已超过3.1k,成为最受欢迎的国产DiT开源模型。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/77409.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换