当前位置: 首页 > 资讯 > 科技 > 腾讯公布开源项目V-Express:革新视频生成,人像照片转视频技术再升级
  • 0
  • 0
  • 分享

腾讯公布开源项目V-Express:革新视频生成,人像照片转视频技术再升级

腾讯 2024-06-09 09:01:58 爱吃爆米花

近日,腾讯对外发布了其最新研究成果——V-Express人像照片动画化模型,该技术通过精细的信号调控策略,在处理人像照片转化为动态视频过程中展现了卓越的性能,特别优化了对细微音频信号的捕捉与同步,确保了视频生成中姿态、源图像及音频信号的和谐统一,标志着人像转化技术的一大飞跃。

作者团队表示,在会说话的人脸生成任务中,当目标视频与参考角色不是同一个人时,选择与参考人脸姿势更相似的目标视频将能获得更好的效果。目前,该模型在英语上的表现较为出色,但对其他语言的适应性和表现尚未经过详细测试。

V-Express模型的开源,为肖像视频生成领域带来了新的发展机遇。在这一领域,使用单个图像生成视频的方法正变得日益流行。这通常涉及到使用生成模型增强适配器来实现受控生成,其中控制信号可能包括文本、音频、图像参考、姿势、深度图等。V-Express通过渐进式的丢弃操作,解决了弱信号在强信号干扰下难以发挥作用的问题,尤其是在音频信号常常被姿势和原始图像等强信号掩盖的情况下。

实验结果显示,V-Express能够有效生成受音频控制的肖像视频,这在以往的研究中是一个难以实现的突破。V-Express方法的逐步丢弃操作,不仅有效实现了对弱条件的控制,而且为多条件生成提供了新的可能性和思路。

V-Express模型为肖像视频生成领域带来了创新的思路和方法,通过平衡不同强度的控制信号,成功实现了受音频控制的视频生成。这一成果不仅具有重要的理论和实践意义,而且为未来的多条件生成提供了新的路径。腾讯表示,将继续深入研究V-Express方法,并探索其在更广泛领域的应用,以促进肖像视频生成领域的进一步发展。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/52843.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热门游戏
换一换
热门软件
换一换