近日消息,在2024年的世界人工智能大会(WAIC)上,商汤科技确实展示了其创新的可控人物视频生成大模型——Vimi。
这款模型基于商汤科技在深度学习和视觉识别领域的前沿研究,它突破了传统视频生成技术的局限,允许用户仅凭一张静态图像就能创造出与指定动作相匹配的人物动态视频。
该模型支持多种驱动方式,包括视频、动画、声音和文字,具有多年积累的面部跟踪技术和对细节的精确控制能力,能够生成高一致性、光影和谐的视频内容。
Vimi的稳定性尤为突出,能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间劣化。它还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。此外,Vimi还支持光影变化模拟,为视频创作者提供丰富的创作自由度。
Vimi相机作为基于Vimi大模型的首款C端应用,主要面向广大女性用户,满足她们的娱乐创作需求。用户上传不同角度的高清人物图片后,Vimi相机能自动生成数字分身和不同风格的写真视频,提供多样化的生成风格。Vimi相机还支持通过单张图片生成趣味人物表情包,玩法多样,实现个性化创作。
目前,Vimi相机正开放内测,感兴趣的用户可以通过关注公众号并填写预约链接申请体验。
文明上网,理性发言,共同做网络文明传播者