近日消息,全球领先的人工智能企业商汤科技在2024世界人工智能大会上,隆重推出了其最新研发成果——Vimi,一款革命性的可控人物视频生成算法模型。
Vimi的亮相不仅标志着商汤科技在AI视频生成领域的又一里程碑,更因其卓越的性能和创新性,被评选为本届大会的“镇馆之宝”。
Vimi作为商汤科技基于其强大的日日新大模型能力研发的产物,实现了前所未有的视频生成灵活性。它能够灵活接收来自动作视频、精美动画、丰富声音素材乃至文字描述的多元化输入,作为驱动元素,精准地操控并转化人物类图片,最终生成与目标动作完美匹配的人物视频。这一过程不仅展现了AI技术对于复杂场景的高度适应性,也体现了商汤在视频生成技术上的深厚积累。
尤为值得一提的是,Vimi在可控性上的卓越表现。它超越了传统图片表情控制技术的局限,不仅能够细腻地调整人物的表情变化,更实现了对肢体动作的精准操控。这一突破性的能力使得Vimi能够生成出既符合逻辑又生动自然的视频内容,同时,在头发、服饰、背景等细节处理上也达到了前所未有的精细度,支持光影的自然变化,为观众带来沉浸式的视觉体验。
在视频生成的稳定性与时长上,Vimi同样展现出了非凡的实力。它能够稳定地生成长达1分钟的单镜头人物视频,这一成就突破了现有大模型AI视频生成在时长上的限制。更重要的是,随着视频时长的增加,Vimi生成的视频画面质量始终保持如一,不会出现劣化或失真的情况,确保了视频内容的连贯性和高质量。
文明上网,理性发言,共同做网络文明传播者