当前位置：首页 > 资讯 > 科技 > 谷歌DeepMind最新突破：AI赋能静默视频，自动生成匹配音频解说

谷歌DeepMind最新突破：AI赋能静默视频，自动生成匹配音频解说

谷歌（Google） 2024-06-19 10:30:52 爱吃爆米花

6月18日消息，DeepMind宣布了一项创新成果，即一种先进的人工智能技术，能够让无声音频的视频片段焕发新生，通过自动生成恰到好处的背景乐曲，为沉默的画面添上和谐的音符，这一技术被命名为“video-to-audio”音轨创造者。

当前 DeepMind 这款 AI 模型依然存在局限性，需要开发者使用提示词为模型预先“介绍”视频可能的声音，暂时不能直接根据视频画面添加具体音效。

据悉，该模型首先会将用户输入的视频进行拆解，此后结合用户的用户文字提示，利用扩散模型反复运算，最终以生成与视频画面协调的背景声音，例如输入一条“在黑暗中行走”的无声视频，再添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文字提示，相关模型就能生成恐怖风格的背景音效。

DeepMind 同时表示，该“video-to-audio”模型可以为任何视频生成无限数量的音轨，还能够通过提示词内容判断生成的音频“正向性”或“反向性”，从而令生成的声音更贴近某些特定场景。

展望未来，DeepMind 表示研究人员正进一步优化这款“video-to-audio”模型，计划未来能够让模型直接根据视频内容，无须通过提示词即可生成视频背景音，同时还将改善视频中人物对白的口型同步能力。

扩展阅读

《谷歌Chrome浏览器》无需扩展，拆分标签页功能进入测试阶段

谷歌（Google） 01-24 15:50

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/56991.html

文章标签

Google谷歌

文明上网，理性发言，共同做网络文明传播者

提交

暂无评论内容