当前位置：首页 > 资讯 > 科技 > 复旦与百度合作推出AI开源模型Hallo2，实现音频到4K长视频的转换

复旦与百度合作推出AI开源模型Hallo2，实现音频到4K长视频的转换

复旦大学 2024-10-21 09:53:08 爱吃爆米花

10月21日消息，复旦大学与百度共同推出了一款名为Hallo2的先进AI模型。这款模型具备生成长达数小时且分辨率高达4K的人物动画的能力，这在人工智能生成内容领域是一次重大的技术突破。

更令人兴奋的是，为了促进相关技术的发展和应用，研究团队已经将Hallo2开源，并将其代码托管到了GitHub上，供全球开发者学习、使用及贡献改进意见。此举不仅展示了中国科研机构与企业在AI创新方面的实力，也为推动全球范围内的人工智能发展做出了积极贡献。

Hallo2 模型建立在 latent diffusion models 的基础上，相比上一代 Hallo 模型的效果更好，支持了长视频生成，通过引入数据增强方法如 patch-drop 和高斯噪声，有效提高了长时间视频的视觉一致性和时间连贯性。

Hallo2 还结合了向量量化生成对抗网络和时间对齐技术，保证了高分辨率视频的质量和流畅性。

此外，Hallo2 将可调整的语义文本标签的肖像表情作为条件输入。这超出了传统的音频提示，可以提高可控性并增加所生成内容的多样性。项目页面介绍称，Hallo2 是第一种实现 4K 分辨率并生成长达 1 小时的音频驱动的人像图像动画的方法，并通过文本提示进行增强。

扩展阅读

复旦大学针对AI工具使用进行规范，“禁令”文件相继发布

复旦大学 01-12 07:39

来源：it之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/96352.html

文章标签

复旦大学百度

文明上网，理性发言，共同做网络文明传播者

提交

暂无评论内容