当前位置：首页 > 资讯 > 科技 > Meta革新视觉生成技术：ViewDiff模型实现文本驱动多角度3D成像

0
0
分享

Meta革新视觉生成技术：ViewDiff模型实现文本驱动多角度3D成像

Meta 2024-04-15 09:43:23 爱吃爆米花

4月15日消息，Meta携手慕尼黑工大共创ViewDiff模型，赋能用户以文本、图像或两者交融的方式，顷刻间构建出高清立体的多视角三维景象。

该模型解决了传统文本生成多视角3D 图像领域的三大难点：无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。通过引入一种创新架构，ViewDiff 采用文生成图模型作为先验知识和图像流生成器，再通过显式的3D 建模为图像赋予一致性和多视角能力。

为了有效捕获3D 几何和全局风格，研究人员对原有 U-Net 架构进行了创新，增强了跨帧注意力层和投影层。跨帧注意力层替换了标准自注意力层，实现跨图像风格匹配；而投影层将多视图2D 特征集成为显式的3D 体素特征，保证了输出图像的3D 几何一致性。在此基础上，ViewDiff 还开发了自回归生成模块，使其能在任意视角上生成更多的3D 一致性图像，进一步提升了模型的生成能力。

该研究的推出填补了文本生成多视角3D 图像领域的技术空白，有望为游戏开发、元宇宙等行业提供更便捷、高效的模型构建方案。该模型的推出不仅在技术层面上具有重大意义，也将为未来的3D 图像生成领域带来更多创新可能。

扩展阅读

每日科技早报｜Meta因触犯欧盟反垄断规则遭罚近8亿欧元，京东Q3营收突破2600亿元

每日科技早报｜Meta因触犯欧盟反垄断规则遭罚近8亿欧元，京东Q3营收突破2600亿元

Meta 8天前

来源：站长之家

免责声明：本内容来自互联网，不代表本网站的观点和立场，如有侵犯你的权益请来信告知；如果你觉得好，欢迎分享给你的朋友，本文网址 https://wangzhidaquan.com/zixun/34708.html

文章标签

Meta

评论

文明上网，理性发言，共同做网络文明传播者

验证码

提交

猜你喜欢

孩子理发嫌太贵，原价138元，母亲坚持仅支付24元

微博评论：0 2024-04-15
【2024-11-22】今日互联网辟谣一览，中国资源循环集团并未发放原始股

互联网辟谣榜评论：0 2024-11-22

最新

每日科技早报｜Meta因触犯欧盟反垄断规则遭罚近8亿欧元，京东Q3营收突破2600亿元

Meta 评论：0 2024-11-15
Meta展示最新机器人触觉感知技术：通过手指传感器与AI大脑实现物体理解和操作

Meta 评论：0 2024-11-10
Meta AI发布思维偏好优化技术，旨在提高AI模型的响应质量

Meta 评论：0 2024-11-05
Meta发布Llama 3.2 1B/3B量化模型：降低功耗，适配更多轻量级移动设备

Meta 评论：0 2024-10-28
Meta重启面部识别技术，强力打击“假名人”诈骗行为

Meta 评论：0 2024-10-22

显示更多

热榜

百度热搜微博热搜抖音热搜

1制片人晒王宝强转账记录，称遭遇农夫和蛇

2突发！国际刑事法院对内塔尼亚胡发逮捕令

3麦琳李行亮热气球旅行，在热气球前再次求婚

4最新，马斯克公布大规模“政府裁员计划”

5百雀羚旗舰店日销售额涨500%，涉事产品无违规

6普京证实：对乌发射新型中程导弹

7朝鲜半岛局势恶化，战争一触即发

8《黑神话：悟空》荣获2024金摇杆年度终极游戏大奖，创造中国游戏历史

热门游戏

第五人格
手游 / 角色扮演
去下载
王者荣耀
手游 / 角色扮演
去下载

换一换

热门软件

微信
应用 / 社交
去下载
支付宝
应用 / 工具
去下载
抖音
应用 / 视频
去下载

换一换