当前位置: 首页 > 资讯 > 科技 > 英伟达发布首个生成式世界基础模型Cosmos,推动物理AI系统发展进程
  • 0
  • 0
  • 分享

英伟达发布首个生成式世界基础模型Cosmos,推动物理AI系统发展进程

英伟达(NVIDIA) 2025-01-08 09:27:08 爱吃爆米花

近日消息,在2025年的消费电子展(CES)上,NVIDIA推出了全新的Cosmos平台。这个平台的目标在于加快物理人工智能(AI)系统的开发速度,特别是针对自主驾驶车辆以及机器人领域。

Cosmos 平台将以开放模型许可的形式在 Hugging Face 和 NVIDIA NGC 目录中提供,后续将推出经过优化的 NVIDIA NIM 微服务,并通过 NVIDIA AI 企业软件平台提供企业支持。

NVIDIA 首席执行官黄仁勋在展会上表示:“机器人技术即将迎来像 ChatGPT 那样的转折时刻。与大型语言模型一样,世界基础模型是推动机器人和自主驾驶车辆发展的核心,但并非所有开发者都有能力和资源来训练自己的模型。我们创建 Cosmos 就是为了让物理 AI 的开发更加普及,让每个开发者都能接触到通用机器人技术。”

Cosmos 模型可以根据文本、图像和传感器数据生成基于物理的高清视频,使其适用于视频搜索、合成数据生成和强化学习等应用。开发者能够定制模型以模拟工业环境、驾驶场景以及其他特定用例。此外,NVIDIA 还推出了 NeMo Curator,这是一个加速视频处理管道,能够在14天内处理2000万小时的视频数据,以及 Cosmos Tokeniser,这是一个视觉数据压缩工具。

Agility Robotics 的首席技术官 Pras Velagapudi 指出:“数据稀缺性和变异性是机器人环境成功学习的关键挑战。Cosmos 的文本、图像和视频到世界的能力使我们能够生成和增强各种任务的场景,从而在不需要过多昂贵的真实数据捕获的情况下训练模型。”

多家主要的机器人和运输公司,包括 Agile Robots、XPENG、Waabi 和 Uber,已经开始采用 Cosmos 进行 AI 开发。Uber 首席执行官 Dara Khosrowshahi 表示:“生成式 AI 将驱动未来的出行,既需要丰富的数据,也需要强大的计算能力。通过与 NVIDIA 的合作,我们有信心帮助加速安全、可扩展的自主驾驶解决方案的进程。”

除了 Cosmos,NVIDIA 还推出了 Llama Nemotron 大型语言模型和 Cosmos Nemotron 视觉语言模型,专为医疗、金融和制造等行业的企业使用而开发。

来源:站长之家
免责声明:本内容来自互联网,不代表本网站的观点和立场,如有侵犯你的权益请来信告知;如果你觉得好,欢迎分享给你的朋友,本文网址 https://wangzhidaquan.com/zixun/108821.html
文章标签
评论

文明上网,理性发言,共同做网络文明传播者

验证码
提交
热榜
热门游戏
换一换
热门软件
换一换