近日消息,英伟达的高级科学家Jim Fan在一篇专题博文中作出前瞻性预测,他表示机器人技术领域即将迎来其“GPT-3时刻”,预示着未来数年间该领域或将实现革命性进展,正如自然语言处理领域的GPT-3所带来的巨大变革。
Jim Fan 简介
Jim Fan 在斯坦福大学视觉实验室获得了博士学位,师从李飞飞教授。他的研究领域十分广泛,包括了多模态基础模型、强化学习以及计算机视觉,曾实习于谷歌云 AI、OpenAI、百度硅谷人工智能实验室等知名组织。
Jim Fan 目前在英伟达公司领导 AI 相关研究,其团队正致力于开发“Project Groot”,这是公司为创建人形机器人基础模型所做的努力。
未来两到三年的研究突破
Jim Fan 预测未来 2-3 年内,机器人基础模型的相关研究会出现重大突破,不过他也坦言机器人想要进入日常生活,还需要更长的时间。
在接受红杉资本的采访时,Fan 表示他期待机器人领域迎来一个“GPT-3 时刻”—— 即基础机器人模型取得突破,其影响力可与 GPT-3 在语言处理领域的影响相媲美。
翻译其观点如下:
要让机器人进入人们的日常生活,不仅仅是技术层面的问题。机器人需要价格亲民且能大规模生产,同时我们还需要硬件安全以及隐私和法规保障。
世界是围绕人类形态构建的,对吧?我们的餐厅、工厂、医院以及所有设备和工具 —— 它们都是为人类形态和双手设计的。
他认为,理论上,一台能力出众的人形机器人能够执行人类所能完成的任何任务,并预测人形机器人硬件的生态系统将在两到三年内准备就绪。
英伟达的机器人相关研究
英伟达在开发机器人人工智能时采用了三种数据类型的结合:互联网数据、模拟数据和真实世界机器人数据。Fan 博士强调了每种方法的优势与不足,并认为它们的结合是成功的关键。
英伟达正在研发诸如“Eureka”等技术,该技术利用语言模型生成机器人训练的奖励函数,实现自动化流程。
除了现实世界,范的团队还在研究用于视频游戏等虚拟环境的 AI 代理。他发现这些领域之间存在相似之处,并致力于开发一种长期内能同时控制虚拟和实体代理的统一模型。
文明上网,理性发言,共同做网络文明传播者