10月10日消息,字节跳动的研究部门近期揭晓了其第二代革命性机器学习模型——GR-2(Generative Robot 2.0)。
该模型的一大突破在于引入了“智能萌芽期”学习机制,这一独特设计模拟人类从幼年逐步掌握复杂技能的过程,赋予了GR-2无与伦比的适应性与广泛的多任务处理能力,标志着机器学习领域向更高级别的自主学习与泛用性迈出重要一步。
GR-2 模型和其它很多 AI 模型一样,包括预训练和微调两个过程。
在预训练阶段,GR-2“观看”了多达 3800 万个来自各类公开数据集的互联网视频以及 500 亿个 tokens,涵盖了家庭、户外、办公室等多种日常场景,让 GR-2 具备在后续策略学习中跨越广泛机器人任务和环境的泛化能力。
在微调阶段,团队使用机器人轨迹微调了视频生成和动作预测,展现出卓越的多任务学习能力,在超过 100 个任务中实现了平均成功率 97.7%。
此外,GR-2 在新颖、之前未见的场景中表现出色的泛化能力,包括新的背景、环境、物体和任务。
文明上网,理性发言,共同做网络文明传播者