机器人前瞻(公众号:robot_pro)
作者|葛文婷
编辑|漠影

机器人前瞻4月3日报道,当地时间4月2日,美国AI机器人公司Generalist AI发布了最新具身基础模型——GEN-1。

GEN-1基于50万小时预训练数据,不仅把任务平均成功率从上一代模型的64%提升至99%、将机器人工作速度提高了近3倍、还能能够让新任务的适配数据需求大幅降,仅需1小时机器人数据就能完成单项训练任务。

Generalist AI由前谷歌DeepMind高级研究科学家Pete Florence创立,核心团队汇聚了来自波士顿动力、OpenAI、Waymo等顶尖公司的资深研究人员。该公司致力于“让通用机器人成为现实”,目前已获得英伟达旗下风投机构NVentures、Spark Capital、Boldstart Ventures、Bezos Expeditions以及NFDG等知名机构的投资,估值突破3亿美元(约合人民币20亿元)。

值得注意的是,距离其推出第一代基础模型GEN-0,才过去不到半年

一、1小时数据即可训练机器人完成单项任务,预训练数据超50万

GEN-0是该公司推出的第一款专注于多模态训练的基础模型,它的出现首次证明了机器人领域同样遵循scaling law,并验证了机器人通用化、规模化提升的可行性,但当时该模型的表现尚未达到商用标准。

而如今的GEN-1是Generalist AI在机器人学习扩展领域的最新成果,相较于GEN-0,GEN-1在任务执行速度成功率处理效率应变能力以及训练数据集五个维度上均实现了显著跨越:

1、速度倍增: GEN-1的执行速度达到GEN-0的三倍。

2、成功率质变: 任务平均成功率由64%大幅提升至99%。

3、效率优化: 训练机器人完成单项任务仅需1小时机器人数据。

4、应变能力强: 具备意外情况下的自我恢复能力,展现出一定的临场应变能力。

5、数据扩容: 预训练数据从之前的27万小时扩展到50 万小时高保真操作,涵盖全球数千个家庭、仓库、工厂、面包店、自助洗衣店等场景,数据运营每周新增超过 1 万小时。

在测试中,GEN-1无需人工干预,便能长时间稳定完成多项任务,包括:

  • 持续1小时以上的汽车配件分拣;

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

  • 连续折叠86件T恤;

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

  • 连续完成200余次扫地机器人维护;

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

  • 连续完成1800余次积木装箱;

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

  • 连续折叠纸箱超过200次

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

  • 连续打包手机超过100次等。

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

上述任务的成功率均突破了99%

其中,在维护扫地机器人任务中,GEN-1 平均成功率达到 99%,而 GEN-0 仅 50%;折叠纸盒任务上,GEN-1 达到 99%,而GEN-0为 81%;在手机装盒任务上,GEN-1 达到 99%,GEN-0 为 62%。作为对比,没有经过预训练的GEN-0,平均成功率只有 19%

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

▲GEN-1、GEN-0和未经训练的GEN-0在维护扫地机器人任务中的平均成功率

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

▲GEN-1、GEN-0和未经训练的GEN-0在折叠纸箱任务中的平均成功率

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

▲GEN-1、GEN-0和未经训练的GEN-0在打包手机任务中的平均成功率

二、工作速度提升3倍,还能随机应变处理突发意外

在速度上,GEN-1打破了机器人领域长期存在的“速度屏障”

以折叠纸盒为例,GEN-0及同期其他模型(如π0)耗时约34秒,而GEN-1将这一时间压缩至12秒速度提升2.8倍。在手机装盒任务中,GEN-1仅需15.5秒,同样是GEN-0的2.8倍,任务完成速度达到行业最优水平的3倍左右。

更关键的是,GEN-1的作业速度已超越人类演示水平,能在高速状态下精准适配物体的物理特性,并做出实时响应。

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

据悉,GEN-1速度突破的核心支撑源于三大技术协同

1、经验学习(RL): 模型通过经验迭代自主优化动作效率,实现高速执行。

2、Harmonic Reasoning推理架构升级: 全新的推理架构大幅提升了实时决策效率。

3、高质量预训练数据: 通过低成本可穿戴设备采集海量人类行为数据进行训练,实现知识迁移。

另外,GEN-1的另一大亮点在于其“随机应变”能力

当工作中遇到突发意外(如分拣时零件被撞歪),GEN-1也不会傻傻地僵在原地等待人工调试,而是能自主选择多种应对方案 ,例如将垫片放回重抓,或借助卡槽将歪斜的零件复位。面对更复杂的情况,它甚至能调用另一只手实现双手协同,顺利完成工作。

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

▲GEN-1可以自主处理突发意外

12秒折完一个纸箱,速度快三倍,Generalist AI最强具身模型发布了!

▲GEN-1可以协同双手完成复杂任务

这种能力让GEN-1能够灵活面对各种超出训练范围的突发行为,有效解决各类长尾问题,保障任务的稳定推进。

结语:GEN-1并非完美无缺,GEN系列的研发之路仍任重而道远

GEN-1将任务平均成功率从64%提升至99%,标志着通用智能机器人在灵巧操作领域取得了重大突破。

不过需要强调的一点是:GEN-1 并非完美无缺。

我们需要清楚的认识到,尽管GEN-1在多项灵巧操作任务中已实现99%的成功率,但它并非所有的测试任务都能达到这一水准,在部分工业落地场景中,模型仍需更高的成功率与执行效率才能实现实用化部署,这些都是当前版本亟待补强的短板。

对此,Generalist AI 团队已明确研发方向并展现出充足信心,他们将致力于让下一代模型解锁更广泛、更复杂的任务能力,并持续优化模型结构,进一步降低机器人单项任务的数据需求。