机器人前瞻(公众号:robot_pro)
作者 | 王涵
编辑 | 漠影

机器人前瞻5月15日报道,今天,清华系物理世界模型创企LiberAI(将闲科技)宣布已连续完成种子轮、天使轮、天使+轮融资,融资金额累计数亿元,由真格基金、红杉中国、美团龙珠、顺为资本等联合押注。

LiberAI的CEO是清华大学00后特奖获得者刘松铭,据其规划,团队将从模型、数据、硬件层面布局全栈技术体系,聚焦物理智能方向,目标推出Scaling曲线最陡峭的世界模型。

一、清华特奖00后牵头,把物理规律注入世界模型

LiberAI的CEO刘松铭曾获得每年仅10人获得的清华特等奖学金,并且是清华计算机系年级第一。他师从机器学习领域专家朱军教授,著有RDT系列一作以及多篇国际顶会ICML、NIPS等一作。

00后清华特奖得主,融资数亿,雷军和王兴都投了

在2024年,刘松铭由AI for Physics领域转向具身智能,主导RDT系列,发布全球首个使用大规模预训练+扩散Transformer范式的基座模型RDT-1B。

00后清华特奖得主,融资数亿,雷军和王兴都投了

次年,他发布首个使用大规模UMI无本体人类数据预训练范式的具身模型RDT-2。在2025年年底,正在读博的刘松铭投身创业,带领LiberAI团队于4个月后发布首个高自由度灵巧操作具身基础模型。

目前,他带领团队提出LiberAI的世界模型路线,以Scaling斜率为指引,率先引入了模态对齐(让海量视频数据反哺稀缺的物理数据)与归纳偏置(把物理规律作为人类先验注入模型)这两个核心创新点。

LiberAI的联合创始人林凡淇师从清华大学高阳老师,林凡淇的一作论文《Data Scaling Laws In Imitation Learning For Robotic Manipulation》曾提出模型的泛化性随着数据的多样性增加而显著提升这一规律,获ICLR Oral、CoRL X-Embodiment Workshop Best Paper等荣誉。

00后清华特奖得主,融资数亿,雷军和王兴都投了

除模型研发与训练能力外,LiberAI团队的核心优势还体现在软硬件协同布局。该公司正推进模型与数据采集硬件的协同设计,聚焦高价值数据scale up。

二、引入模态对齐与归纳偏置,想要定义物理世界模型

在LiberAI团队看来,当前具身模型泛化性不足的重要原因是缺少因果建模关系,即因是力,果是运动状态。

因此,模型无法理解物理世界中的大小、位置和力,不符合人类与物理世界交互的第一性原理,缺少力的信息则势无法理解运动规律,无法理解运动规律则无法对世界施加精准的“反作用力”,无法和人一样丝滑地操作工具完成长程任务。

沿此思路,LiberAI团队提出了两大模型特点:

其一,强调模态对齐,构建因果关联:

LiberAI团队将物理模态与视频模态在因果层面对齐,其中视频承载物体的运动状态为“果”,物理数据则承载力与接触等核心信息为“因”。

借助视频模态的强泛化性,模态对齐可以提升物理模态的泛化能力,让少量物理数据撬动大规模视频数据,大幅降低数据成本、提升scaling速度。

第二,引入物理规律作为归纳偏置,加速模型收敛:

物理规律的引入,相当于给模型注入了人类的先验认知,帮模型圈定了正确的搜索范围,能够大幅加速模型的收敛速度。

“我们认为这是系统级的设计,要从模型、硬件、数采这些角度一起为物理模态设计专属数据、感知与编码器。这好像是在搭建机器人领域的encoder、tokenizer,并且确立一个清晰的评价标准。”创始人刘松铭在一次采访中谈道。

三、数采范式、高质量数据集与模型训练能力耦合

LiberAI团队认为,数据范式最关键的指标是scaling的边际成本,以及边际成本会随着scaling多快地下降。具体而言,数据scaling的曲线会分为两条,第一条是冷启动曲线,第二条是数据飞轮驱动的量产曲线

冷启动scaling曲线上,LiberAI团队选择押注基于人手的交互数据

这种方式最大的优势的是“无感、轻量、高效”,即采集过程不干扰人类正常操作,几乎可以采集人类可以完成的所有任务,且数据管理与培训成本趋近于零,边际成本极低。

从模型训练的价值贡献看,采集大规模人类物理数据是LiberAI团队提出“模态对齐”的重要前提。

LiberAI团队认为,在确立好行业目前空白的数据质量标准后,具备量产能力的玩家将率先走上第二条scaling曲线:数据飞轮。质量上乘、更Scalable的数据集,及相应数采硬件将构成具身领域的模型Infra。

2026年4月,LiberAI在成立的第4个月发布了首个技术Demo,这是全球首个高自由度灵巧操作的具身基础模型,搭载五指灵巧手实现双手剥香蕉、双手拧瓶盖、持锅颠勺等精细操作长程任务。

00后清华特奖得主,融资数亿,雷军和王兴都投了

结语:押注最陡峭的Scaling曲线

刘松铭认为,物理智能中的规划、记忆等各类智能能力,核心本质均落脚于纠错能力。模型的纠错能力强弱,决定了它距离物理世界的GPT-3有多近。真正的物理智能,应当具备自主识错、状态恢复、自我认知以及预判现实环境变化的能力。

刘松铭曾提到,LiberAI所做的并不仅仅是模型本身,而更接近于一种产品定义。像苹果一样,去定义世界模型的数采范式、本体及系统。

据其介绍,LiberAI团队长期发展目标聚焦于让物理AI走出demo、走出实验室,成为服务人类的“Physical Agent”,解决物理世界的实际问题。