00后清华特奖得主，融资数亿，雷军和王兴都投了

机器人前瞻（公众号：robot_pro）
作者 | 王涵
编辑 | 漠影

机器人前瞻5月15日报道，今天，清华系物理世界模型创企LiberAI（将闲科技）宣布已连续完成种子轮、天使轮、天使+轮融资，融资金额累计数亿元，由真格基金、红杉中国、美团龙珠、顺为资本等联合押注。

LiberAI的CEO是清华大学00后特奖获得者刘松铭，据其规划，团队将从模型、数据、硬件层面布局全栈技术体系，聚焦物理智能方向，目标推出Scaling曲线最陡峭的世界模型。

一、清华特奖00后牵头，把物理规律注入世界模型

LiberAI的CEO刘松铭曾获得每年仅10人获得的清华特等奖学金，并且是清华计算机系年级第一。他师从机器学习领域专家朱军教授，著有RDT系列一作以及多篇国际顶会ICML、NIPS等一作。

00后清华特奖得主，融资数亿，雷军和王兴都投了

在2024年，刘松铭由AI for Physics领域转向具身智能，主导RDT系列，发布全球首个使用大规模预训练+扩散Transformer范式的基座模型RDT-1B。

00后清华特奖得主，融资数亿，雷军和王兴都投了

次年，他发布首个使用大规模UMI无本体人类数据预训练范式的具身模型RDT-2。在2025年年底，正在读博的刘松铭投身创业，带领LiberAI团队于4个月后发布首个高自由度灵巧操作具身基础模型。

目前，他带领团队提出LiberAI的世界模型路线，以Scaling斜率为指引，率先引入了模态对齐（让海量视频数据反哺稀缺的物理数据）与归纳偏置（把物理规律作为人类先验注入模型）这两个核心创新点。

LiberAI的联合创始人林凡淇师从清华大学高阳老师，林凡淇的一作论文《Data Scaling Laws In Imitation Learning For Robotic Manipulation》曾提出模型的泛化性随着数据的多样性增加而显著提升这一规律，获ICLR Oral、CoRL X-Embodiment Workshop Best Paper等荣誉。

00后清华特奖得主，融资数亿，雷军和王兴都投了

除模型研发与训练能力外，LiberAI团队的核心优势还体现在软硬件协同布局。该公司正推进模型与数据采集硬件的协同设计，聚焦高价值数据scale up。

二、引入模态对齐与归纳偏置，想要定义物理世界模型

在LiberAI团队看来，当前具身模型泛化性不足的重要原因是缺少因果建模关系，即因是力，果是运动状态。

因此，模型无法理解物理世界中的大小、位置和力，不符合人类与物理世界交互的第一性原理，缺少力的信息则势无法理解运动规律，无法理解运动规律则无法对世界施加精准的“反作用力”，无法和人一样丝滑地操作工具完成长程任务。

沿此思路，LiberAI团队提出了两大模型特点：

其一，强调模态对齐，构建因果关联：

LiberAI团队将物理模态与视频模态在因果层面对齐，其中视频承载物体的运动状态为“果”，物理数据则承载力与接触等核心信息为“因”。

借助视频模态的强泛化性，模态对齐可以提升物理模态的泛化能力，让少量物理数据撬动大规模视频数据，大幅降低数据成本、提升scaling速度。

第二，引入物理规律作为归纳偏置，加速模型收敛：

物理规律的引入，相当于给模型注入了人类的先验认知，帮模型圈定了正确的搜索范围，能够大幅加速模型的收敛速度。

“我们认为这是系统级的设计，要从模型、硬件、数采这些角度一起为物理模态设计专属数据、感知与编码器。这好像是在搭建机器人领域的encoder、tokenizer，并且确立一个清晰的评价标准。”创始人刘松铭在一次采访中谈道。

三、数采范式、高质量数据集与模型训练能力耦合

LiberAI团队认为，数据范式最关键的指标是scaling的边际成本，以及边际成本会随着scaling多快地下降。具体而言，数据scaling的曲线会分为两条，第一条是冷启动曲线，第二条是数据飞轮驱动的量产曲线。

在冷启动scaling曲线上，LiberAI团队选择押注基于人手的交互数据。

这种方式最大的优势的是“无感、轻量、高效”，即采集过程不干扰人类正常操作，几乎可以采集人类可以完成的所有任务，且数据管理与培训成本趋近于零，边际成本极低。

从模型训练的价值贡献看，采集大规模人类物理数据是LiberAI团队提出“模态对齐”的重要前提。

LiberAI团队认为，在确立好行业目前空白的数据质量标准后，具备量产能力的玩家将率先走上第二条scaling曲线：数据飞轮。质量上乘、更Scalable的数据集，及相应数采硬件将构成具身领域的模型Infra。

2026年4月，LiberAI在成立的第4个月发布了首个技术Demo，这是全球首个高自由度灵巧操作的具身基础模型，搭载五指灵巧手实现双手剥香蕉、双手拧瓶盖、持锅颠勺等精细操作长程任务。

00后清华特奖得主，融资数亿，雷军和王兴都投了

结语：押注最陡峭的Scaling曲线

刘松铭认为，物理智能中的规划、记忆等各类智能能力，核心本质均落脚于纠错能力。模型的纠错能力强弱，决定了它距离物理世界的GPT-3有多近。真正的物理智能，应当具备自主识错、状态恢复、自我认知以及预判现实环境变化的能力。

刘松铭曾提到，LiberAI所做的并不仅仅是模型本身，而更接近于一种产品定义。像苹果一样，去定义世界模型的数采范式、本体及系统。

据其介绍，LiberAI团队长期发展目标聚焦于让物理AI走出demo、走出实验室，成为服务人类的“Physical Agent”，解决物理世界的实际问题。

一、清华特奖00后牵头，把物理规律注入世界模型

二、引入模态对齐与归纳偏置，想要定义物理世界模型

三、数采范式、高质量数据集与模型训练能力耦合

结语：押注最陡峭的Scaling曲线

相关推荐