机器人前瞻(公众号:robot_pro)
作者 | 许丽思
编辑 | 漠影

在美团紧锣密鼓布局具身智能的同时,一批从美团走出的技术大牛,正将工程与商业经验带向更贴近物理世界的新战场。

前美团外卖技术负责人王栋,就是其中之一。离开美团后,调侃自己有种“老干部退休”感的王栋,没有继续做平台软件或者AI应用,而是转身进入了具身智能赛道。

这个选择并不突然,王栋在人工智能领域已经有近20年的积累。

王栋本科、博士均毕业于清华大学,博士师从中国人工智能泰斗、清华大学张钹院士,长期聚焦于人工智能表示问题。

张钹院士推崇自由探索,也为学生创造了大量海外访问和国际合作机会。得益于这种开放的国际视野,王栋极早就触碰到了机器人的前沿研究。2006年,他曾与汉堡大学张建伟教授合作,在IROS发表关于视觉方法结合机器学习进行机器人抓取的论文。

2011年,王栋搭建出全球首个商用视频人脸识别与跟踪系统;2014年进入美团后,王栋长期深耕推荐、搜索、广告、大数据等AI核心应用场景,构建出业界领先的本地生活服务推荐系统及移动原生广告平台。

真正让他决定下场创业的,是一个更长期的判断:如果人工智能不能进入物理世界感知、行动和获取认知,它就很难真正走向更高层次的智能。所以,具身智能是AGI的必由之路。

今年3月底,元节智能(Atombite)在北京注册成立,聚焦于面向餐饮场景的世界动作模型,并且选择先从外卖打包环节切入。

“人最好能做自己既擅长、又感兴趣、同时对社会有帮助的事情。”王栋说。

成立不到两个月后,元节智能就完成千万级种子轮融资,由英诺科创基金领投,水木清华校友种子基金、知名投资人个人跟投。王栋回忆,前后调研大半年,看了很多方向,刚确定创业方向,产品demo都还没做出来,投资人听了构想,20分钟后就拍板决定投资。

在我们与王栋的对话中,美团始终是绕不开的关键词。美团给王栋留下的,不仅是技术、商业与组织的方法论,更是一种在早期做外卖时、于巨大不确定性中死磕往前冲的勇气。

过去,美团解决了怎么把餐送出去的问题;现在,王栋想把具身智能带进后厨,从打包出餐接驳的一个个小问题开始,最终以智能化真正改变餐饮行业的供给侧,让AI不仅能会琴棋书画,也懂柴米油盐,更具烟火气和生活感。

一、餐厅后厨,是具身智能应该落地的地方

离开美团后,王栋没有急于开启创业,而是花了很长时间在海外考察。在海外餐厅后厨,他发现,全球外卖订单攀升,餐已经可以高效送出去,但餐厅内部的制作、打包和出餐,依然高度依赖人力。

尤其北美市场的餐饮行业,长期面临招人难的问题,后厨工作重复、辛苦,人员流动性高。北美不少快餐店员工时薪已经超过20美元,人力成本正在变成餐厅越来越重的固定支出。

这让王栋更加认定,餐厅后厨,就是具身智能亟需落地的地方。

回国后,王栋快速组建起了团队,核心成员来自清华、中科大、美团、地平线,兼具深厚的技术底层与多年的商业化实战经验。

其中,联合创始人李滔,曾执掌美团外卖算法与数据体系,是少数真正跑通全链路数据驱动的人;联合创始人李浩哲,连续创业者,多年全球化商业落地经验。

王栋强调,元节智能要做“有准备的团队”,其核心方法论是“不为算法找数据,而是为数据找算法”。

相比于先选定算法、认定了一套世界观后,再去匹配数据的“学院派”做法,元节智能的思路是“场景先行”——现实场景中已经存在明确的痛点,团队要做的是先尽可能完整地收集该场景中的真实数据,再从数据中寻找最适合的具身解决方案。

现在入局具身智能,是否还算是好时候?王栋拿外卖行业作类比:2012年前后,外卖赛道最火的平台是到家美食荟,饿了么已经创立4年,而美团在2014年才正式入局,只要赛道足够长,不同玩家就有不同的切入点。具身智能格局远未定型发展空间巨大

更重要的是,行业正在处于从讲故事、做Demo走向真实应用落地的时机。他觉得,经过十多年的工程和商业实践,团队最擅长的就是将故事转变为可以实际落地的产品。

前美团技术大牛创业,教机器人打包外卖

但王栋并不认为大厂的成功经验能直接和创业画等号,如果说在美团的经历留给他最宝贵的资产,其实是当年投身外卖战场时的勇气。

“印象有人评价当年描述美团创业的历程说,最重要的不是过去你干成了什么,而是此时此刻你打算开始,因为你有梦想和勇气,”王栋说,“这种勇气可能是今天对我最有价值的东西。”

同时,美团的经历也让王栋具备了更务实的底层认知。他相信世界本身充满随机性,很多成功不能简单归因为某个人或某个团队做得好,更不能用幸存者偏差去判断结果。在具身智能这样尚未定型的赛道里,创业者需要保持弱者心态。

对王栋来说,元节智能不是复制过去的大厂经验,而是一个新赛道里,重新把一个具体问题做深做透的过程。

二、从外卖打包切入,做商业后厨的垂直大脑

元节智能从一开始就明确,不造腿和手,只做垂直领域的“大脑”。

这是基于现实分工做出的判断,王栋认为,中国机器人供应链在腿、手等硬件方向已经有很强积累,优秀公司林立,元节智能没有必要在非核心优势的战场上拉长战线。

元节智能选择先从餐饮打包切入具身智能赛道。团队对西餐Top30的快餐品牌进行深入拆解,发现打包几乎是所有厨房都无法绕过的通用环节,覆盖中餐、墨西哥餐等多个品类。

同时,餐饮后厨还不像标准工业产线那样容易自动化,外卖打包这个环节看起来简单,实际却是一种柔性、随时变化的工作。餐盒形态各异,订单动态随机切入,前一分钟可能处理汉堡,下一分钟就要打包汤品或小食,很难用一条固定节拍的传统产线解决。

更重要的是,打包能力背后会沉淀一组原子操作能力。一旦这些能力跑通,后续再做炸薯条、做汉堡等餐饮制作类任务时,底层的大量基础操作技术是共通的。

前美团技术大牛创业,教机器人打包外卖

事实上,餐饮打包之前并非无人尝试。疫情期间,美团曾经尝试过智慧厨房相关业务,王栋也深度参与其中,研究能否打造出一款外卖打包机器人。

但当时,视觉等各项能力还不够完善。直到今天,王栋觉得这件事终于到了“跳一跳、够得着”的黄金节点。

在模型路线方面,元节智能奉行“大模型兜底长尾,小模型跑高频”的实用主义。

针对具身大模型推理慢、过于沉重的痛点,团队用垂直数据将开源模型蒸馏为多个敏捷小模型组合。日常高频任务由小模型处理以保证速度与稳定;遭遇长尾未知状况时由大模型兜底,必要时引入人工远程介入,并将经验回流沉淀,完成数据闭飞轮的持续迭代。

三、海外掘金,用订阅制撬动数据飞轮

元节智能把商业化第一站,放在了海外。

这个选择也来自王栋对餐饮生态差异的观察。“海外餐饮消费者对更倾向于吃一些稳定、相似的东西,对口味的挑剔程度没有中国消费者那么高。”他说。

并且,在海外的餐饮生态中,外卖平台并不像国内这般强势,可能会更多站在商家和骑手角度考虑。这就意味着,商家更愿意为效率改善和人力替代付费,商业模型的账更容易算得过来。

相比之下,国内餐厅数量多,供给相对充足,餐厅老板对于机器人这种重资产的付费意愿较低。王栋觉得,未来随着人口结构变化,国内市场也会出现机会,但在现阶段,元节智能更适合先在北美把基础能力做出来,把成本打下来。

商业模式上,元节智能倾向于让餐厅按月订阅。原因也很直接:餐厅老板最关心两件事,一是用了设备能省多少钱,二是前期投入能不能低一点。

王栋算了一笔账:如果让餐厅老板一上来就掏出数万美元购买设备,决策周期会拉得很长;但如果转化为每月两三千美元的订阅费用,对比当地一个后厨员工高达七八千美元的综合成本,商家尝试的门槛将被降到极低。订阅效果好,可转为购买;若想保持现金流稳定,则可以持续订阅。

这套定价逻辑的核心,不是把机器人卖出去,而是让客户更容易迈出应用的第一步。

对于接下来哪些场景做或者不做,王栋有一套清晰的筛选标准,那就是看客户是不是足够痛、是否愿意付费,以及这件事是否匹配团队能力。因此,元节智能仍会沿着餐饮大方向走,尤其是商业后厨。

短期内,元节智能的目标是将打包产品打磨到极致,让用户愿意继续长期使用。产品扎根餐厅后,也将帮助团队持续收集真实后厨数据,理解餐厅每天真实发生的动态变化。

当打包能力跑通后,元节智能会再选择相对长链路的任务进行扩展,比如炸薯条、做汉堡等,把更长周期、更复杂流程的能力补上。等产品和技术路径跑通后,再沿着已经建立的销售通路进行复制。

在王栋的三年战略蓝图中,元节智能最终要摸清商业后厨真正需要的“设备全家桶”。这些设备不一定都是长着灵巧手的智能机器人,也可能包含大量传统、低成本且好用的自动化工具。

元节智能真正想扮演的角色,是通过一套机器人操作中控,让后厨的所有设备协同运转,应对堂食、自提、外卖等混合流订单。

这意味着,元节智能最终想做的,并不是单台机器人这么简单,而是商业后厨里的智能协同系统,能无缝调配从高到底不同智能程度的设备。

结语:具身智能,并不存在护城河

无论是科技巨头还是初创黑马,王栋都不认为有谁真正建立了自己的护城河,因为这是一切都尚未来定型的赛道。

“在绝对的资金量面前,护城河随时可能被别人踏破,这也是我学到的一个很重要的商业教训,”王栋说,“所以我还是相信自己什么都不会。”

这个阶段真正重要的,是谁能更快贴近客户需求,拿到稳定订单,并在真实场景中持续积累数据、打磨产品、构建能力闭环。

具身智能距离真正的“GPT时刻”显然还有一段路要走,而王栋觉得,ChatGPT之所以被称为GPT时刻,本质上是因为它成为了被大众广泛接受的C端杀手级应用。而今天的具身智能,还没有出现类似的应用。家庭场景想象空间很大,但技术成熟度、成本结构、产品体验和用户接受度,都还需要时间沉淀。

但行业还没到GPT时刻,并不意味着具身智能玩家只能在Demo里徘徊。

王栋选择先在B端做起来,在通用能力成熟之前,用垂直能力解决特定领域的具体问题。正如在ChatGPT诞生前,AI早已在推荐算法、搜索、广告等B端场景中创造了数以千亿计的商业价值。今天的具身智能,同样可以先一步步占领商业后厨。

元节智能的破局路径具备一定的参考价值:真正的技术颠覆,往往不在于它的姿态有多炫酷,而在于它是否长在物理世界最真实的痛点之上。

具身智能走向产业深处,或许正从后厨里那双忙碌打包外卖的机械手开始。