不去工厂打螺丝,人形机器人这次真上手干家庭服务了!

机器人前瞻5月29日报道,昨天,零次方发布轮式人形机器人Zerith-H1,该机器人搭载了垂直场景操作基础模型Zerith-V0,能够为类家庭服务场景提供智能解决方案。

Zerith-H1具备轮式移动底盘,机器人上半身可根据任务需要随时调整高度,适应不用的操作场景需求。

Zerith-V0采用”认知-行为”双系统架构,能够以被操作物体为中心构建空间表征,实现原理驱动式的智能操作。

一、整理杂物、刷马桶、打扫地面,动作丝滑流畅

在官方展示的演示视频里,H1可以完成多项家庭服务,全程动作非常丝滑流畅。

H1拿着脏衣篓,能够自主识别到洗漱台上、门把手上需要回收的脏毛巾,用夹爪把它们都收纳进筐中。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

然后,开始为浴室替换新的洗漱用品,并将已经使用的放置到推车中。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

打开浴室门、清洗马桶、冲水的一连串动作,也是非常连贯。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

最后,H1还记得要给洗手台上的换上适量的水、整理台面,并用洗地机进行地面清洁。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

二、采用“认知-行为”双系统结构,打造面向垂直场景的具身操作基础模型

H1能够顺利完成这些任务,背后是零次方的垂直场景操作基础模型Zerith-V0的支撑。

目前,主流机器人操作VLA模型采用“感知 – 动作”直连架构,依赖堆砌海量数据训练提升适应能力,缺少对操作原理的基础认知。

而Zerith-V0创新采用“认知-行为”双系统架构,以被操作物体为中心构建空间表征,实现原理驱动式的智能操作。

数据层面上,划分为知识数据和行为数据。首先学习操作知识数据上,团队通过大规模的视频动作数据进行构建。对于行为数据,团队构建了基于下游场景的动作基元数据集。

模型架构层面上,团队搭建了分层双系统的架构——认知系统构建对操作物体的物理属性与功能语义的理解;行为系统则基于物体空间信息映射,实现运动基元的组合优化。

这样的分层双系统架构,通过以操作物体为中心的统一空间表征作为交互中间件,屏蔽背景噪声,提升背景泛化能力,让系统更专注于任务本身。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

结语:从垂直场景切入,逐步迈向最终的家庭场景

家庭是通用机器人的终极服务场景,而在奔向家庭这个最复杂泛化、交互性最强的场景途中,零次方团队采取 “垂直场景切入-家庭场景延伸”的梯度推进策略:优先选择与家庭场景高度相似的典型服务业垂直场景,比如酒店卧室、卫生间、餐厅后厨等作为突破口。

保姆级丝滑!清华系创企突破:人形机器人真上手干家务活!

因为在这些垂直场景里,操作流程更为明确,对于数据与模型泛化处理复杂度降低了,只需要基础的人机协作能力。同时,还更适合规模化落地,快速验证技术可行性并积累真实场景数据。

以类家庭服务垂直场景为切入点,机器人就能够逐步攻克复杂度递增的场景,转动从场景数据到多样性数据的往复性飞轮,在真实环境中逐步增强模型能力;也能更早跑入商业小闭环。