机器人前瞻(公众号:robot_pro)
作者 | 许丽思
编辑 | 漠影
具身智能大脑,现在实在是太火了!百亿独角兽排队涌现,大额融资不断刷新纪录,资本举着钞票疯狂抢投。
不过有一说一,机器人大脑的能力确实是在飞速进化了,但当这些能力进入真实应用场景时,我们会发现,机器人就算看见了物体、规划好了轨迹,很多时候却会卡在最后的物理接触后的交互环节。
比如,面对一个容易被捏坏的草莓或是一个表面光滑的玻璃瓶,视觉没法提供物体表面摩擦力与实时形变的数据,机器人很容易在触碰的瞬间将其捏碎或导致物体滑落。
随着行业加速探索机器人量产落地,触觉从过去相对边缘的传感模态,逐渐进入具身智能产业的中心,有机构预测,触觉传感市场将达数千亿美元,资本与技术也都在向这一块感知短板倾斜。
不过,触觉能力的释放不止是依靠传感器本身,高质量触觉数据能否被低成本、标准化、规模化采集,才是触觉真正进入模型训练和机器人能力闭环的前提。
近日,千觉机器人发布了XTac UMI G1,这是一款面向机器人操作学习的穿戴式视触觉多模态数据采集夹爪。XTac UMI G1想要解决的,正是如何将人类操作中的信息完整记录下来,并进一步转化为可训练的高质量、可规模化的数据资产。
一、视触觉融合,正成为机器人价值兑现的最后一步
虽然当前VLA模型让机器人获得了强大的感知能力,但人类对物理世界的理解远不止于看见物品。
人类想要拿起水杯时,眼睛一扫就知道位置和形状,手指则持续感知接触面积、摩擦力和杯子的重量。手中的物体稍有滑动,人会迅速调整手指力度。这种能力几乎不需要思考,却是精细操作得以完成的基础。
所以,具身智能要实现感知、决策、执行的闭环交互,就不能光会看、光知道物体在哪里,还需要通过触觉理解接触、受力与状态变化。
特别是在工业领域的零部件抓取、插接、装配这类任务中,机器人需要的除了视觉识别和轨迹规划,还需要对接触状态、受力变化和微小偏差进行实时感知。尤其是精密装配时,视觉容易出现遮挡的情况,这时候就只能依靠触觉的实时反馈进行动态调整。
如果缺了触觉感知这一环,机器人在执行操作时就存在抓取滑移、夹持不稳等感知盲区,无法完成更复杂的物理交互。
说白了,视触觉融合是高质量机器人操作数据发展的重要方向,VTLA全感知模型也将成为下一代机器人技术的核心演进方向。
不过,现有数采方案,真的让人头大:
传统遥操作设备,笨重昂贵、部署门槛高,无法支撑规模化数据采集;主流扳机式设备,相比人手自然操作习惯差异大,采集效率低、样本一致性差;多数方案仅能记录视觉与位姿数据,无法捕捉接触形变、压力分布、物体滑移等关键物理交互信息。
这些方案,导致机器人长期以来看得见动作、不懂交互逻辑。对行业来说,现在亟需更轻量、标准化且可规模复制的视触觉数据采集方案。
二、拆解XTac UMI G1:如何通过工程优化重构视触觉数采标准?
正是看到了传统数采方案、视觉技术路线在高质量物理交互数据上的困境,千觉推出了XTac UMI G1数采设备。
整套设备由穿戴式主端、机器人从端、采集背包与高帧率三色光视触觉传感器组成,还搭载了超大视场角鱼眼相机、高精度位姿传感单元与9轴IMU模组。它将原本复杂笨重的采集系统浓缩进了一套背负式单元中,摆脱了真机操作的场地限制。
具体来说,这款产品主要在4个方面实现了硬核突破:
高精度多模态:XTac UMI G1内部集成120Hz高帧率三色光视触觉传感器,能够同步获取RGB图像、视触觉图像、夹爪开合状态等,还具备多设备时间同步与空间定位能力。它达到了5ms级多设备时序同步与3mm级空间定位精度,让每一步动作和每一丝受力都能在时间轴上精准对齐。
轻量化:因为是穿戴式设计,操作员戴它拿取东西的姿势就很贴合人手的自然动作,在办公室、家里甚至车间流水线上,随时随地都能开工。
精细化:端部采用细巧柔顺的指尖结构设计,提升对小物件、薄片、边缘物体等复杂目标的接触适应性。这种设计更贴近人手处理细小物体时的动作逻辑,能够提升精细夹取任务的顺手程度与采集稳定性。
低门槛:支持LeRobot、MCAP等主流数据格式与工具链,减少了重复适配和格式转换等工作,可以轻松接入后续的数据管理、回放、标注与数据集构建流程,降低数据从采集到使用的门槛。
总的来看,XTac UMI G1将原本复杂、昂贵且高度实验室化的触觉数据采集,压缩为一套更易部署、易复制、易接入训练链路的标准化方案。
三、通过可规模化的数据生产,加速机器人迭代进化
从流程上看,XTac UMI G1的特别之处在于,将多个流程都接入整合到同一套系统中。
人工操作演示、动作同步、视觉与触觉采集、位姿记录和训练工具接入,被整合进同一套系统中。传统数采流程中硬件、传感器、数据格式与训练链路之间的割裂问题,由此得到一定缓解。
不仅如此,由于穿戴起来轻便,操作员能够更加快速上手,减少复杂控制设备带来的学习成本。采集结果是结构清晰、可回放、可验证、可复用的高质量操作数据资产,降低数据处理门槛。
更深一层看,XTac UMI G1通过统一的设备形态、采集流程与数据标准,让视触觉数据逐步走向可规模扩展的流水线式数据生产,为数据驱动的机器人能力迭代提供更稳定的采集入口。
这样的大规模、高质量视触觉数据,才能够真正激发机器人触觉感知能力,加速机器迭代进化。

在应用上,该产品可全面覆盖五大核心场景:
在具身智能数据工厂中,它可用于多工位、多人员和多任务采集;在机器人算法研发中,服务数据清洗、质量评估、任务复现与模型数据准备;在家庭服务场景中,可记录桌面整理、容器开合和工具使用;在工业柔性操作中,可覆盖3C装配、小件分拣、线缆插拔和零件取放等任务;在触觉数据与真实交互研究中,则可以为接触状态理解、触觉表征和基础模型研究提供连续数据来源。
结语:高质量物理交互数据,已成具身智能竞争的分水岭
随着具身智能竞争从视觉识别,转向对真实世界交互过程的理解,触觉数据正在成为机器人实现真实场景价值的关键变量。
XTac UMI G1的出现,通过整合视触觉采集、位姿同步、结构化输出与主流训练工具链,有效缩短了从操作演示到模型训练的数据链路,补足国产具身智能数据底座,缓解行业面临的数据荒漠问题。
千觉机器人称,依托XTac UMI G1的落地应用,该公司将持续推动机器人技术从单一视觉识别,走向触觉感知、柔性交互的物理智能新阶段,加速人形机器人、服务机器人、工业柔性机器人的技术迭代与场景落地。
高质量物理交互数据能否实现低成本、标准化和规模化生产,也将划出下一阶段行业竞争的分水岭。