
机器人前瞻(公众号:robot_pro)
作者 | 许丽思
编辑 | 漠影
机器人前瞻4月17日报道,今天,智平方推出了全栈自研的全域全身VLA大模型——Alpha Brain,该模型具备了从桌面到环境、从单臂到全身、从简单到长程的能力,能够让人形机器人实现在全身协同控制和全场景任务覆盖中的高效交互与自主行动。
另外,智平方还发布了搭载Alpha Brain的通用智能机器人AlphaBot 2(爱宝2),该机器人无需训练就能完成多种任务,具有360°✖360°全空间探测感知能力,腰腿可升降。
一、推出全栈自研的全域全身VLA大模型,让机器人全流程DIY早餐
之前,智平方曾推出国产自主可控的具身大模型AI2R Brain,在泛化任务成功率及端侧运行速度等方面表现不错。
这次该公司将AI2R Brain升级为Alpha Brain,Alpha Brain搭载了智平方全栈自研的全域全身VLA(GOVLA:Global & Omni-body Vision-Language-Action)大模型,具备从桌面到环境,从单臂到全身,从简单到长程能力的视觉-语言-行动大模型,能够实现让机器人这样的智能终端,实现在全身协同控制和全场景任务覆盖中的高效交互与自主行动。
GOVLA大模型由空间交互基础模型、慢系统和快系统三部分组成。其通过解析用户指令(如语音指令)、实时环境信息和机器人状态,双系统分工协作:快系统System1快速响应简单任务,输出动作轨迹;慢系统System2负责复杂逻辑推理,任务拆解,输出语言交互内容,兼顾实时响应与复杂决策能力。值得一提的是,常规的VLA大模型只是输出机械臂动作,而GOVLA大模型首次提出输出全身控制和移动轨迹。
此外,智平方还在GOVLA大模型的慢系统中引入了DeepSeek语言大模型,赋予机器人对长程复杂任务的理解和分析。
具体来说,搭载常规VLA大模型的机器人,需要人把食材放到桌面,放到机器人的可视范围内,因为它只能看到桌面,只能在桌面操作,做完之后还需要人去给机器人提供服务,跟一个早餐机没太大区别。
而搭载GOVLA大模型的机器人能够360°感知周围环境,可以自己去冰箱取食材,自己配比健康早餐,做完之后还可以送到餐桌,完成一个管家的全链条服务,这是一个机器人管家和一个自动化设备的最大区别。
另外,北京大学与智平方共同成立的“北大—智平方具身智能联合实验室”也正式揭牌,双方将致力于突破4D世界模型、端到端智能体等具身智能相关的前沿技术难题。
二、360°✖360°全空间感知、腰腿能升降的机器人发布,将进入全球生物科技龙头工厂
此次发布的通用智能机器人AlphaBot 2搭载了Alpha Brain,无需训练即可完成多种任务,而且能快速掌握新任务,稳定适应各种变化。
硬件架构上,该机器人能够实现360°✖360°全空间探测感知。例如,可以实时感知人类面部的表情和意图,明白什么是该做的、什么是不该做的。
全身自由度34+,采用腰腿升降结构,垂直工作范围0-240cm,单臂臂展700mm(不含末端夹具)。这种可折叠的升降结构和高自由的机械臂,能够适配汽车制造、半导体分拣等任务。
在生活场景中,这样的结构也让机器人可以完成泡茶等精细化操作,能够实时响应环境变化,并快速调整操作策略。
智平方还与全球生物科技龙头华熙生物正式宣布达成战略合作,双方将共同打造面向生物科技领域的通用智能机器人解决方案。智平方机器人将在华熙生物的工厂实现物料协同转运、智能拆包消毒、智能视觉检验、多物料协同智能供料等操作,覆盖全流程自动化作业。
同时,智平方还公布了在机场和社区这类公共服务场景的布局。今年第三季度,智平方的机器人将上线国内一线城市的机场;今年第四季度,智平方的机器人将在国内示范小区落地应用。
结语:市场需求扩大,人形机器人商业化进程加速
随着智能机器人操作能力的进一步提升,市场对智能机器人的需求将迎来井喷。高盛在分析报告《Humanoid Robot: The AI accelerant》中指出,全球人形机器人到2035年的市场规模将达到380亿美元,出货量达到140万台。
面对不断扩大市场需求,智平方在发布会上宣布启动自有产线建设,并提出阶段性的商业化目标:2028年实现万台场景应用,2030年为南山区产值贡献一个百分点(达到百亿级营收),2033年拓展至百万台规模,覆盖工业、物流、家庭服务等多元化场景。
可以预见,随着市场对人形机器人的需求从工业产线精密协作、养老陪护到家庭服务等场景扩容,企业持续发力技术研发、布局量产产线、优化成本结构,也推动人形机器人从实验室走向商用落地,商业化进程不断提速。