智猩猩机器人新青年讲座由AI与硬科技知识分享社区「智猩猩」全新企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的青年学者,主讲在具身智能、强化学习、多智能体系统、建模仿真等机器人关键前沿技术上的研究成果和开发实践。
目前讲座已完结6讲,错过直播的朋友,可以点击文章底部“阅读原文”观看回放!
具身智能包括机器人本体,和决定其智能化的大脑、小脑、脑身同步。目前大脑的研究方向是大模型,让机器人听懂人的语言;小脑为控制身体运动,掌握基本运动技能;脑身同步指机器人的意识训练。
大语言模型能在语言空间中进行推理,并通过视觉输入进行问答,但不具备环境的具身感知能力,无法与其互动。而具身智能体能与场景互动,但缺乏对物理世界的理解,无法完成具有意义的语义任务。
为此,香港大学杨言超老师团队提出一种基于大型基础模型的具身智能体脑身同步框架BBSEA。将包括LLMs和VLMs的大型基础模型(Large Foundation Models,LFMs)视为一个拥有物理世界常识的“大脑”,并探索了利用大脑的非物质结构知识训练具身智能体(身体)与物理世界的互动。
该成果的主要贡献包括如下三点:
1)提出了一个脑身同步框架BBSEA。该框架将基础模型与具身智能体相结合,使智能体能够在未知环境中自主学习物理交互任务,实现了高效的脑身同步。
2)设计了一个任务提议模块。该模块能够高效理解场景并自动提出与场景相匹配的任务。此外,该模块还设定了任务完成的评估指标,有助于具身智能体在几乎无需人为干预的情况下学习新技能。
3)通过在零次学习和少量学习设置下连续学习有效的基于语言的策略,对所提出的同步机制进行了广泛的验证,展现了其对新任务和配置的良好适应性。
此外,香港大学数据科学学院还联合南京大学、CMU、微软等提出一种TEXT2REWARD框架。该框架能够基于自然语言目标和大型语言模型自动生成强化学习的稠密奖励函数。该框架实现了广泛的任务覆盖和人机交互,解决了强化学习中奖励函数设计的挑战。与TEXT2REWARD相关的论文成果收录于ICLR 2024 并获得 Spotlight。
5月30日晚7点,智猩猩邀请到香港大学在读博士罗谦参与「智猩猩机器人新青年讲座」第7讲,主讲《大模型驱动下的具身智能体脑身同步》。
讲者
罗谦,香港大学在读博士
前阿里巴巴算法工程师,硕士毕业于佐治亚理工学院。研究方向为具身智能、模仿学习与强化学习。研究目标为构建可自主学习的通用具身智能体。在ICRA,IROS,ICLR,AAAI,ICDM等国际会议上发表多篇论文。
第7讲
主 题
《大模型驱动下的具身智能体脑身同步》
提 纲
1、基础模型如何驱动具身智能体学习?
2、基于多模态大模型的脑身同步框架BBSEA
3、大语言模型驱动的强化学习奖励函数设计
4、总结与未来展望
直 播 信 息
直播时间:5月30日19:00
直播地点:智猩猩知识店铺
成果
论文标题
《BBSEA: An Exploration of Brain-Body Synchronization for Embodied Agents》
论文链接
https://arxiv.org/abs/2402.08212
项目地址
https://bbsea-embodied-ai.github.io/
论文标题
《Text2Reward: Automated Dense Reward Function Generation for Reinforcement Learning》
论文链接
https://arxiv.org/abs/2309.11489
项目地址
https://text-to-reward.github.io/
报名方式
对本次讲座感兴趣朋友,可以扫描下方二维码,添加小助手莓莓进行报名。已添加过莓莓的老朋友,可以给莓莓私信,发送“机器人讲座07”进行报名沟通。对于通过报名的朋友,莓莓将在直播当天为大家发送直播地址。
同时,针对本次讲座,也组建了学习群,直播开始前,将会邀请通过入群审核的相关朋友入群,进行学习和讨论。