智猩猩机器人新青年讲座由AI与硬科技知识分享社区「智猩猩」全新企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的青年学者,主讲在具身智能、强化学习、多智能体系统、建模仿真等机器人关键前沿技术上的研究成果和开发实践。

具身智能模拟器是一种用于模拟物理世界的工具,具身智能体能够在模拟器中实现对物理世界的感知、推理与交互。但现有的模拟器所模拟的环境通常是静态的,真实物理世界中却存在着各种由意外灾害引起的动态环境变化。具身智能体需要在动态灾害中迅速做出决策,以适应环境的变化并救出贵重物品,帮助人类减少损失。

针对当前问题,UMass Amherst淦创教授团队与MIT-IBM Watson AI Lab等联合提出一种用于评估具身智能体在动态情况下决策能力的框架HAZARD。与HAZARD相关的论文收录于ICLR 2024顶会上。

ICLR’24 收录!在具身智能模拟器中针对动态灾害进行具身决策 | UMass Amherst周沁泓博士讲座预告

HAZARD框架提供了一个可靠的物理仿真系统以及一个多功能渲染器,能够产生与环境变化类型相匹配的视觉效果。该框架中包括三种意外灾害场景(火灾、洪水和大风),具身智能体在意外灾害场景中基于LLMs进行常识推理和决策。HAZARD能够在各种pipelines中测试、评估具身智能体的决策能力,包括动态变化环境中的强化学习 (RL)、基于规则和基于搜索的方法。

ICLR’24 收录!在具身智能模拟器中针对动态灾害进行具身决策 | UMass Amherst周沁泓博士讲座预告

该团队还进一步开发了一个基于LLM的具身智能体,并对其解决这些问题进行了深入分析。在HAZARD Challenge中,一个具身智能体需要从灾害中营救给定的一组对象。具身智能体的观察包括RGB-D信号、温度或水位信号、目标对象信息和分割掩码。

为了应对感知方面的挑战,该团队提供了一个感知版本的HAZARD,在观察中排除了分割掩码。动作空间包括四个高级别动作:拾取、探索、放下和走到目标点,每个动作都代表了对多个低级别动作的压缩。具身智能体最终的性能通过价值、步数和损坏程度来进行评估。

ICLR’24 收录!在具身智能模拟器中针对动态灾害进行具身决策 | UMass Amherst周沁泓博士讲座预告

6月25日晚7点,智猩猩邀请到论文一作、UMass Amherst在读博士周沁泓参与「智猩猩机器人新青年讲座」第9讲,主讲《在具身智能模拟器中针对动态灾害进行具身决策》。

讲者

周沁泓,UMass Amherst在读博士

导师为淦创教授,研究方向为具身智能、语言模型、多智能体。硕士与本科毕业于清华大学计算机系自然语言处理实验室。在ACL、NeurIPS、AAAI、ICLR等会议上发表多篇论文。

第9讲

主 题
《在具身智能模拟器中针对动态灾害进行具身决策》

提 纲

1、具身智能模拟器研究现状
2、基于物理仿真与视觉渲染的动态灾害模拟
3、救援任务设计与基线智能体算法
4、动态灾害中的具身决策测试与评估框架HAZARD
5、实验结果分析及展望

直 播 信 息

直播时间:6月25日19:00
直播地点:智猩猩GenAI视频号

成果

论文标题
《HAZARD Challenge: Embodied Decision Making in Dynamically Changing Environments》

论文链接
https://arxiv.org/abs/2401.12975

项目地址
https://vis-www.cs.umass.edu/hazard/

入群申请

针对本次讲座,也组建了学习群,讲者将会加入交流。希望入群学习和交流的朋友,可以扫描下方二维码,添加小助手莓莓进行报名。已添加过莓莓的老朋友,可以给莓莓私信,发送“机器人讲座09”申请入群。

ICLR’24 收录!在具身智能模拟器中针对动态灾害进行具身决策 | UMass Amherst周沁泓博士讲座预告