IBM美国研究院首席科学家淦创:面向通用AI场景的交互式多模态物理仿真平台ThreeDworld | 讲座预告

还记得前段时间很火的“宝马虚拟工厂”视频吗?通过数字孪生技术,宝马与英伟达联手建造了实时模拟和协作平台,将宝马汽车生产线高度数字化,形成了超逼真的虚拟汽车工厂。

数字孪生技术的背后,仿真是最为关键的技术之一。从定义上来说,仿真是将包含了确定性规律和完整机理的模型转化成软件的方式来模拟物理世界的一种技术。只要模型正确,并拥有了完整的输入信息和环境数据,就可以基本正确地反映物理世界的特性和参数。如果说建模是模型化我们对物理世界或问题的理解,那么仿真就是验证和确认这种理解的正确性和有效性。

从应用上,仿真使得在复杂变化的现场环境可以实现非常多的虚拟测试、早期验证,降低项目落地的整体成本。比如机器人前期的仿真训练可以快速、低成本、高安全性地验证,包括机器人结构设计、运动控制、轨迹规划与高层次逻辑AI等工作的原理层面的有效性。同时在这样的验证过程中,快速、实时地得到期望性能与实际(仿真)性能间差距的反馈,用以更好地反哺先前的工作。

来自IBM美国研究院的首席科学家淦创等人在今年公布了一个面向通用AI场景的交互式多模态物理仿真平台ThreeDWorld(TDW)。 相比于其他的物理仿真平台,TDW具有几个独特的特性:

1)实时近照片逼真的图像渲染质量;

2)具有高质量渲染材料的对象和环境的库,以及实现资产库的用户定制的例程;

3)用于高效地构建新环境的类的生成过程;

4)高保真音频渲染;

5)对于包括衣物、液体和可变形对象在内的各种材料类型的可信和现实的物理交互;

6)用作 AI 代理的各种实例,以及用户可自定义实例的选项;

7)支持与 VR 设备的人工交互。

同时TDW 还提供了丰富的 API,允许多个代理在模拟中交互,并返回代表世界状态的一系列传感器和物理数据。并且该平台围绕多模态感知、物理场景理解、多智能体交互等领域进行了初步实验及验证。

9月17日上午10点,「GPU加速青年学者研究讲座」第二讲,特邀IBM美国研究院首席科学家淦创以《ThreeDworld:面向通用AI场景的交互式多模态物理仿真平台》为主题,为大家讲解他们在仿真领域的最新研究成果。

淦创目前是IBM美国研究院首席科学家,在人工智能的国际顶级期刊和会议(如TPMAI, IJCV, NeuIPS, ICML, ICLR, CVPR, ICCV, ECCV, )上发表论文80多篇,并有多项研究成果也得到了国际主流媒体 (CNN, BBC, WIRED, MIT Tech Review, Forbes, ZDNet )的关注与报道。他也在ICLR, NeurIPS, CVPR, ICCV, ACL, 等多个人工智能国际顶级会议担任领域主席,并多次在这些顶级会议的研讨会上做主题报告。在清华读博期间,他曾是清华大学研究生特等奖学金,微软学者奖学金,百度学者奖学金的获得者。

在本次讲座中,淦创博士将从机器人领域中的仿真环境需求出发,深度讲解他们最新推出的支持多模态感知与物理场景理解的通用仿真平台ThreeDWorld,以及其中的Transport Challenge: 视觉引导和物理驱动的运动规划数据集。仿真训练的背后也离不开超高的算力支持,因此他也会介绍在RL训练过程中的基于V100 GPU集群的仿真训练加速。最后,淦创博士将就仿真平台中视觉表征学习能力进行讨论和展示。

直播课介绍

课 程 主 题

《ThreeDworld:面向通用AI场景的交互式多模态物理仿真平台》

课 程 提 纲

1、机器人领域中的仿真环境需求
2、支持多模态感知与物理场景理解的通用仿真平台ThreeDWorld
3、Transport Challenge: 视觉引导和物理驱动的运动规划数据集
4、基于V100 GPU集群的仿真训练加速
5、仿真平台中视觉表征学习能力讨论

讲 师 介 绍

淦创,IBM 美国研究院首席科学家;在人工智能的国际顶级期刊和会议(如TPMAI, IJCV, NeuIPS, ICML, ICLR, CVPR, ICCV, ECCV, )上发表论文80多篇,并有多项研究成果也得到了国际主流媒体 (CNN, BBC, WIRED, MIT Tech Review, Forbes, ZDNet )的关注与报道;在ICLR, NeurIPS, CVPR, ICCV, ACL, 等多个人工智能国际顶级会议担任领域主席,并多次在这些顶级会议的研讨会上做主题报告;在清华读博期间,是清华大学研究生特等奖学金,微软学者奖学金,百度学者奖学金的获得者。

直 播 信 息

直播时间:9月17日10:00
直播地点:智东西公开课知识店铺