深度强化学习在机器人领域的研究

课程回放

深度强化学习在机器人领域的研究

CV前沿讲座 2020/04/11 14:30:00

课程讲师

Jeffrey Hu 卡内基梅隆大学 Robotics Institute在读博士

主要研究方向为机器人感知与决策，涉及深度强化学习，运动规划，机器人自主探索，视觉SLAM等问题，在计算机视觉和机器人领域顶会顶刊发表数篇论文，并担任CVPR、ICRA、RAL等会议和期刊审稿人。

Jeffrey Hu

卡内基梅隆大学 Robotics Institute在读博士

陈钰谷歌软件工程师

陈钰目前就职于美国谷歌，负责广告推荐模型；曾是两家硅谷独角兽公司早期成员，并且在阿里巴巴达摩院实习过，研究生毕业于CMU computer engineering。

陈钰

谷歌软件工程师

陈钰目前就职于美国谷歌，负责广告推荐模型；曾是两家硅谷独角兽公司早期成员，并且在阿里巴巴达摩院实习过，研究生毕业于CMU computer engineering。

课程提纲

深度强化学习的研究进展
深度强化学习在机器人领域的应用
仿真器如何解决自动驾驶领域长尾问题
imitation learning快速学习可操作的驾驶策略
使用A3C，DDPG进行smart agent方面的研究

课程简介

「CV研究合辑」，是智东西公开课针对计算机视觉推出的一档合辑，聚焦于计算机视觉前沿领域研究成果与进展的讲解。每一讲由主讲与答疑两个环节组成，其中，主讲60分钟，采用视频直播形式，答疑30分钟，将在相应交流群进行。

我们都知道，机器学习方法主要可以分为四类，监督学习、半监督学习、无监督学习、以及强化学习。不同于连接主义的监督学习方法，强化学习是智能体通过与环境的交互，观测交互结果以及获得相应的回报。这种学习的方式是模拟人或动物的一种学习方式，因此强化学习在机器人领域有着广泛的应用。

传统的强化学习局限于动作空间和样本空间都很小，且一般是离散的情境下。然而实际情况的任务则往往有着很大的状态空间和连续的动作空间。当输入数据为图像，声音时，往往具有很高维度，传统的强化学习很难处理，此时就需要结合深度学习的方法，将高纬度数据进行降维处理，即深度强化学习方法。

然而深度强化学习到底是什么样的方法，又有哪些应用，尤其在机器人领域又有怎样的进展呢？北京时间4月11日上午10点（硅谷时间4月10日晚7点、宾夕法尼亚州时间4月10日晚10点），智东西公开课「CV研究合辑」第3讲直播开讲，由卡内基梅隆大学博士胡亚飞和轻舟智航高级感知工程师陈钰，为大家讲解《深度强化学习在机器人领域的研究》。

胡亚飞是卡内基梅隆大学博士，目前在计算机学院下的机器人系进行研究工作，主要研究方向为动态场景下的视觉SLAM（包括深度学习方法和传统几何方法）、强化学习在机器人决策与规划中的应用以及2D/3D多目标跟踪等问题。他曾任ICRA, Autonomous Robot审稿人。

陈钰是轻舟智航高级感知工程师，工作内容主要是多传感器融合的追踪；卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科；曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习，有多项美国专利；在CMU MLD Katerina Fragkiadaki实验室做研究助理；在知乎上撰写了深度学习专栏：CMU 10-703 深度强化学习笔记。

「CV研究合辑」此前已经完结两讲。第一讲由电子科技大学李文教授主讲，主题为《领域适应在计算机视觉中的研究和应用》；第二讲是由小牛动漫资深算法工程师卢薇薇主讲的《生成式对抗网络GAN在动漫领域的应用》。更多讲次也已陆续敲定，会尽快公布。敬请期待。

精彩问答

提问

目前还没有问题，可以点击右侧的“提问按钮”提问

{{item.name}}
{{item.createdDate}}

{{item.answerOmit}} 阅读全文〉

更多问题...