「CV研究合辑」,是智东西公开课针对计算机视觉推出的一档合辑,聚焦于计算机视觉前沿领域研究成果与进展的讲解。每一讲由主讲与答疑两个环节组成,其中,主讲60分钟,采用视频直播形式,答疑30分钟,将在相应交流群进行。

我们都知道,机器学习方法主要可以分为四类,监督学习、半监督学习、无监督学习、以及强化学习。不同于连接主义的监督学习方法,强化学习是智能体通过与环境的交互,观测交互结果以及获得相应的回报。这种学习的方式是模拟人或动物的一种学习方式,因此强化学习在机器人领域有着广泛的应用。

传统的强化学习局限于动作空间和样本空间都很小,且一般是离散的情境下。然而实际情况的任务则往往有着很大的状态空间和连续的动作空间。当输入数据为图像,声音时,往往具有很高维度,传统的强化学习很难处理,此时就需要结合深度学习的方法,将高纬度数据进行降维处理,即深度强化学习方法。

然而深度强化学习到底是什么样的方法,又有哪些应用,尤其在机器人领域又有怎样的进展呢?北京时间4月11日上午10点(硅谷时间4月10日晚7点、宾夕法尼亚州时间4月10日晚10点),智东西公开课「CV研究合辑」第3讲直播开讲,由卡内基梅隆大学博士胡亚飞和轻舟智航高级感知工程师陈钰,为大家讲解《深度强化学习在机器人领域的研究》。

胡亚飞是卡内基梅隆大学博士,目前在计算机学院下的机器人系进行研究工作,主要研究方向为动态场景下的视觉SLAM(包括深度学习方法和传统几何方法)、强化学习在机器人决策与规划中的应用以及2D/3D多目标跟踪等问题。他曾任ICRA, Autonomous Robot审稿人。

陈钰是轻舟智航高级感知工程师,工作内容主要是多传感器融合的追踪;卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科;曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习,有多项美国专利;在CMU MLD Katerina Fragkiadaki实验室做研究助理;在知乎上撰写了深度学习专栏:CMU 10-703 深度强化学习笔记。

CV研究合辑」此前已经完结两讲。第一讲由电子科技大学李文教授主讲,主题为《领域适应在计算机视觉中的研究和应用》;第二讲是由小牛动漫资深算法工程师卢薇薇主讲的《生成式对抗网络GAN在动漫领域的应用》。更多讲次也已陆续敲定,会尽快公布。敬请期待。

直播信息

直播时间:4月11日10:00-11:30(北京时间)
直播平台:智东西公开课小程序
答疑地址:强化学习交流群

课程内容

主题:深度强化学习在机器人领域的研究

提纲:

1、深度强化学习的研究进展
2、深度强化学习在机器人领域的应用
3、仿真器如何解决自动驾驶领域长尾问题
4、imitation learning快速学习可操作的驾驶策略
5、使用A3C,DDPG进行smart agent方面的研究

讲师介绍

胡亚飞,卡内基梅隆大学博士,目前在计算机学院下的机器人系进行研究工作;主要研究方向为动态场景下的视觉SLAM(包括深度学习方法和传统几何方法),强化学习在机器人决策与规划中的应用,以及2D/3D多目标跟踪等问题;曾任ICRA, Autonomous Robot审稿人。

陈钰,轻舟智航高级感知工程师,工作内容主要是多传感器融合的追踪;卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科;曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习,有多项美国专利;在CMU MLD Katerina Fragkiadaki实验室做研究助理;在知乎上撰写了深度学习专栏:  CMU 10-703 深度强化学习笔记。

申请入群

本次课程的讲解分为主讲和答疑两部分,主讲以视频直播形式,答疑将在「强化学习交流群」进行。

加入交流群,除了可以免费收听直播之外,还能认识讲师,与更多同行和同学一起学习,并进行深度讨论。

扫码添加小助手小开(ID:hikai19)即可申请,备注“姓名-公司/学校/单位-职位/专业”的朋友将会优先审核通过哦~