绑定手机号
获取验证码
确认绑定
提问
0/255
提问
订阅开课提醒需关注服务号
回答成功
知道了
扫码关注智东西公开课服务号登录
请使用微信扫描二维码
扫描二维码分享给微信好友
您已订阅成功,有新课程,我们将第一时间提醒您。
知道了
发送提问成功
回答可在
“我的——我的提问”中查看
知道了
失败
欢迎来智东西
关注我们
智东西
车东西
芯东西
智东西公开课
深度强化学习在机器人领域的研究
CV前沿讲座 2020/04/11 14:30:00
课程讲师
Jeffrey Hu 卡内基梅隆大学 Robotics Institute在读博士

主要研究方向为机器人感知与决策,涉及深度强化学习,运动规划,机器人自主探索,视觉SLAM等问题,在计算机视觉和机器人领域顶会顶刊发表数篇论文,并担任CVPR、ICRA、RAL等会议和期刊审稿人。

Jeffrey Hu
卡内基梅隆大学 Robotics Institute在读博士

主要研究方向为机器人感知与决策,涉及深度强化学习,运动规划,机器人自主探索,视觉SLAM等问题,在计算机视觉和机器人领域顶会顶刊发表数篇论文,并担任CVPR、ICRA、RAL等会议和期刊审稿人。

陈钰 谷歌 软件工程师

陈钰目前就职于美国谷歌,负责广告推荐模型;曾是两家硅谷独角兽公司早期成员,并且在阿里巴巴达摩院实习过,研究生毕业于CMU computer engineering。

陈钰
谷歌 软件工程师

陈钰目前就职于美国谷歌,负责广告推荐模型;曾是两家硅谷独角兽公司早期成员,并且在阿里巴巴达摩院实习过,研究生毕业于CMU computer engineering。

课程提纲
  • 深度强化学习的研究进展
  • 深度强化学习在机器人领域的应用
  • 仿真器如何解决自动驾驶领域长尾问题
  • imitation learning快速学习可操作的驾驶策略
  • 使用A3C,DDPG进行smart agent方面的研究
课程简介

「CV研究合辑」,是智东西公开课针对计算机视觉推出的一档合辑,聚焦于计算机视觉前沿领域研究成果与进展的讲解。每一讲由主讲与答疑两个环节组成,其中,主讲60分钟,采用视频直播形式,答疑30分钟,将在相应交流群进行。

我们都知道,机器学习方法主要可以分为四类,监督学习、半监督学习、无监督学习、以及强化学习。不同于连接主义的监督学习方法,强化学习是智能体通过与环境的交互,观测交互结果以及获得相应的回报。这种学习的方式是模拟人或动物的一种学习方式,因此强化学习在机器人领域有着广泛的应用。

传统的强化学习局限于动作空间和样本空间都很小,且一般是离散的情境下。然而实际情况的任务则往往有着很大的状态空间和连续的动作空间。当输入数据为图像,声音时,往往具有很高维度,传统的强化学习很难处理,此时就需要结合深度学习的方法,将高纬度数据进行降维处理,即深度强化学习方法。

然而深度强化学习到底是什么样的方法,又有哪些应用,尤其在机器人领域又有怎样的进展呢?北京时间4月11日上午10点(硅谷时间4月10日晚7点、宾夕法尼亚州时间4月10日晚10点),智东西公开课「CV研究合辑」第3讲直播开讲,由卡内基梅隆大学博士胡亚飞和轻舟智航高级感知工程师陈钰,为大家讲解《深度强化学习在机器人领域的研究》。

胡亚飞是卡内基梅隆大学博士,目前在计算机学院下的机器人系进行研究工作,主要研究方向为动态场景下的视觉SLAM(包括深度学习方法和传统几何方法)、强化学习在机器人决策与规划中的应用以及2D/3D多目标跟踪等问题。他曾任ICRA, Autonomous Robot审稿人。

陈钰是轻舟智航高级感知工程师,工作内容主要是多传感器融合的追踪;卡内基梅隆大学电子与计算机工程硕士、中山大学数据科学与计算机学院本科;曾在阿里巴巴达摩院机器智能部门、瑞芯微电子核心算法部门实习,有多项美国专利;在CMU MLD Katerina Fragkiadaki实验室做研究助理;在知乎上撰写了深度学习专栏:CMU 10-703 深度强化学习笔记。

「CV研究合辑」此前已经完结两讲。第一讲由电子科技大学李文教授主讲,主题为《领域适应在计算机视觉中的研究和应用》;第二讲是由小牛动漫资深算法工程师卢薇薇主讲的《生成式对抗网络GAN在动漫领域的应用》。更多讲次也已陆续敲定,会尽快公布。敬请期待。

精彩问答
提问
提问
目前还没有问题,可以点击右侧的“提问按钮”提问
更多问题...