「自动驾驶新青年讲座」由智东西公开课企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。
「自动驾驶新青年讲座」目前已完结21讲,错过往期讲座直播的朋友,可以点击文章底部“阅读原文”进行回看!
有兴趣分享的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系
近年来,自动驾驶汽车(AV)的智能决策模块可以处理的场景复杂度,逐渐成为了衡量和评价自动驾驶能力的核心指标之一。
尤其是在强交互高密度场景中,例如繁忙的城市道路、复杂的十字路口或多车道高速公路真实道路,AV 如何进行智能决策,并生成高效且安全的驾驶行为,仍然存在较大挑战。此类问题包含但不限于如何拟人地与人类交互,提升决策预测算法的泛化能力,有效处理多样驾驶环境中的corner case问题等。
针对上述问题,多伦多大学的在读博士王乐天等研究人员使用(Inverse) reinforcement learning,skill discovery,Bayesian inference等方法,使AV 产生不同风格的拟人化驾驶行为,并在线识别人类的驾驶风格,提升预测算法的场景可迁移性与个体可适应性。这些方法可以大幅提升自动驾驶决策算法的学习效率与性能,智能地解决强交互高密度驾驶场景下的泛化决策问题。相关成果的论文发表于RSS 2023、RA-L 2021(Best Paper)、NeurIPS 2021顶级会议期刊上。
9月1日10点,「自动驾驶新青年讲座」第22讲邀请到论文一作、多伦多大学在读博士王乐天参与,主讲《强交互高密度场景中自动驾驶智能决策与行为生成》。
讲者
王乐天,多伦多大学在读博士。研究方向为自动驾驶与机器人的智能决策、行为生成与预测、人机交互、端到端自动驾驶。曾在RSS,CORL,RA-L,ICRA, Neurips,CVPR等机器学习与机器人顶级会议期刊发表多篇论文。曾在自动驾驶社会化行为生成的工作中获得IEEE Robotics and Automation Letters 2021年度Best paper award honorable mention。曾获2022年度CARLA端到端自动驾驶挑战赛冠军。
第22讲
主 题
《强交互高密度场景中自动驾驶智能决策与行为生成》
提 纲
1、智能决策与行为生成问题与挑战
2、强交互驾驶场景中社会化驾驶行为生成
3、强交互驾驶场景可泛化、个体可适应行为预测
4、强交互高密度场景中强化学习ASAP-RL算法解析
5、智能决策与行为生成未来展望
直 播 信 息
直播时间:9月1日10:00
直播地点:智东西公开课知识店铺
成果
论文标题
《Efficient Reinforcement Learning for AutonomousDriving with Parameterized Skills and Priors》
《Socially-Compatible Behavior Design of Autonomous Vehicleswith Verification on Real Human Data》
《Hierarchical Adaptable and Transferable Networks(HATN) for Driving Behavior Prediction》
论文链接
https://arxiv.org/pdf/2305.04412.pdf
https://arxiv.org/pdf/2010.14712.pdf
https://arxiv.org/pdf/2111.00788.pdf