「自动驾驶新青年讲座」由智东西公开课企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。
「自动驾驶新青年讲座」目前已完结17讲,错过往期讲座直播的朋友,可以点击文章底部“阅读原文”进行回看!有兴趣分享的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系 
基于视觉的自动驾驶,需要利用摄像头获取的图像来感知周围环境及障碍物,而深度信息是实现这种感知的重要输入之一。 单目深度估计是利用深度神经网络,从单张输入视图中推理场景的稠密深度信息。可以帮助自动驾驶汽车更加精准的计算障碍物距离和位置估计,实现复杂的3D感知和规划任务,提高驾驶安全性与可靠性。无监督单目深度估计无需标签信息,仅依据单目视频序列或双目立体图像对即可训练。相较于传统的有监督单目深度估计,具有高效率、低成本的优势,目前被业界广泛关注。但大多数无监督单目深度估计方法仅能提供深度预测,全局尺度不确定。因此仍然存在训练和推理成本较高,需要大量计算资源和时间成本的问题。 
针对现有无监督单目深度估计方法的缺陷,香港科技大学IADC在读博士刘宇轩等研究人员,提出了一种面向自动驾驶场景的无监督视觉深度估计网络FSNet。该网络能够准确预测全息图像的深度,解决尺度对齐问题,并增强了泛化性。相关论文已经被IEEE Trans. Autom. Sci. Eng.录用。 

无监督视觉深度估计网络FSNet主要的优化有:首先引入了的多通道输出表示,来进行稳定初始训练;其次,开发了一种基于光流的动态对象,能够去除掩膜;接着提出一种用于高性能训练的自蒸馏方案;最后,介绍了通过一种后处理方法,视觉里程计产生的稀疏 3D 点提高算法的测试效率。
7月5日晚7点,「自动驾驶新青年讲座」第18讲邀请到香港科技大学IADC在读博士刘宇轩参与,主讲《自动驾驶场景无监督视觉深度估计网络FSNet》。 
讲者
刘宇轩,香港科技大学IADC在读博士,师从刘明教授。研究兴趣主要包括视觉三维感知,视觉深度估计,自动驾驶,移动机器人等。在博士学习期间,曾参与了第一辆商用自主物流车辆Hercules的部署,和老年护理中心的自动驾驶平台的搭建。在ICRA、RA-L、CoRR、CVPR、ECCV等会议与期刊上发表多篇成果。
第18讲 
 主 题 
《自动驾驶场景无监督视觉深度估计网络FSNet》 
 提 纲 
1、智能驾驶纯视觉3D感知方案与算法概述
2、单目深度估计现有方案与尺度对齐问题
3、尺度对齐的自蒸馏FSNet训练方案
4、FSNet在KITTI和Nusc数据集上的训练效果
5、FSNet扩展到鱼眼相机模型的实验 
 直 播 信 息 
直播时间:7月5日晚19:00直播地点:智东西公开课知识店铺 
成果
论文标题:《FSNet: Redesign Self-Supervised MonoDepth for Full-Scale Depth Prediction for Autonomous Driving》
 论文链接:https://arxiv.org/pdf/2304.10719.pdf