BEV 全称是 Bird’s Eye View,也就是鸟瞰图,是一种用于描述感知到的现实世界的视角或坐标系(3D 空间)。它就好比是一个从高处统观全局的上帝视角,车身多个传感器采集的数据,会输入到一个统一模型进行整体推理。这样生成的鸟瞰图,将多个传感器数据在同一视角下表达,有效地避免了误差叠加,解决了自动驾驶多传感器数据融合判断的难题。
在 BEV 空间内,由于坐标系相同,还可以进行时序融合形成 4D 空间。但传统的3D标注技术显然无法满足其需求,面向BEV的4D标注技术开始被业界关注和采用。
BEV 4D标注是一种通过将三维物体在二维鸟瞰图上进行标注的方式,标注人员可以在鸟瞰图上对车辆、行人、交通标志等物体进行标注,并记录其具体的位置、大小和速度等信息。同时,还需要进行时间轴标注,记录物体进入和离开画面的时间,以便后续的跟踪。增加的时间信息也能够帮助算法更准确地预测物体的运动轨迹,提高自动驾驶的安全性。
为了让大家进一步了解面向BEV感知的4D标注技术,7月4日19点,地平线联合智东西公开课策划推出地平线「你好,开发者」自动驾驶技术专场。地平线4D标注技术负责人隋伟将主讲,主题为《面向BEV感知的4D标注方案》。
此次专场,隋伟首先会介绍4D-Label技术,之后会对面向采集场景的多模标注、面向量产场景的纯视觉标注的两种方案进行深入解读。最后,隋伟还会为大家讲解地平线4D-Label云端运营平台,并对4D-Label的技术趋势进行展望。
公开课内容
主题:面向BEV感知的4D标注方案
提纲:
1、4D-Label技术简介
2、面向采集场景的多模标注方案
3、面向量产场景的纯视觉标注方案
4、4D-Label 云端运营平台
5、4D-Label技术趋势展望
主讲人 :
隋伟,地平线4D标注技术负责人。博士毕业于中国科学院大学自动化研究所,有近10年三维视觉方向的研发经验。2019年初加入地平线,先后主导2.5D&3D视觉以及BEV静态感知相关技术的研发。目前主要负责4D标注项目的研发,解决高阶自动驾驶系统中BEV感知任务的真值生成问题。
课程信息
直播时间:7月4日19:00
直播地点:智东西公开课直播间