讲座预告:面向BEV的3D通用感知大模型前置新方案|北大在读博士汪海洋主讲

今年9月起,智东西公开课品牌全新升级为智猩猩。智猩猩定位硬科技讲解与服务平台,提供公开课、在线研讨会、讲座、峰会等线上线下产品。

「自动驾驶新青年讲座」由智猩猩企划,致力于邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。

「自动驾驶新青年讲座」现已完结26讲,错过往期讲座直播的朋友,可以点击文章底部“阅读原文”进行回看!

有兴趣讲解的朋友,可以与智猩猩教研产品团队邮件(class@zhidx.com)联系。

近年来,大模型的快速兴起正在革新自动驾驶、3D视觉等多个领域。自动驾驶决策、规划都需要对周围的3D环境有良好的建模能力。自动驾驶汽车需要通过接收多模态的3D数据,并建模处理这些异构数据,完成自动驾驶多种任务执行。

自动驾驶的3D感知数据主要由多视角摄像头图像和雷达点云构成,前者是密集2D图像,而后者是稀疏3D点云分布,如果用一种通用的框架处理则具有较大挑战。目前的研究工作主要是用不同编码器分别串行处理各自模态,用一个复杂且耗时的后处理融合方式得到通用的特征表示。这种方式的运行速度较慢且没有解决模型处理多种模态的需求。

针对当前智驾行业所面临的困境,面向BEV感知的多传感器融合方式应运而生。将不同传感器采集的数据分别进行分析运算,再把各路分析结果融合到一个统一的BEV空间坐标系下生成鸟瞰图,能够有效地避免了误差叠加,满足多种模态需求。

在上述背景下,北京大学在读博士汪海洋及相关研究人员针对如何处理不同传感器的异构感知数据并学到通用的特征表示进行研究。首先从Transformer网络结构入手,设计针对点云且与图像领域适配的高效点云处理网络DSVT,该网络易于部署且性能在多个标准的benchmark上达到了SOTA。与DSVT网络相关的论文成果收录于 CVPR 2023顶会上。

讲座预告:面向BEV的3D通用感知大模型前置新方案|北大在读博士汪海洋主讲

接着基于这一高效的点云网络DSVT进一步拓展,提出一种用于BEV表征的通用多模态3D网络UniTR。UniTR是第一次针对3D感知的多模态Transformer骨干网络,开创了统一且一致的多模态3D编码与融合新方案,可以对齐不同模态信息,为3D感知大模型打下坚实基础。与UniTR网络相关的论文成果收录于ICCV 2023顶会上。
讲座预告:面向BEV的3D通用感知大模型前置新方案|北大在读博士汪海洋主讲
此外,相关团队利用无监督学习构建点云预训练模型增加了视觉模块辅助进行预训练,提出了一种名为PRED的新型图像辅助的室外点云预训练框架。该框架的主要基于BEV特征图的条件语义渲染,利用图像的语义进行监督。大量实验证明,PRED在各种大规模数据集上为3D感知任务提供了显著优化。与PRED点云预训练框架相关的论文成果收录于NeurIPS 2023顶会上。
讲座预告:面向BEV的3D通用感知大模型前置新方案|北大在读博士汪海洋主讲
11月23日19点,「自动驾驶新青年讲座」第27讲邀请到北京大学在读博士汪海洋参与,主讲《面向BEV的3D通用感知大模型前置新方案》。 

讲者

汪海洋,北京大学在读博士
师从王立威教授。主要研究方向是通用视觉处理框架构建、3D视觉感知的网络结构设计。如何设计通用框架,从视觉角度来构建感知复杂物理世界的计算模型;如何设计高效、表达能力强且易于部署的3D网络来同时处理物理世界感知所需的多种模态信息,包括但不限于多视角2D图片和稀疏分布的3D点云。曾在NeurIPS, CVPR和ICCV顶会中发表多篇一作论文,并多次担任相关顶级期刊和会议审稿人。 

第27讲
 主 题 
《面向BEV的3D通用感知大模型前置新方案》
 提 纲 
1、3D通用感知模型研究背景及难点
2、高效易于部署的动态稀疏点云Transformer网络DSVT
3、用于BEV表征的统一高效多模态Transforme网络UniTR
4、基于图像渲染的预训练策略
5、未来研究方向的探索与思考 直 播 信 息 
直播时间:11月23日19:00直播地点:智猩猩知识店铺 
成果
论文标题
《DSVT: Dynamic Sparse Voxel Transformer with Rotated Sets》《UniTR: A Unified and Efficient Multi-Modal Transformer for Bird’s-Eye-View Representation》《PRED: Pre-training via Semantic Rendering on LiDAR Point Clouds》
论文地址
https://arxiv.org/abs/2301.06051https://arxiv.org/abs/2308.07732https://arxiv.org/abs/2311.04501
开源地址
https://github.com/Haiyang-W/UniTR 
报名方式
对本次讲座感兴趣朋友,可以扫描下方二维码,添加小助手陈新进行报名。已添加过陈新的老朋友,可以给陈新私信,发送“自动驾驶27”即可报名。同时,针对「自动驾驶新青年讲座」,我们已经组建了专属学习群,也将邀请各位自动驾驶新青年加入。加入学习群,除了可以免费听课之外,还能认识讲者,与更多同行和同学一起学习,并进行深度学习交流。想要加入的朋友,也可以和陈新进行申请。讲座预告:面向BEV的3D通用感知大模型前置新方案|北大在读博士汪海洋主讲