为此,清华大学自动化系提出一个基于高斯世界模型的流式三维语义占用预测模型GaussianWorld,现已开源。与GaussianWorld相关的论文成果已投稿CVPR 2025,清华大学自动化系智能视觉实验室(IVG)博士生左思成为论文一作。
GaussianWorld采用显式3D高斯作为场景表示,而不是传统的隐式 BEV/Voxel 表示,这可以实现物体运动的显式和连续建模。给定历史 3D 高斯和当前视觉输入,GaussianWorld算法模型旨在预测场景如何演变并预测当前的占用情况。
为了证明提出的GaussianWorld算法模型的有效性,在nuScenes数据集上进行了大量实验。实验表明,GaussianWorld 可以有效地预测场景演变,并在不引入额外计算的情况下将单帧占用率预测提高 2% 以上(mIoU)。与现有方法相比,该模型在不引入额外计算开销的前提下,展示了SOTA的性能。
1月13日晚上7点,智猩猩邀请到论文一作、清华大学智能视觉实验室(IVG)博士生左思成参与「智猩猩新青年讲座自动驾驶专题」第42讲,主讲《基于高斯世界模型的流式3D占用预测》。
讲者
清华大学自动化系智能视觉实验室(IVG)博士生,主要研究方向是计算机视觉和自动驾驶。
第 42 讲
2、基于世界模型的感知任务范式
3、基于高斯世界模型的流式OCC预测
4、在世界模型与端到端自动驾驶上的思考