六维位姿是将物体从世界坐标系转换到相机坐标系下的三维平移和三维旋转,即一个物体的位置和朝向,在计算机视觉与机器人学中有着广泛应用,如指导机器人抓取与操纵物体,在增强现实中将虚拟内容叠加在真实物体、人类物体交互等场景。
六维位姿估计的研究方法有许多,例如从目标级别来划分,分为实例级、类型级以及不依赖于3D模型,其中实例级物体上的六维位姿估计趋于成熟,但由于物体形状和颜色等方面的巨大类别内差异,基于对应关系或直接回归方法的实例级六维位姿估计在精度上受到限制。
而类别级六维位姿估计只要处理的物体在纹理和几何结构上近似,就可以学习到针对这一类物体的位姿估计,极大提升了六维位姿估计的实用性。但面临的挑战也很多,像处理的对象是对称、弱纹理或无纹理、被遮挡或部分截断等。
针对这些问题,清华大学编码摄像实验室刘星雨博士等人在ECCV 2022上,提出了一种优化方CATRE。它利用初始姿态预测将形状先验和观测点云聚焦到有限范围内,然后使用基于PointNet的编码器将两个输入点云映射到公共特征空间,同时保持相关特征以进行变换。大量实验表明,该方法在REAL275、CAMERA25和LM基准测试上显著优于最先进的方法,速度达85.32Hz,并在类别级跟踪上取得了不错的结果。
12月5日晚7点,「AI新青年讲座」第178讲邀请到清华大学在读博士刘星雨参与,主讲《六维位姿估计的优化与追踪》。
第178讲
主题
六维位姿估计的优化与追踪
提纲
1、六维位姿估计的应用场景
2、六维位姿估计算法概览
3、类别级六维位姿估计与追踪的优化方法
4、六维位姿估计未来新方向展望
讲者
刘星雨,清华大学编码摄像实验室在读博士,师从季向阳教授,本科毕业于北京航空航天大学自动化学院,现研究方向为三维视觉问题,近期主要聚焦于物体位姿估计方向;在ECCV、T-PAMI顶会上发表多篇文章。
课程信息
直播时间:12月5日19:00
直播地点:智东西公开课知识店铺