华中科技大学在读博士裴佳伦:基于Transformer的单阶段伪装实例分割模型OSFormer | AI新青年讲座

「AI新青年讲座」将邀请世界顶尖AI研究机构和大学的科研新青年,主讲他们在计算机视觉、机器学习等人工智能领域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑,将可以帮助大家增进对人工智能前沿研究的理解,相应领域的专业知识也能够得以积累加深。同时,通过与AI新青年的直接交流,大家在AI学习和应用AI的过程中遇到的问题,也能够尽快解决。

有兴趣分享学术成果的朋友,可以与智东西公开课教研团队进行邮件(class@zhidx.com)联系。

伪装物体检测(COD)致力于区分与背景高度相似的伪装物体,然而COD只能在区域层面将伪装物体从场景中分离出来,而忽略了实例级的识别。与一般的实例分割相比,伪装实例分割需要在特征相似度较高、更复杂的场景下进行,并且获得的掩膜是不可知的。此外,多个伪装实例在场景中可能显示出不同的伪装策略,组合起来还可能形成交互伪装,这些衍生的群体伪装使得伪装实力分割任务更加艰巨。

为了对伪装场景进行更具体地分析和理解,解决伪装实例分割问题,华中科技大学在读博士裴佳伦提出基于Transformer的单阶段伪装实例分割模型OSFormer。

OSFormer通过设计位置感知Transformer(LST)来动态捕捉不同位置的实例线索,该LST模块还包含一个带有混合卷积前馈网络的编码器和带有位置引导查询的解码器,前者用来提取多尺度全局特征,后者实现实例感知嵌入。使用LST还能在有限的训练数据下实现快速收敛。

同时,为了整合来自主干和LST的多尺度低级和高级特征,裴佳伦博士还设计一种从粗到细的融合(CFF),嵌入反向边缘注意模块来捕捉伪装实例的边缘。引入动态伪装实例归一化(DCIN),结合高分辨率掩码特征和实例感知嵌入来生成掩码,预测伪装实例。

与两阶段框架相比,OSFormer在COD10K数据集上取得41%的AP,并且在不需要大量训练数据的情况下实现了良好的收敛速率。

9月5日晚7点,「AI新青年讲座」第154讲邀请到华中科技大学在读博士裴佳伦参与,主讲《基于Transformer的单阶段伪装实例分割模型OSFormer》。

讲 者

裴佳伦,华中科技大学在读博士;起源人工智能研究院(IIAI)Online Intern;研究兴趣集中在计算机视觉、实例分割、伪装/显著性检测等,已在ECCV、IEEETMM等会议和期刊上发表多篇论文。

主 题

《基于Transformer的单阶段伪装实例分割模型OSFormer》

提 纲

1、伪装物体检测的研究背景
2、伪装实例分割的难点
3、伪装实例分割模型OSFormer的设计
4、与二阶段框架的对比及模型表现

直播信息

直播时间:9月5日19:00
直播地点:智东西公开课知识店铺

成 果

OSFormer:《OSFormer: One-Stage Camouflaged Instance Segmentation with Transformers 》
论文链接:https://arxiv.org/pdf/2207.02255.pdf
开源代码:https://github.com/PJLallen/OSFormer