PCAN：用于多目标跟踪和分割的典型交叉注意网络-技术圈

关注涛涛CV，设置星标，更新不错过

-------------------------------------

PCAN提出了一种简单有效地利用视频中长序列时序信息的方法，通过对目标物体和历史帧的外观特征进行高斯混合建模和更新，提高了视频物体分割质量和稳定性，在Youtube-VIS 和 BDD100K 数据集上都取得了领先性能。

多对象跟踪和分割需要检测、跟踪和分割属于一组给定类的对象。大多数方法仅利用时间维度来解决关联问题，同时依赖于分割掩码本身的单帧预测。我们提出了原型交叉注意网络 (PCAN)，能够利用丰富的时空信息进行在线多对象跟踪和分割。 PCAN 首先将时空记忆提炼成一组原型，然后使用交叉注意力从过去的帧中检索丰富的信息。为了分割每个对象，PCAN 采用原型外观模块来学习一组对比鲜明的前景和背景原型，然后随着时间的推移进行传播。大量实验表明，PCAN 在 Youtube-VIS 和 BDD100K 数据集上均优于当前的视频实例跟踪和分割竞赛获胜者，并显示出对单阶段和两阶段分割框架的有效性。

BDD100K预测实例

以下是基于QDTrack在BDD100K上运行PCAN以进行边界框跟踪的示例。

结果对比