PCAN:用于多目标跟踪和分割的典型交叉注意网络

共 1145字,需浏览 3分钟

 ·

2021-12-19 04:47

关注涛涛CV,设置星标,更新错过

-------------------------------------

PCAN提出了一种简单有效地利用视频中长序列时序信息的方法,通过对目标物体和历史帧的外观特征进行高斯混合建模和更新,提高了视频物体分割质量和稳定性,在Youtube-VIS BDD100K 数据集上都取得了领先性能。
多对象跟踪和分割需要检测、跟踪和分割属于一组给定类的对象。大多数方法仅利用时间维度来解决关联问题,同时依赖于分割掩码本身的单帧预测。我们提出了原型交叉注意网络 (PCAN),能够利用丰富的时空信息进行在线多对象跟踪和分割。 PCAN 首先将时空记忆提炼成一组原型,然后使用交叉注意力从过去的帧中检索丰富的信息。为了分割每个对象,PCAN 采用原型外观模块来学习一组对比鲜明的前景和背景原型,然后随着时间的推移进行传播。大量实验表明,PCAN Youtube-VIS BDD100K 数据集上均优于当前的视频实例跟踪和分割竞赛获胜者,并显示出对单阶段和两阶段分割框架的有效性。

BDD100K预测实例
以下是基于QDTrack在BDD100K上运行PCAN以进行边界框跟踪的示例。

结果对比
代码链接: https://github.com/SysCV/pcan
论文链接: https://arxiv.org/abs/2106.11958
项目主页: https://www.vis.xyz/pub/pcan/

-------------------------------------

笔记:

《智能革命》《人工智能》《AI•未来》《好好赚钱》《韭菜的自我修养》读书笔记

行业: 

服务机器人公司,机器视觉公司,自动驾驶公司,ADAS公司总结, 

SLAM:

Vslam方案+源码,语义SLAM与深度相机SLAM和导航避障视觉SLAM总结

秦学英《三维物体的识别与跟踪》章国锋《视觉SLAM》申抒含《基于图像的三维建模》姜翰青《RGB -D SLAM》记录笔记

视觉SLAM的建图课件3课件2课件1

总结:

10年机器视觉网站,5年人工智能网站,

2019经历总结2018视觉总结

机器视觉:

机器视觉基本概念笔记,记录五,记录四,记录三,记录二,记录一

双目视觉和激光传感器对目标物体的三维重建技术

图像处理:

图像处理基本概念笔记,记录八,记录七,记录六 ,记录五,记录四 ,记录三,记录二 ,记录二,记录一

欢迎支持,点击在看,分享

浏览 56
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报