arxiv论文整理20240120-0126(目标检测方向)
A Saliency Enhanced Feature Fusion based multiscale RGB-D Salient Object Detection Network(ICASSP 2024)
摘要: 多尺度卷积神经网络(CNN)在解决各种视觉问题方面表现出了显著的能力。然而,融合不同尺度的特征总是导致大型模型大小,阻碍了多尺度CNN在RGB-D显著性检测中的应用。在本文中,我们提出了一种定制的特征融合模块,名为Saliency Enhanced Feature Fusion(SEFF),用于RGB-D显著性检测。SEFF利用相邻尺度的显著性图来增强融合所需的特征,从而产生更具代表性的融合特征。我们的多尺度RGB-D显著性检测器使用SEFF,并使用三个不同尺度处理图像。SEFF用于融合RGB和深度图像的特征,以及不同尺度解码器的特征。对五个基准数据集进行的大量实验证明了我们的方法优于十种SOTA显著性检测器。
点评: 利用相邻尺度的显著性图来增强融合所需的特征。
Enhancing Object Detection Performance for Small Objects through Synthetic Data Generation and Proportional Class-Balancing Technique: A Comparative Study in Industrial Scenarios(ESAIM23 )
摘要: 目标检测(OD)已被证明是提取局部类信息的重要计算机视觉方法,在工业中具有多种应用。尽管许多最先进的目标检测(SOTA)模型在中大型物体上表现良好,但它们似乎在小物体上表现不佳。在大多数工业用例中,很难收集和注释小物体的数据,因为这是耗时且容易出现人为错误的。此外,这些数据集可能是不平衡的,并且通常会导致模型收敛不高效。为了解决这一挑战,本研究提出了一种注入额外数据点以提高OD模型性能的新方法。通过使用合成数据生成,可以最小化小目标数据点的数据收集和注释困难,并创造一个具有平衡分布的数据集。本文讨论了一种简单的比例类平衡技术的效果,以实现更好的锚点匹配的OD模型。在工业用例中,对最先进的OD模型(YOLOv5、YOLOv7和SSD)的实际和合成数据集的性能进行了比较。
点评: 通过使用合成数据生成和比例类平衡技术来增强对小型物体的目标检测性能。
ps:承接程序代写, 小程序编写 程序应用 深度学习 卷积神经网络 pytorch paddlepaddle 数据结构 机器学习 目标检测 图像处理
有需要的兄弟们可以在我公众号留言。
论文解读的ppt(有备注,可直接讲)可以在知识星球获取:
我正在「目标检测er的小圈子」和朋友们讨论有趣的话题,你⼀起来吧?
https://t.zsxq.com/0cM8tmd4l