↑ 点击蓝字关注极市平台

作者丨胡可飞团队

编辑丨极市平台

极市导读

本文为获得渣土车识别冠军的胡可飞团队方案解读，团队选用了yolov5s网络来作为此次比赛任务的检测模型，最后优化的模型推理速度从9FPS最高到52FPS，已具备CPU上实时推理的能力。>>加入极市CV技术交流群，走在计算机视觉的最前沿

一、赛题回顾

本赛题希望基于计算机视觉技术可以实时监测到“黑车”，能及时、安全地管理渣土车，实现智能化管理，保证无“黑车”上岗，为创造智慧工地提供大力保障。赛题目标是使用计算机视觉算法对图片中的渣土车的车牌进行识别，并且输出车牌的文字内容。观察样例数据推测图片主要采集自交通监控摄像头。

比赛的评价指标由F1 score和性能分FPS组成，这要求算法设计要兼顾精度和速度，算法的推理性能要具备实时性（>30FPS）。本赛题主要难点如下：

采集自交通摄像头的图片存在分辨率低，对比对低，环境光污染等问题。
部分渣土车严重脏污导致车牌难以分辨。
人工标注存在错标（车牌中不应出现的字符），漏标，标准不一等问题（如遮挡严重的车牌）。
实时性要求高。

二、算法设计

主要算法设计如下图所示：

使用比赛数据标注训练检测模型，同时检测渣土车目标和车牌目标
将车牌部分抠图训练OCR识别模型
使用匈牙利算法对渣土车和车牌目标进行匹配
对算法进行轻量化等优化

其中检测模型我们选用了yolov5s网络，该网络具有较好的精度和速度的trade-off，常用于落地部署项目中。该检测网络直接使用数据标注的渣土车和车牌类进行训练，同时检出两类目标。最终输出中并不需要输出车牌框bbox，所以此处输出的车牌bbox仅用于提取车牌内容。

由于最终推理设备是cpu，所以对模型的轻量化要求较高，未经优化的yolov5s的推理速度越10FPS+，很难达到实时推理，所以我们对yolov5s网络进行剪枝，方法参考了slim-yolov3，通过bn层缩放系数，对模型各层的通道数进行结构化剪枝。剪枝的原理和操作流程如下：

稀疏化训练yolov5s
由bn层scaling factor对通道数进行排序
生成8倍数通道剪枝后模型结构config
使用剪枝后模型重新训练

由于检测网络同时输出渣土车和车牌的bbox，丢失了两者的关联关系，所以我们使用匈牙利算法对两者进行匹配，获得每个渣土车目标对应的车牌bbox。匹配的cost使用的是IoF，即Intersection over foreground，车牌即为foreground。理论上，车牌对于其所在的渣土车的IoF应该为1，实际匹配中我们设置了一个更宽松的阈值0.8。主要处理流程如下：