安全帽检测、火灾检测、人流量统计… 这个AI开源项目轻松搞定!
随着以深度学习为代表的人工智能技术的成熟,国内众多行业都在基于人工智能技术推进行业变革与创新,积极探寻有效、有价值的应用场景进行商业化落地,其中尤以安防行业表现最为活跃。如灾害监控、人流量监控、施工安全监控、吸烟检测、口罩检测等。
虽然深度学习发展取得了不错的成绩,但是在产业落地时仍然面临诸多问题:训练数据获取难、模型泛化能力差、性能或效率达不到生产要求等。为此,百度飞桨结合实际经验,选取了火灾烟雾检测、人流量统计、安全帽检测这3个经典的场景,提供了从数据准备、模型训练优化,到模型部署的全流程可复用方案,降低产业落地门槛。
听说文档和代码已经开源了,赶紧来围观:
https://github.com/PaddlePaddle/awesome-DeepLearning
![](https://filescdn.proginn.com/358a10799e55663d32e9888e3574ee27/6410bbe567949d9b69f2bf716bae641e.webp)
接下来我们就一起看下这三个案例吧:
火灾烟雾检测
据统计,全国共接报火灾25.2万起,死亡1183人,受伤775人,直接财产损失40.09亿元。传统的火灾烟雾检测存在监管难度大、人员管理难、工地数量多且分散等问题。针对以上问题,我们与普宙科技针对城市和森林两大场景,基于开源数据集和自研数据集进行烟雾和火灾检测的合作研发。
为了让模型结果更具说服力,我们重新定义了评价指标:
![](https://filescdn.proginn.com/bc8b8b5e7b0e01285349c25be237fdb9/c929f1d6c9e4993586e2f64c75166841.webp)
1)图片级别的召回率:只要在有目标的图片上检测出目标(不论框的个数),该图片被认为召回。批量有目标图片中被召回图片所占的比例,即为图片级别的召回率。
2)图片级别的误检率:只要在无目标的图片上检测出目标(不论框的个数),该图片被认为误检。批量无目标图片中被误检图片所占的比例,即为图片级别的错误率。
![](https://filescdn.proginn.com/f07c0b395b04adb5a4cc50c7c1350568/1dc38fb4bcd78368b2c27d6a8da99398.webp)
本案例分别选用了单阶段检测模型YOLOV3、PPYOLOV1、PPYOLOV2进行实验。模型优化策略包括数据增强、可变形卷积、加入背景图片等,下表详细展示了不同实验结果(单卡NVIDIA Tesla V100下同):
![](https://filescdn.proginn.com/c3560114e42d136d987182e3720c6287/e3a1b1f86c36260a856761ebd0332bd5.webp)
注:
aug:RandomHorizontalFlip + RandomDistort + RandomCrop + RandomExpand+MixupImage
aug1:RandomResizeByShort + RandomHorizontalFlip
根据上述实验数据,我们的方案降低了错误率、提高了召回率。推荐使用backbone为ResNet101的PPYOLOV2模型,通过使用数据增强、加入背景图、COCO预训练、空间金字塔池化(SPP)等优化策略,实现96%召回率,2.2%的误检率。更多优化策略详解请关注我们的直播课。
将我们AI模型装入无人机,可以实现无人机森林智能巡检,及时发现火情。此外,借力AI也可以发现非法越境、贩毒等违法犯罪行为,便于及时取证调查。
![](https://filescdn.proginn.com/efae9045f1bf470c17741828a310fe66/c1a215d5c5b91f69330e984bfc3aca4d.webp)
人流量统计
在商场或火车站等人流量较大的公开场合,其管理者可能需要进行动态人流量统计来监控商场/火车站每天的客流量数。因为人员基数较大、流动性较高,通过人工来进行流量统计并不现实。针对该问题,本项目与上海音智达公司合作,智能高效地实现动态场景下的人流量统计。
![](https://filescdn.proginn.com/2e877acdebe669c9a46ab0c12bffd12f/56195949a170e4de4cadbde44f886873.webp)
本案例技术的实现采用目前精度和速度都表现很好的多目标跟踪算法FairMOT,全部实验结果如下表所示(单卡NVIDIA Tesla V100)。通过尝试不同的优化策略,更改优化器、损失函数、使用数据增强、增加可变形卷积(dcn)、开启跨卡同步batch normalization(syncbn)、使用指数移动平均(EMA)、更换主干网络等,模型的最高跟踪准确度(MOTA)达到71.7。更多优化策略细节可以关注我们的直播课程。
![](https://filescdn.proginn.com/fcad2b2e0613ba10588f7043124495bb/dd68f2576f90b1bcc906d6f1ac1b08b7.webp)
用户可以直接使用我们开源的高精度行人检测跟踪模型进行fine-tuning或完成其他任务,如静态场景下的人员计数任务,助力公开场合的人员管理工作。该技术方案还可以用于车流量统计、嫌疑人跟踪等更多任务场景中。更多场景将在直播中解锁~
安全帽检测
在施工现场,对于来往人员以及工作人员而言,安全问题至关重要。而安全帽更是保障施工现场在场人员安全的第一防线,因此需要对场地中的人员进行安全提醒。当人员未佩戴安全帽进入施工场所时,人为监管耗时耗力,而且不易实时监管,过程繁琐、消耗人力且实时性较差。
![](https://filescdn.proginn.com/96cc63cc432440851e311e3d47a9e88a/f17b95935d1d3bc2f915b95ddf75c3bf.webp)
针对以上问题,上海天覆科技有限公司基于百度同学自研、工业界表现超高性价比的PP-YOLOV2模型进行实验,获得如下数据。
![](https://filescdn.proginn.com/646638aac455ee892c9c197424fb78ef/79c86ffb87ff1a14ab7faf96686fcddc.webp)
推荐使用backbone为ResNet50的PPYOLOV2模型,添加可变形卷积dcn、输入图像大小为608的情况下,安全帽ap高达96.83%,推理速度达到13.7fps。使用NV-Jetson进行部署,实现很好的检测效果。
![](https://filescdn.proginn.com/dc38c3efbfa876aba0fcdc68250ced9f/9ba8d93d6722386c2221c4857d1398bf.webp)
为了让大家更加深入地了解这些案例,获取产业实现方案,百度高工将于10月26-28日围绕四大行业、八大真实场景亲授产业实践案例课,欢迎小伙伴们锁定我们的直播间!
扫码报名直播课,立即加入技术交流群
精彩内容抢先看
点击下方“阅读原文”也可报名:
![](https://filescdn.proginn.com/7bbdadf97e64d57444f36bf8462a68fb/4f4c40ca1f9aae981a8712b265371d62.webp)