PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库
本文介绍了微软开源的计算机视觉库,它囊括了计算机视觉领域的最佳实践、代码示例和丰富文档。
项目地址:
https://github.com/microsoft/computervision-recipes
该库没有从头开始创建实现,而是基于已有的 SOTA 库发展而来,并围绕加载图像数据、优化和评估模型、扩展至云端构建了额外的工具函数。
此外,微软团队表示,希望通过该项目回答计算机视觉领域的常见问题、指出频繁出现的缺陷问题,并展示如何利用云进行模型训练和部署。
Jupyter notebooks 地址:
https://github.com/microsoft/computervision-recipes/blob/master/scenarios
工具函数地址:
https://github.com/microsoft/computervision-recipes/blob/master/utils_cv
该库的目标群体是具备一定计算机视觉知识背景的数据科学家和机器学习工程师,因为库的内容以 source-only(仅源代码)的形式呈现,支持自定义机器学习建模。
这个库提供的工具函数和示例旨在为现实世界的视觉问题提供解决方案加速器。
对于高密度人群图像,MCNN 模型取得了良好的效果;
对于低密度场景,OpenPose 表现良好。
而当人群密度未知时,该项目采用启发式方法。在满足以下条件时使用 MCNN 进行预测:OpenPose 预测大于 20,MCNN 大于 50。反之,则使用 OpenPose 预测。模型的阈值可以根据使用者的场景进行更改。
此外,该目录还展示了依赖项、安装过程、测试及性能。
项目地址:
https://github.com/microsoft/computervision-recipes