微软开源计算机视觉专题库,含分类、检测、分割、关键点、跟踪、动作识别等主流方向

共 1407字,需浏览 3分钟

 ·

2020-08-23 10:08

点击上方AI算法与图像处理”,选择加"星标"或“置顶”

重磅干货,第一时间送达

来源:我爱计算机视觉


微软在计算机视觉研究领域一直非常活跃,尤其是国内的微软亚洲研究院诞生了诸如残差网络(ResNet)、Faster RCNN、高分辨率网络(HRNet)等影响巨大的算法。


微软从去年开源了 computervision-recipes 库,并不断增加新的功能,含大量的 state-of-the-art 算法实现,最近该库1.2版本发布,新增多目标跟踪算法FairMOT和动作识别算法 R(2+1)D 。


目前该库已经覆盖的计算机视觉方向包括图像分类、图像相似度计算、目标检测、物体及人体关键点检测、图像分割、动作识别、目标跟踪、拥挤人群计数等计算机视觉热门方向。


computervision-recipes 库使用 PyTorch  Fast.ai 开发,提供了丰富的 Jupyter notebooks 手把手样例,方便学术研究和工程开发,即使是对计算机视觉了解甚少的人也可以很快上手。


图像分类,支持单目标和多目标分类:



图像相似度计算,在图像库中找到相似性高的物体,可用于图像检索:


BMVC 2019 论文 

Classification is a Strong Baseline for Deep Metric Learning 效果


目标检测,支持Faster RCNN 和Mask RCNN算法:



物体及人体关键点检测:


Mask RCNN 检测结果


图像分割,UNet算法的分割结果:



动作识别,对视频中人物动作进行分类:


R(2+1)D算法效果


多目标跟踪:


FairMOT跟踪效果


拥挤人群计数:


Multi Column CNN 算法结果


该库样例丰富,使用简单,目前已经有超过4K星标,欢迎使用,也期待有更多实用CV算法加进来~


开源地址:

https://github.com/microsoft/computervision-recipes


下载1:动手学深度学习


AI算法与图像处公众号后台回复:动手学深度学习,即可下载547页《动手学深度学习》电子书和源码。该书是面向中文读者的能运行、可讨论的深度学习教科书,它将文字、公式、图像、代码和运行结果结合在一起。本书将全面介绍深度学习从模型构造到模型训练,以及它们在计算机视觉和自然语言处理中的应用。



下载2
AI算法与图像处公众号后台回复:OpenCV实战项目20讲即可下载20个有趣的OpenCV实战项目
   
个人微信(如果没有备注不拉群!
请注明:地区+学校/企业+研究方向+昵称



浏览 23
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报