有哪些好看的CNN模型画法?

小白学视觉

共 2193字,需浏览 5分钟

 ·

2021-12-10 06:13

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

编辑:忆臻

本文仅作为学术分享,如果侵权,会删文处理

机器学习算法与自然语言处理报道

有哪些好看的CNN模型画法?


作者:bingo

https://www.zhihu.com/question/62509034/answer/199177562

谢邀。第一次答DL相关题目,如有错误,欢迎指正。

前几天刚好跟同学讨论到画的好看的CNN图,正好答一下问题,自己也做下整理收藏。

说起CNN的模型图,要从经典CNN的相关paper开始:

LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。

依次上图(多图预警):


LeNet




AlexNet




ZF-net



NIN



GoogLeNet



VGG



Batch Norm


通用数据预处理,没有提出新的网络模型


InceptionV3


ResNet



InceptionV4


在经典的CNN基础上,大家都会根据自己的算法和结构作出一些改进。

个人认为比较好看的CNN结构图:

Andrej Karpathy大神主页(Andrej Karpathy Academic Website)贴出了部分论文的图:



Large-Scale Video Classification with Convolutional Neural Networks paper里横向类似Alexnet的图以及纵向多个level的fusion图,与之类似的是另一篇paper里面为了表示各种level pooling做的层级concat的图:



Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的图。

Two-Stream Convolutional Networks for Action Recognition in Videos视频分析经典的Two-stream CNN图:



同样视频分析Limin Wang做了不同改进的视频应用CNN结构图:Limin Wang

最后放一个我们Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition里面的图:


个人理解和简单总结


根据上面一些经典的CNN结构图和大神们paper里面的CNN模型图,可以看出大家还是在参考经典CNN结构的基础上作出自己的一些变化:例如Cold Start paper模仿ZF-net的图,我们Pooling the Convolutional paper和视频分析的很多paper参考Two-Stream的图,在layer上面进行Fusion以及Pooling通常会参考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation类似的图。

当然除了直接放图之外,VGG还放出了一个表格,清晰的表明每一层的结构和参数。有时候,为了强调自己模型在网络局部的改进,也会有局部区域图出现例如InceptionVX里面卷积核大小不断变化的一系列图,ResNet中shorcut结构:



作者:天机
https://www.zhihu.com/question/62509034/answer/201313069


前两天看到一个高端的。



下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 50
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报