有哪些好看的CNN模型画法?
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
编辑:忆臻
本文仅作为学术分享,如果侵权,会删文处理
机器学习算法与自然语言处理报道
作者:bingo
https://www.zhihu.com/question/62509034/answer/199177562
谢邀。第一次答DL相关题目,如有错误,欢迎指正。
前几天刚好跟同学讨论到画的好看的CNN图,正好答一下问题,自己也做下整理收藏。
说起CNN的模型图,要从经典CNN的相关paper开始:
LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。
依次上图(多图预警):
通用数据预处理,没有提出新的网络模型
在经典的CNN基础上,大家都会根据自己的算法和结构作出一些改进。
个人认为比较好看的CNN结构图:
Andrej Karpathy大神主页(Andrej Karpathy Academic Website)贴出了部分论文的图:
Large-Scale Video Classification with Convolutional Neural Networks paper里横向类似Alexnet的图以及纵向多个level的fusion图,与之类似的是另一篇paper里面为了表示各种level pooling做的层级concat的图:
Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的图。
Two-Stream Convolutional Networks for Action Recognition in Videos视频分析经典的Two-stream CNN图:
同样视频分析Limin Wang做了不同改进的视频应用CNN结构图:Limin Wang
最后放一个我们Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition里面的图:
根据上面一些经典的CNN结构图和大神们paper里面的CNN模型图,可以看出大家还是在参考经典CNN结构的基础上作出自己的一些变化:例如Cold Start paper模仿ZF-net的图,我们Pooling the Convolutional paper和视频分析的很多paper参考Two-Stream的图,在layer上面进行Fusion以及Pooling通常会参考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation类似的图。
当然除了直接放图之外,VGG还放出了一个表格,清晰的表明每一层的结构和参数。有时候,为了强调自己模型在网络局部的改进,也会有局部区域图出现例如InceptionVX里面卷积核大小不断变化的一系列图,ResNet中shorcut结构:
作者:天机
https://www.zhihu.com/question/62509034/answer/201313069
前两天看到一个高端的。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~