编辑:忆臻
https://www.zhihu.com/question/62509034
本文仅作为学术分享,如果侵权,会删文处理
机器学习算法与自然语言处理报道
有哪些好看的CNN模型画法?
作者:bingo
https://www.zhihu.com/question/62509034/answer/199177562
谢邀。第一次答DL相关题目,如有错误,欢迎指正。
前几天刚好跟同学讨论到画的好看的CNN图,正好答一下问题,自己也做下整理收藏。
说起CNN的模型图,要从经典CNN的相关paper开始:
LeNet,1998年;AlexNet,2012年 ;ZF-net,2013年;NIN,2013年;GoogLeNet (InceptionV1),2014年;VGG,2014年;Batch Norm (InceptionV2),2015年;InceptionV3 ,2015年;ResNet,2015年;InceptionV4,2016年。
依次上图(多图预警):
LeNet
AlexNet
ZF-net
NIN
GoogLeNet
VGG
Batch Norm
通用数据预处理,没有提出新的网络模型
InceptionV3
ResNet
InceptionV4
在经典的CNN基础上,大家都会根据自己的算法和结构作出一些改进。
个人认为比较好看的CNN结构图:
Andrej Karpathy大神主页(Andrej Karpathy Academic Website)贴出了部分论文的图:
Large-Scale Video Classification with Convolutional Neural Networks paper里横向类似Alexnet的图以及纵向多个level的fusion图,与之类似的是另一篇paper里面为了表示各种level pooling做的层级concat的图:
Image Feature Learning for Cold Start Problem in Display Advertising模仿ZF-net做的图。
Two-Stream Convolutional Networks for Action Recognition in Videos视频分析经典的Two-stream CNN图:
同样视频分析Limin Wang做了不同改进的视频应用CNN结构图:Limin Wang
最后放一个我们Pooling the Convolutional Layers in Deep ConvNets for Video Action Recognition里面的图:
个人理解和简单总结
根据上面一些经典的CNN结构图和大神们paper里面的CNN模型图,可以看出大家还是在参考经典CNN结构的基础上作出自己的一些变化:例如Cold Start paper模仿ZF-net的图,我们Pooling the Convolutional paper和视频分析的很多paper参考Two-Stream的图,在layer上面进行Fusion以及Pooling通常会参考上面Karparthy Sports-1M以及Beyond Short Snippets中Layer concatenation类似的图。
当然除了直接放图之外,VGG还放出了一个表格,清晰的表明每一层的结构和参数。有时候,为了强调自己模型在网络局部的改进,也会有局部区域图出现例如InceptionVX里面卷积核大小不断变化的一系列图,ResNet中shorcut结构:
作者:天机
https://www.zhihu.com/question/62509034/answer/201313069
前两天看到一个高端的。
为您推荐
本篇文章来源于: 深度学习这件小事
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
内容反馈