转载请注明:http://blog.csdn.net/stdcoutzyx/article/details/39736509
这篇论文是今年9月份的论文[1],比較新,当中的观点感觉对卷积神经网络的參数调整大有指导作用,特总结之。关于卷积神经网络(Convolutional Neural Network, CNN),笔者后会作文阐述之,读者若心急则或可用谷歌百度一下。
本文下面内容即是论文的笔记,笔者初次尝试对一篇论文提取重点做笔记,若有不足之处请阅读原文者指出。
在论文[2]出现以后,有非常多对其提出的CNN结构进行改进的方法。比如:
Use smaller receptive window size and smaller stride of the first convolutional layer.Training and testing the networks densely over the whole image and over multiple scales.使用1*1的卷积核能够在不影响视野域的情况下添加判别函数的非线性。该核能够用于“Network in Network”网络结构,能够參考论文的參考文献12。
图1是论文中实验使用的神经网络结构,能够看到,CNN的层数从11层到19层,结构符合上面的总结的点。图2则是各个CNN的參数总数,能够看到,尽管深度变化了,可是參数数目变化不大。
Figure1 Convnet Configuration Figure2 Parameter Num測试使用例如以下步骤:
首先进行等比例缩放,短边长度Q大于224,Q的意义与S同样,只是S是训练集中的,Q是測试集中的參数。Q不必等于S,相反的,对于一个S,使用多个Q值进行測试,然后去平均会使效果变好。然后,依照本文參考文献16的方式对測试数据进行測试。 将全连接层转换为卷积层,第一个全连接转换为7×7的卷积,第二个转换为1×1的卷积。Resulting net is applied to the whole image by convolving the filters in each layer with the full-size input. The resulting output feature map is a class score map with the number channels equal to the number of classes, and the variable spatial resolution, dependent on the input image size.Finally, class score map is spatially averaged(sum-pooled) to obtain a fixed-size vector of class scores of the image.共进行三组实验:
使用图1中的CNN结构进行实验,在C/D/E网络结构上进行多尺度的训练,注意的是,该组实验的測试集仅仅有一个尺度。例如以下图所看到的:
Figure3 Performance at a single test scale測试集多尺度,且考虑到尺度差异过大会导致性能的下降,所以測试集的尺度Q在S的上下32内浮动。对于训练集是区间尺度的,測试集尺度为区间的最小值、最大值、中值。
Figure4 Convnet performance at multiple test scales模型融合,方法是取其后验概率预计的均值。
融合图3和图4中两个最好的model能够达到更好的值,融合七个model会变差。
Figure5 Convnet Fusion[1]. Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. arXiv preprint arXiv:1409.1556, 2014.
[2]. Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
转载于:https://www.cnblogs.com/bhlsheji/p/4360552.html
相关资源:【5】Very deep convolutional networks for large-scale image recognition.pdf