卷积神经网络

卷积操作

卷积核 - 匹配失败
卷积核 - 匹配成功

超参数：

一个卷积神经网络可能包含多个卷积层。

越靠前面的层，提取到的特征越简单，卷积核数量越少。越靠后面的层，卷积核数量越多。这是因为其输入已经不是像素点，而是具有一定复杂度的低级特征，组合爆炸可以构建出更多的复杂特征。

换个角度看，越前面的层，其卷积核的感受野越小，特征数也少。越后面的层，其卷积核的感受野越大，特征数自然也就更多。

LeNet：每个卷积层对应一个池化层。
AlexNet：

特点为：
- 增加了网络深度
- 使用了连续的卷积层
- 使用 PCA 方法给 RGB 加了噪声，以降低过拟合
ZF Net：结构同 AlexNet。区别在于每个卷积层的卷积核数量加倍，第一层的卷积核大小和 stride 缩小。
GoogleNet (Inception-v4)：

主要特点：
- 使用了多种不同的 Inception Module，部分取代单一路径的卷积层。Inception Module 里的多条路径，可以理解为多种不同的功能。反向传播时，自动选择最合适的功能进行加强。
- 顶层用 Avarage Pooling 取代全连接。
- 注意，Inception Module 里包含了 1X1 Conv。1X1 Conv 之所以有存在意义，是因为卷积操作是具有深度的。不同深度层次上的值，代表了不同的 feature，所以 1X1 Conv 可以提取该点的 feature 组合。
VGGNet：从头到尾 3X3 Conv + 2X2 Pooling，但就是深。
ResNet：

主要特点：
- 每隔几层引入了一条 shortcut，把网络深度的增加变成了一个逐步集成的过程。即每加一层，性能不应该变得更差。由于加法操作的存在，反向传播的时候，图中的 X identity 能起到稳定器的作用。
- 与 GoogleNet 一样，顶层也采用了 Avg Pool。