08 简单卷积网络示例

发表于 2026/01/18 更新于 2026/01/18

作者 Leon Yi

3 分钟阅读

本节课主要介绍了如何构建一个简单的卷积神经网络（CNN），用于图像分类任务，比如识别图片中是否有猫。通过这个过程，我们学习了如何计算各层的输出尺寸，并且了解了随着网络深度加深时，特征图的高度和宽度逐渐减小，而通道数逐渐增加的趋势。

输入层:
- 输入图像尺寸为 $39 \times 39 \times 3$，其中高度和宽度都是39，通道数为3。
第一层卷积层:
- 使用 $3 \times 3$ 的过滤器，共有10个过滤器。
- 步幅（stride）$s = 1$，填充（padding）$p = 0$。
- 输出尺寸计算公式为：$\frac{(n+2p-f)}{s} + 1$，其中 $n$ 是输入尺寸，$f$ 是过滤器大小。
- 第一层输出尺寸为 $37 \times 37 \times 10$。
第二层卷积层:
- 使用 $5 \times 5$ 的过滤器，共有20个过滤器。
- 步幅 $s = 2$，填充 $p = 0$。
- 输出尺寸为 $17 \times 17 \times 20$。
第三层卷积层:
- 同样使用 $5 \times 5$ 的过滤器，但这次有40个过滤器。
- 步幅 $s = 2$，填充 $p = 0$。
- 输出尺寸为 $7 \times 7 \times 40$。

接下来的学习将涵盖如何训练这些卷积神经网络，包括介绍反向传播方法以及池化层和全连接层的设计原理。掌握这些知识对于构建更强大、高效的神经网络至关重要。

本文由作者按照 CC BY 4.0 进行授权

热门标签