文章

08 简单卷积网络示例

08 简单卷积网络示例

概述

本节课主要介绍了如何构建一个简单的卷积神经网络(CNN),用于图像分类任务,比如识别图片中是否有猫。通过这个过程,我们学习了如何计算各层的输出尺寸,并且了解了随着网络深度加深时,特征图的高度和宽度逐渐减小,而通道数逐渐增加的趋势。

卷积层设计与计算

  1. 输入层:

    • 输入图像尺寸为 $39 \times 39 \times 3$,其中高度和宽度都是39,通道数为3。
  2. 第一层卷积层:

    • 使用 $3 \times 3$ 的过滤器,共有10个过滤器。
    • 步幅(stride)$s = 1$,填充(padding)$p = 0$。
    • 输出尺寸计算公式为:$\frac{(n+2p-f)}{s} + 1$,其中 $n$ 是输入尺寸,$f$ 是过滤器大小。
    • 第一层输出尺寸为 $37 \times 37 \times 10$。
  3. 第二层卷积层:

    • 使用 $5 \times 5$ 的过滤器,共有20个过滤器。
    • 步幅 $s = 2$,填充 $p = 0$。
    • 输出尺寸为 $17 \times 17 \times 20$。
  4. 第三层卷积层:

    • 同样使用 $5 \times 5$ 的过滤器,但这次有40个过滤器。
    • 步幅 $s = 2$,填充 $p = 0$。
    • 输出尺寸为 $7 \times 7 \times 40$。

特征提取和平滑处理

  • 经过三层卷积后,从原始输入图像中提取出了 $7 \times 7 \times 40 = 1960$ 个特征。
  • 这些特征会被平滑或展开成一个长向量,然后送入softmax回归或logistic回归单元进行最终的分类决策。

关键点回顾

  • 随着网络的加深,特征图的尺寸会减小,而通道数会增加。
  • 设计卷积神经网络需要选择合适的超参数,包括过滤器大小、步幅、填充以及过滤器的数量。
  • 除了卷积层之外,典型的CNN还包括池化层(POOL)和全连接层(FC),这些将在后续课程中讲解。

结语

接下来的学习将涵盖如何训练这些卷积神经网络,包括介绍反向传播方法以及池化层和全连接层的设计原理。掌握这些知识对于构建更强大、高效的神经网络至关重要。

本文由作者按照 CC BY 4.0 进行授权