04 网络中的网络（Network in Network, NiN）

发表于 2026/01/26 更新于 2026/01/26

作者 Leon Yi

4 分钟阅读

初看 1×1 卷积似乎仅是对单像素点的操作，但在多通道特征图中，它实际上是在通道维度上进行的线性组合。

本节课强调了 1×1 卷积在现代 CNN 架构（如 Inception）中的关键作用：

问题：深层网络中通道数（Channels）往往很大（如 192 或更多），导致后续卷积层的计算量呈平方级增长。
解决方案：使用较少数量的 1×1 滤波器进行压缩。
示例：将 28×28×192 的输入压缩为 28×28×32。
- 这不仅保留了空间信息，还大幅减少了后续层需要处理的数据量。
- 此操作被称为“瓶颈层（Bottleneck Layer）”。

解决方案：若想保持通道数不变或增加，同时引入非线性。
原理：通过堆叠 1×1 卷积层，网络可以学习通道间的复杂依赖关系。即使输入输出通道数相同（如 28×28×192 → 28×28×192），这一过程也相当于在通道维度上应用了多层感知机（MLP）。

“网络中的网络” ：这一概念通过在常规卷积结构中嵌入多层感知机式的结构（即 1×1 卷积），提升了模型的抽象能力。
Inception 网络的铺垫：本节课为下一节内容埋下伏笔。在 Inception 模块中，1×1 卷积被广泛用于降维，以解决计算量爆炸的问题，使得深层极宽的网络（如 GoogLeNet）能够被实际训练。

简而言之，1×1 卷积是深度学习中处理通道间信息交互的“瑞士军刀”，它通过简单的数学操作实现了降维、升维和增强非线性的复杂功能。

本文由作者按照 CC BY 4.0 进行授权

热门标签