06 三维卷积(Convolutions over Volumes)
06 三维卷积(Convolutions over Volumes) 🧠 三维卷积(Convolutions over Volumes)课程总结 一、动机:从二维卷积到三维卷积 二维卷积适用于灰度图像(单通道),输入为 $H \times W$。 彩色图像通常是 RGB 三通道,表示为 $H \times W \times C$,其中 $C=3$。 为了在彩色图像上进行卷...
06 三维卷积(Convolutions over Volumes) 🧠 三维卷积(Convolutions over Volumes)课程总结 一、动机:从二维卷积到三维卷积 二维卷积适用于灰度图像(单通道),输入为 $H \times W$。 彩色图像通常是 RGB 三通道,表示为 $H \times W \times C$,其中 $C=3$。 为了在彩色图像上进行卷...
05 带步长的卷积(Strided Convolutions) 一、基本概念回顾 在标准卷积中,我们使用一个 滤波器(filter) (也称卷积核)在输入图像上滑动,逐点进行逐元素相乘再求和,生成输出特征图(feature map)。 输入图像尺寸:$n \times n$ 滤波器尺寸:$f \times f$ Padding(填充):$p$ Stride(步长):$...
04 卷积操作中的 Padding(填充) 一、问题背景:无填充卷积的两个主要缺点 当我们对一个图像进行卷积操作时,若不使用填充(即“Valid 卷积”),会出现以下问题: 1. 输出尺寸逐层缩小 假设输入图像尺寸为 $n \times n$,卷积核(过滤器)尺寸为 $f \times f$,步长为 1。 则输出尺寸为: \[(n - f + 1) \times...
03 边缘检测(Edge Detection) 一、核心思想:边缘检测 = 卷积运算 边缘检测的本质是通过卷积核(filter / kernel) 对图像进行滑动窗口操作,突出图像中亮度发生剧烈变化的位置——即“边缘”。 图像可视为二维矩阵 $I \in \mathbb{R}^{H \times W}$。 卷积核为小尺寸矩阵(如 $3 \times 3$),记作 $K \in...
02 边缘检测示例(Edge Detection Example) 一、核心思想 卷积运算是卷积神经网络(CNN)中最基本的操作。 在 CNN 的早期层中,网络通常执行边缘检测(如垂直/水平边缘),后续层则逐步组合这些低级特征,形成更复杂的语义(如物体部件、完整物体,例如人脸)。 本节以垂直边缘检测为例,讲解卷积如何工作。 二、输入与过滤器(Filter / Kernel) ...
01 计算机视觉(Computer vision) 计算机视觉与深度学习 计算机视觉领域的发展得益于深度学习技术的进步,这使得许多之前难以实现的应用成为可能。例如,自动驾驶汽车能够识别行人和其它车辆并避开它们;人脸识别技术提高了手机解锁的安全性和便捷性。 应用案例 图片分类(Image Classification) :给定一张大小为 $64 \times 64$ 的图片,训练...
10 是否使用端到端深度学习(Whether to use end-to-end learning?) 🎯 核心问题 在构建一个机器学习系统时,是否应该采用端到端(end-to-end)深度学习方法? 端到端学习是指:直接从原始输入 $x$ 学习到最终输出 $y$ 的映射函数 $f: x \mapsto y$,中间不引入人工设计的模块或中间表示。 ✅ 端到端学习的优点 ...
09 端到端深度学习(End-to-End Deep Learning) 一、什么是端到端深度学习? 定义 端到端深度学习是指:使用一个单一的神经网络模型,直接从原始输入 $x$ 映射到目标输出 $y$,而跳过传统多阶段流水线中的手工设计中间模块。 形式化表示为: [y = f_\theta(x)] 其中 $f_\theta$ 是一个可训练的深度神经网络,$\theta$...
08 多任务学习(Multi-task Learning) 一、多任务学习 vs 迁移学习 特性 迁移学习(Transfer Learning) 多任务学习(Multi-task Learning) 学习方式 串行:先在源任务上训练,再迁移到目标任务 并行:同时训练多...
07 迁移学习(Transfer Learning) 一、核心思想 迁移学习的核心理念是:在一个任务(源任务)上训练好的模型,其学到的知识可以迁移到另一个相关但不同的目标任务上,从而提升目标任务的学习效率或性能,尤其是在目标任务数据量较少的情况下。 关键直觉:神经网络的前几层通常学习的是通用的低层次特征(如边缘、纹理、曲线等),这些特征在多个视觉或听觉任务中具有共通性。 ...