Leon Yi

09 计算机视觉现状(The state of computer vision)

09 计算机视觉现状(The state of computer vision) 🧠 一、核心观点概览 计算机视觉(Computer Vision, CV)是深度学习最成功的应用领域之一,但与其他领域(如语音识别、NLP)相比,它具有以下特点: 数据相对稀缺:即使有百万级图像数据集,对于高复杂度任务(如目标检测)仍显不足。 高度依赖手工工程(Hand-engineering)...

07 迁移学习(Transfer Learning)

07 迁移学习(Transfer Learning) 迁移学习(Transfer Learning)是深度学习,尤其是计算机视觉(Computer Vision)领域中极为重要且高效的技术。其核心思想是:利用在大规模数据集上预训练好的模型权重,作为新任务模型的初始化参数,从而显著提升小数据集上的训练效果与收敛速度。 一、迁移学习的基本原理 1.1 为什么使用迁移学习? 数据...

05 谷歌 Inception 网络简介(Inception network motivation)

05 谷歌 Inception 网络简介(Inception network motivation) Inception网络核心思想与架构解析 Inception网络(也称GoogLeNet)的核心动机在于解决传统卷积神经网络设计中的一个核心难题:人工选择卷积核尺寸(1×1, 3×3, 5×5)或池化层的决策困境。Inception模块通过一种巧妙的并行架构,让网络自行决定在每一层需要什...

03 残差网络(ResNets)——深度神经网络的突破

03 残差网络(ResNets)——深度神经网络的突破 🌟 课程核心目标 本节旨在解决深度神经网络训练中的梯度消失与梯度爆炸问题,通过引入“跳跃连接”(Skip Connection)构建残差网络(Residual Networks, ResNets) ,使得网络可以训练得更深、更稳定、性能更强。 🔍 一、传统神经网络的局限性 ❌ 问题:深度网络难以训练 随着网络层数增加,会出...

02 经典神经网络(Classic Networks)

02 经典神经网络(Classic Networks) 课程总结 本节课程介绍了深度学习发展史中三个具有里程碑意义的经典卷积神经网络(CNN)结构:LeNet-5、AlexNet 和 VGG-16。这些模型为现代计算机视觉奠定了基础,理解它们的结构、设计思想和历史背景对于深入掌握深度学习至关重要。 🎯 课程目标 理解 LeNet-5、AlexNet、VGG-16 的整体架构...

01 为什么要进行实例探究?(Why look at case studies?)

01 为什么要进行实例探究?(Why look at case studies?) 一、为什么要研究 CNN 实例?(Why Look at Case Studies?) 核心目的: 从实践中学习架构设计思想:虽然我们已经掌握了 CNN 的基本构件(卷积层、池化层、全连接层等),但如何将它们有效组合以解决实际问题,才是关键。 迁移能力:在计算机视觉任务中表现优异的网络架构(如...