Leon Yi

04 滑动窗口的卷积实现(Convolutional Implementation of Sliding Windows)

04 滑动窗口的卷积实现(Convolutional Implementation of Sliding Windows) 一、背景:传统滑动窗口方法的问题 在目标检测任务中,传统滑动窗口方法的做法是: 将输入图像划分为多个固定大小(如 $14 \times 14$)的子区域; 对每个子区域单独送入一个训练好的分类 CNN; 输出该区域是否包含目标(如行人、汽车等)及其类...

03 目标检测(Object Detection)

03 目标检测(Object Detection) 一、课程目标 本节旨在讲解如何构建一个 基于滑动窗口(Sliding Window)的卷积神经网络目标检测系统,从基础的图像分类与定位任务出发,逐步过渡到多目标检测场景。 二、前置知识回顾 在进入目标检测前,课程已覆盖两个相关任务: 图像分类(Image Classification) :判断图像中是否包含某类物体(如“...

02 特征点检测

02 特征点检测 1. 概述 特征点检测是利用神经网络在图像中定位特定对象的关键点的过程。这些关键点可以用于识别和描述对象的特征,如人脸、人体姿态等。通过训练神经网络输出这些特征点的坐标值,我们可以实现对目标对象的精确定位和分析。 2. 基本概念与应用实例 对象定位:通过神经网络输出四个参数 $(b_x, b_y, b_h, b_w)$,给出图片中对象的边界框。 ...

09 计算机视觉现状(The state of computer vision)

09 计算机视觉现状(The state of computer vision) 🧠 一、核心观点概览 计算机视觉(Computer Vision, CV)是深度学习最成功的应用领域之一,但与其他领域(如语音识别、NLP)相比,它具有以下特点: 数据相对稀缺:即使有百万级图像数据集,对于高复杂度任务(如目标检测)仍显不足。 高度依赖手工工程(Hand-engineering)...

07 迁移学习(Transfer Learning)

07 迁移学习(Transfer Learning) 迁移学习(Transfer Learning)是深度学习,尤其是计算机视觉(Computer Vision)领域中极为重要且高效的技术。其核心思想是:利用在大规模数据集上预训练好的模型权重,作为新任务模型的初始化参数,从而显著提升小数据集上的训练效果与收敛速度。 一、迁移学习的基本原理 1.1 为什么使用迁移学习? 数据...