Leon Yi

06 神经风格迁移

06 神经风格迁移 什么是神经风格迁移? 神经风格迁移是一种利用深度学习技术将一张图片的内容与另一张图片的风格结合起来生成新的图像的技术。该技术的核心在于使用卷积神经网络(CNN)来提取并结合内容图像和风格图像中的特征。 主要概念 内容图像 $C$:你想要保留其主要内容的图像。 风格图像 $S$:你希望应用到内容图像上的风格来源图像。 生成图像 $G$:通过算法处理后得...

03 Siamese 网络(用于人脸识别)

03 Siamese 网络(用于人脸识别) 一、核心思想 Siamese 网络是一种双分支结构的神经网络,用于衡量两个输入之间的相似度。在人脸识别任务中,其目标是: 若两张人脸属于同一人,则它们的编码应相近;若属于不同人,则编码应相距较远。 二、网络结构 输入:两张人脸图像 $x^{(1)}$ 和 $x^{(2)}$ 使用同一个卷积神经网络(共享参数)分别处理...

10 候选区域(Region Proposals, Optional)

10 候选区域(Region Proposals, Optional) 🧠 一、核心思想:从滑动窗口到候选区域 1. 滑动窗口法的问题 传统方法:在图像上使用固定大小的滑动窗口,对每个窗口运行分类器(如 CNN),判断是否包含目标(如车辆、行人等)。 主要缺点: 计算冗余:大量窗口覆盖的是“空背景”区域(如天空、道路),无实际目标,却仍需运行...

08 Anchor Boxes(锚框)

08 Anchor Boxes(锚框) 一、问题背景 在基础的目标检测方法(如 YOLO v1)中,每个网格单元(grid cell)只能预测 一个对象。 但现实中,多个对象的中心点可能落在同一个网格内,例如一张图中行人与汽车的中心几乎重合。 ❗ 问题:若一个格子中存在多个对象,则无法同时检测它们。 二、Anchor Box 的核心思想 为解决上述问题,引入 Ancho...

07 非极大值抑制(Non-Max Suppression, NMS)

07 非极大值抑制(Non-Max Suppression, NMS) 一、问题背景 在基于网格(grid cell)的对象检测算法(如 YOLO)中,每个网格单元都会独立预测是否存在目标及其边界框(bounding box)。 但由于目标可能跨越多个网格,多个相邻网格可能都预测了同一个目标,导致对同一对象产生多个重复的检测结果。 💡 目标:确保每个真实对象只被检测一次。 ...