06 神经风格迁移
06 神经风格迁移 什么是神经风格迁移? 神经风格迁移是一种利用深度学习技术将一张图片的内容与另一张图片的风格结合起来生成新的图像的技术。该技术的核心在于使用卷积神经网络(CNN)来提取并结合内容图像和风格图像中的特征。 主要概念 内容图像 $C$:你想要保留其主要内容的图像。 风格图像 $S$:你希望应用到内容图像上的风格来源图像。 生成图像 $G$:通过算法处理后得...
06 神经风格迁移 什么是神经风格迁移? 神经风格迁移是一种利用深度学习技术将一张图片的内容与另一张图片的风格结合起来生成新的图像的技术。该技术的核心在于使用卷积神经网络(CNN)来提取并结合内容图像和风格图像中的特征。 主要概念 内容图像 $C$:你想要保留其主要内容的图像。 风格图像 $S$:你希望应用到内容图像上的风格来源图像。 生成图像 $G$:通过算法处理后得...
05 人脸验证与二分类 一、核心思想 将 人脸验证(Face Verification) 问题转化为一个 监督学习的二分类任务: 输入:一对人脸图像 $(x^{(1)}, x^{(2)})$ 输出:标签 $y \in {0, 1}$ $y = 1$:两张图是同一个人 $y = 0$:两张图是不同人 这与 Tr...
04 Triplet 损失 🧠 一、Triplet 损失的核心思想 Triplet 损失是一种用于度量学习(Metric Learning) 的损失函数,特别适用于人脸识别等需要学习“相似性”的任务。 目标:训练一个神经网络,使其对同一个人的两张人脸图像生成相近的编码(embedding) ,而对不同人的图像生成相距较远的编码。 实现方式:通过构造三元组(Tripl...
03 Siamese 网络(用于人脸识别) 一、核心思想 Siamese 网络是一种双分支结构的神经网络,用于衡量两个输入之间的相似度。在人脸识别任务中,其目标是: 若两张人脸属于同一人,则它们的编码应相近;若属于不同人,则编码应相距较远。 二、网络结构 输入:两张人脸图像 $x^{(1)}$ 和 $x^{(2)}$ 使用同一个卷积神经网络(共享参数)分别处理...
02 One-Shot Learning(一次性学习) 一、问题背景 在人脸识别的实际应用场景中,常常面临 “一次性学习(One-shot learning)” 的挑战: 每个身份(如员工)在数据库中仅有一张参考图像; 系统需要仅凭这一张图像,就能识别出新输入的人脸是否属于该身份; 若使用传统分类方法(如 Softmax 分类器),则: ...
01 什么是人脸识别?(What is face recognition?) 一、课程背景与目标 本节是卷积神经网络(CNN)课程的最后一周的开篇。 目标:介绍 CNN 的两个重要应用: 人脸识别(Face Recognition) 神经风格迁移(Neural Style Transfer) 本节聚焦于人脸识别系...
10 候选区域(Region Proposals, Optional) 🧠 一、核心思想:从滑动窗口到候选区域 1. 滑动窗口法的问题 传统方法:在图像上使用固定大小的滑动窗口,对每个窗口运行分类器(如 CNN),判断是否包含目标(如车辆、行人等)。 主要缺点: 计算冗余:大量窗口覆盖的是“空背景”区域(如天空、道路),无实际目标,却仍需运行...
09 YOLO 算法(Putting it together: YOLO algorithm) 🧠 一、YOLO 算法整体思想 YOLO(You Only Look Once)是一种单阶段(one-stage)目标检测算法,其核心思想是: 将目标检测问题转化为回归问题:给定一张图像,通过一个卷积神经网络直接预测出所有目标的边界框(bounding box)及其类别概率。 YO...
08 Anchor Boxes(锚框) 一、问题背景 在基础的目标检测方法(如 YOLO v1)中,每个网格单元(grid cell)只能预测 一个对象。 但现实中,多个对象的中心点可能落在同一个网格内,例如一张图中行人与汽车的中心几乎重合。 ❗ 问题:若一个格子中存在多个对象,则无法同时检测它们。 二、Anchor Box 的核心思想 为解决上述问题,引入 Ancho...
07 非极大值抑制(Non-Max Suppression, NMS) 一、问题背景 在基于网格(grid cell)的对象检测算法(如 YOLO)中,每个网格单元都会独立预测是否存在目标及其边界框(bounding box)。 但由于目标可能跨越多个网格,多个相邻网格可能都预测了同一个目标,导致对同一对象产生多个重复的检测结果。 💡 目标:确保每个真实对象只被检测一次。 ...