Leon Yi

11 一维到三维推广(1D and 3D generalizations of models)

11 一维到三维推广(1D and 3D generalizations of models) 一、核心思想 卷积神经网络(ConvNets)最初为处理 2D 图像 而设计,但其核心机制——局部感受野 + 权重共享 + 平移不变性——具有高度通用性,可自然推广至 1D 时间序列 和 3D 体数据(如医学影像、视频) 。 关键洞察:卷积操作的本质是 滑动窗口特征检测器,维度只是输入...

07 CNN特征可视化(What are deep ConvNets learning?)

07 CNN特征可视化(What are deep ConvNets learning?) 一、核心问题:深度卷积神经网络到底在学什么? 深度卷积神经网络(ConvNets)通过多层非线性变换从原始图像中自动提取特征。理解每一层学到的内容,有助于: 解释模型行为 调试网络结构 构建高级应用(如神经风格迁移) 本节通过特征可视化方法,揭示不同深度隐藏单元所响应的图像模式...

06 神经风格迁移

06 神经风格迁移 什么是神经风格迁移? 神经风格迁移是一种利用深度学习技术将一张图片的内容与另一张图片的风格结合起来生成新的图像的技术。该技术的核心在于使用卷积神经网络(CNN)来提取并结合内容图像和风格图像中的特征。 主要概念 内容图像 $C$:你想要保留其主要内容的图像。 风格图像 $S$:你希望应用到内容图像上的风格来源图像。 生成图像 $G$:通过算法处理后得...

03 Siamese 网络(用于人脸识别)

03 Siamese 网络(用于人脸识别) 一、核心思想 Siamese 网络是一种双分支结构的神经网络,用于衡量两个输入之间的相似度。在人脸识别任务中,其目标是: 若两张人脸属于同一人,则它们的编码应相近;若属于不同人,则编码应相距较远。 二、网络结构 输入:两张人脸图像 $x^{(1)}$ 和 $x^{(2)}$ 使用同一个卷积神经网络(共享参数)分别处理...