01 计算机视觉(Computer vision)
01 计算机视觉(Computer vision) 计算机视觉与深度学习 计算机视觉领域的发展得益于深度学习技术的进步,这使得许多之前难以实现的应用成为可能。例如,自动驾驶汽车能够识别行人和其它车辆并避开它们;人脸识别技术提高了手机解锁的安全性和便捷性。 应用案例 图片分类(Image Classification) :给定一张大小为 $64 \times 64$ 的图片,训练...
01 计算机视觉(Computer vision) 计算机视觉与深度学习 计算机视觉领域的发展得益于深度学习技术的进步,这使得许多之前难以实现的应用成为可能。例如,自动驾驶汽车能够识别行人和其它车辆并避开它们;人脸识别技术提高了手机解锁的安全性和便捷性。 应用案例 图片分类(Image Classification) :给定一张大小为 $64 \times 64$ 的图片,训练...
10 是否使用端到端深度学习(Whether to use end-to-end learning?) 🎯 核心问题 在构建一个机器学习系统时,是否应该采用端到端(end-to-end)深度学习方法? 端到端学习是指:直接从原始输入 $x$ 学习到最终输出 $y$ 的映射函数 $f: x \mapsto y$,中间不引入人工设计的模块或中间表示。 ✅ 端到端学习的优点 ...
09 端到端深度学习(End-to-End Deep Learning) 一、什么是端到端深度学习? 定义 端到端深度学习是指:使用一个单一的神经网络模型,直接从原始输入 $x$ 映射到目标输出 $y$,而跳过传统多阶段流水线中的手工设计中间模块。 形式化表示为: [y = f_\theta(x)] 其中 $f_\theta$ 是一个可训练的深度神经网络,$\theta$...
08 多任务学习(Multi-task Learning) 一、多任务学习 vs 迁移学习 特性 迁移学习(Transfer Learning) 多任务学习(Multi-task Learning) 学习方式 串行:先在源任务上训练,再迁移到目标任务 并行:同时训练多...
07 迁移学习(Transfer Learning) 一、核心思想 迁移学习的核心理念是:在一个任务(源任务)上训练好的模型,其学到的知识可以迁移到另一个相关但不同的目标任务上,从而提升目标任务的学习效率或性能,尤其是在目标任务数据量较少的情况下。 关键直觉:神经网络的前几层通常学习的是通用的低层次特征(如边缘、纹理、曲线等),这些特征在多个视觉或听觉任务中具有共通性。 ...
06 处理数据不匹配问题(Addressing Data Mismatch) 一、问题背景:训练集与开发/测试集分布不一致 在实际机器学习项目中,常常出现: 训练集 来自一个分布(例如安静环境下的语音) 开发集 / 测试集 来自另一个更真实但不同的分布(例如车内有噪声的语音) 此时即使模型在训练集上表现很好,在开发集上性能却显著下降,这称为 数据不匹配问题(Data Mi...
05 数据分布不匹配时的偏差与方差分析(Bias and Variance with Mismatched Data Distributions) 一、背景问题:训练集与开发/测试集分布不同 在传统机器学习中,我们假设: 训练集、开发集(Dev)、测试集(Test)来自同一分布。 此时可通过比较 训练误差 $E_{\text{train}}$ 与 开发误差 $E_{\text...
04 使用来自不同分布的数据进行训练和测试(Training and testing on different distributions) 一、核心问题:训练集与开发/测试集分布不一致 在深度学习实践中,常常面临以下困境: 目标分布(Target Distribution) :模型最终需要部署的真实场景数据(如用户手机上传的模糊照片、车载语音指令)。 辅助数据(Auxili...
03 快速搭建你的第一个系统,并进行迭代 1. 为什么不要一开始就追求完美? 在开发一个全新的机器学习应用时(如语音识别、医疗图像分析等),存在大量可能的优化方向(例如抗噪、口音鲁棒性、远场识别、儿童语音处理等)。面对这些选择,初学者或新项目团队很容易陷入“分析瘫痪”(analysis paralysis)——花太多时间思考“最佳起点”,却迟迟不行动。 ✅ 关键洞见: 对于新问题...
02 清除标注错误的数据(Cleaning up Incorrectly Labeled Data) 一、问题背景 在监督学习中,训练数据由输入 $x^{(i)}$ 和标签 $y^{(i)}$ 构成。但在实际项目中,标签可能出错(即人类标注错误),例如: 将狗误标为猫($y=1$ 应为 $y=0$); 或将非猫图像(如猫的图画)误标为猫。 这类样本称为 “标记错误的样本...