Leon Yi

03 单一数字评估指标(Single Number Evaluation Metric)

03 单一数字评估指标(Single Number Evaluation Metric) 🎯 课程核心思想 在机器学习系统开发过程中,快速迭代是提升性能的关键。而要实现快速判断哪个模型/超参数/算法更好,必须依赖一个单一实数评估指标(single real-number evaluation metric) 。 多指标(如查准率 + 查全率、多个地区的错误率)虽然信息丰富,但会阻碍快速决...

02 正交化(Orthogonalization)

02 正交化(Orthogonalization) 一、正交化的核心思想 正交化(Orthogonalization) 是一种系统性调试与优化机器学习模型的方法论。其核心理念是: 每个“控制旋钮”(即调整手段)应尽可能只影响一个目标性能指标,而不干扰其他方面。 这类似于老式电视机上的旋钮: 一个旋钮只调高度, 一个只调宽度, 一个只调梯形校正, 而不是一...

01 为什么是ML策略?(Why ML Strategy?)

01 为什么是ML策略?(Why ML Strategy?) 1. 什么是ML策略? 机器学习策略是指在优化和改进机器学习系统时所采取的方法。它帮助你更快速、高效地提升系统的性能,避免走弯路。 2. 启发性例子 以猫分类器为例,假设已经达到了90%的准确率但仍未满足需求。这时可以考虑以下几种改进方法: 收集更多的训练数据。 增加训练集的多样性(如不同姿势的猫咪图片)。 ...

35 TensorFlow 基础与自动微分机制

一、核心目标   通过一个简单的二次损失函数优化问题,演示 TensorFlow 程序的基本结构,并揭示其如何自动完成: 前向计算(定义损失函数) 反向传播(自动求导) 参数更新(优化器)   从而为训练复杂神经网络打下基础。 二、示例问题:最小化一个二次损失函数   给定损失函数: [J(w) = w^2 - 10w + 25 = (w - 5)^2]  ...

34 深度学习框架(Deep Learning Frameworks)的价值与选择标准

一、为什么需要深度学习框架?   尽管从零开始用 Python + NumPy 实现神经网络(如前向传播、反向传播、梯度下降等)有助于理解底层原理,但在实际工程中存在明显局限: 难以扩展:实现 CNN、RNN、Transformer 等复杂结构代码量大、易出错; 效率低下:NumPy 在 CPU 上运行,缺乏 GPU 加速、自动并行、内存优化; 重复造轮子:每个项目都要重写...

30 Batch Normalization 为何有效?

一、直观理解:对隐藏层激活值进行归一化,加速训练   在传统神经网络中,我们常对输入特征 $x$ 进行归一化(如减去均值、除以标准差),使其具有相近的尺度(例如均值为 0,方差为 1),从而加速优化过程。 Batch Norm 将这一思想推广到每一层的隐藏单元(即中间激活值),使得每一层的输入分布更稳定。 ✅ 关键点:不仅输入 $x$ 需要归一化,隐藏层的激活值 $a^{[l]}$...