Leon Yi

01 训练集(Train)、开发集(Dev)和测试集(Test)

一、背景:应用机器学习是一个高度迭代的过程 在实际深度学习项目中,你无法在第一次就准确设定所有超参数(如网络层数、每层神经元数量、学习率、激活函数等)。 因此,应用机器学习 = 提出想法 → 编码实现 → 实验评估 → 迭代优化。 迭代效率 决定了你能否快速找到高性能模型。 💡 关键点:快速实验循环 是成功的关键,而合理划分数据集是提升该效率的核心手段。 二...

36 深度神经网络构建模块(Building Blocks of Deep Neural Networks)

一、核心思想   深度神经网络的训练依赖于两个关键过程: 前向传播(Forward Propagation) :从输入到输出逐层计算激活值。 反向传播(Backward Propagation) :从输出误差出发,逐层计算梯度,用于参数更新。   每一层都可视为一个“计算单元”,包含独立的前向函数和反向函数,并通过缓存(cache) 传递中间变量(尤其是 $z^{[l]}$...

35 为什么深度表示(Deep Representations)有效?

一、核心观点 深度神经网络之所以在许多任务中表现优异,关键不在于参数总量大,而在于网络“深”——即具有多层隐藏层。这种“深度”使得网络能够以层次化、组合式的方式学习从简单到复杂的特征表示。 二、直观理解:层次化特征学习(Hierarchical Feature Learning) 1. 图像识别中的例子(如人脸识别) 第1层(浅层) :检测边缘(edges...