DevDino 🦖

38 参数（Parameters）与超参数（Hyperparameters）

发表于 2025-12-24 本文字数： 1k 阅读时长 ≈ 4 分钟

一、核心概念区分

1. 参数（Parameters）

阅读全文 »

37 前向传播与反向传播

发表于 2025-12-24 本文字数： 1k 阅读时长 ≈ 4 分钟

一、整体目标

实现一个 L 层深度神经网络 的前向传播和反向传播。
前向传播用于计算预测值 $\hat{y}$；
反向传播用于计算损失函数对各参数的梯度（$\frac{\partial \mathcal{L}}{\partial W^{[l]}}$, $\frac{\partial \mathcal{L}}{\partial b^{[l]}}$），用于参数更新。

阅读全文 »

36 深度神经网络构建模块（Building Blocks of Deep Neural Networks）

发表于 2025-12-24 本文字数： 876 阅读时长 ≈ 3 分钟

一、核心思想

　　深度神经网络的训练依赖于两个关键过程：

阅读全文 »

35 为什么深度表示（Deep Representations）有效？

发表于 2025-12-24 本文字数： 1.1k 阅读时长 ≈ 4 分钟

一、核心观点

深度神经网络之所以在许多任务中表现优异，关键不在于参数总量大，而在于网络“深”——即具有多层隐藏层。这种“深度”使得网络能够以层次化、组合式的方式学习从简单到复杂的特征表示。

阅读全文 »

34 正确设置矩阵维度

发表于 2025-12-24 本文字数： 1k 阅读时长 ≈ 4 分钟

🎯 课程核心目标

　　在实现深度神经网络时，确保各层权重 **$W^{[l]}$** 、偏置 **$b^{[l]}$** 、激活值 **$a^{[l]}$** 、线性输出 $z^{[l]}$ 等变量的维度正确，是避免 bug、调试代码的关键技巧。本节重点讲解如何通过手算维度来验证前向传播（forward propagation）中的矩阵运算是否合理。

阅读全文 »