DevDino 🦖

我曾七次鄙视自己的灵魂

一、整体目标

  • 实现一个 L 层深度神经网络 的前向传播和反向传播。
  • 前向传播用于计算预测值 $\hat{y}$;
  • 反向传播用于计算损失函数对各参数的梯度($\frac{\partial \mathcal{L}}{\partial W^{[l]}}$, $\frac{\partial \mathcal{L}}{\partial b^{[l]}}$),用于参数更新。
阅读全文 »

一、核心观点

深度神经网络之所以在许多任务中表现优异,关键不在于参数总量大,而在于网络“深”——即具有多层隐藏层。这种“深度”使得网络能够以层次化、组合式的方式学习从简单到复杂的特征表示。

阅读全文 »

🎯 课程核心目标

  在实现深度神经网络时,确保各层权重 **$W^{[l]}$**​ 、偏置 **$b^{[l]}$**​ 、激活值 **$a^{[l]}$**​ 、线性输出 $z^{[l]}$ 等变量的维度正确,是避免 bug、调试代码的关键技巧。本节重点讲解如何通过手算维度来验证前向传播(forward propagation)中的矩阵运算是否合理。

阅读全文 »