13 梯度检查(Gradient Checking)
发表于
本文字数:
1.4k
阅读时长 ≈
5 分钟
12 梯度的数值近似(Numerical Approximation of Gradients)
发表于
本文字数:
726
阅读时长 ≈
3 分钟
11 深度神经网络的权重初始化(Weight Initialization for Deep Networks)
发表于
本文字数:
920
阅读时长 ≈
3 分钟
10 梯度消失与梯度爆炸问题(Vanishing / Exploding Gradients)
发表于
本文字数:
817
阅读时长 ≈
3 分钟