dL／dz 的推导

发表于 2025/12/08 更新于 2025/12/08

作者 Leon Yi

1 分钟阅读

dL／dz 的推导

　　推导在二分类逻辑回归（使用 sigmoid 激活函数 + 交叉熵损失）中，损失函数 $L$ 对线性输出 $z$ 的导数：

\[\frac{dL}{dz} = a - y\]

　　其中：

　　根据链式法则：

\[\frac{dL}{dz} = \frac{dL}{da} \cdot \frac{da}{dz}\]

　　损失函数：

\[L = -\big( y \log a + (1 - y) \log(1 - a) \big)\]

　　对 $a$ 求导：

\[\frac{dL}{da} = -\left( \frac{y}{a} - \frac{1 - y}{1 - a} \right) = \frac{-y}{a} + \frac{1 - y}{1 - a}\]

　　通分后化简：

\[\frac{dL}{da} = \frac{a - y}{a(1 - a)}\]

　　因为 $a = \sigma(z)$，而 sigmoid 函数的导数为：

\[\frac{d}{dz} \sigma(z) = \sigma(z)(1 - \sigma(z)) = a(1 - a)\]

　　所以：

\[\frac{da}{dz} = a(1 - a)\]

\[\frac{dL}{dz} = \frac{a - y}{a(1 - a)} \cdot a(1 - a) = a - y\]

　　✅ 最终结果：

\[\boxed{\frac{dL}{dz} = a - y}\]

本文由作者按照 CC BY 4.0 进行授权

热门标签