设f和g为两个关于x可导函数,则有下面的公式:
$$
(f\circ g)’(x)=f’(g(x))g’(x)
$$
考虑函数z = f(x, y),其中x = g(t),y = h(t),g(t)和h(t)是可微函数
$$
\frac{dz}{dx} = \frac{\partial z}{\partial x} \frac{\partial x}{\partial t} + \frac{\partial z}{\partial y} \frac{\partial y}{\partial t}
$$
这个公式是作为梯度下降算法的基本参照