设f和g为两个关于x可导函数,则有下面的公式:
$$ (f\circ g)‘(x)=f’(g(x))g’(x) $$
考虑函数z = f(x, y),其中x = g(t),y = h(t),g(t)和h(t)是可微函数
$$ \frac{dz}{dx} = \frac{\partial z}{\partial x} \frac{\partial x}{\partial t} + \frac{\partial z}{\partial y} \frac{\partial y}{\partial t} $$
这个公式是作为梯度下降算法的基本参照