Regra da cadeia para funções de uma variável
A regra da cadeia é, intuitivamente, um produto de duas derivadas. Suponha que temos três objetos móveis: A, B e C e que suas respectivas velocidades são A > B > C. Se soubermos quantas vezes a velocidade de A é maior em relação à B e B em relação à C, então podemos saber quantas vezes A é maior em relação à C também. O que precisamos fazer é multiplicar a razão entre A e B pela razão entre B e C. Este exemplo esta em Artigo (em inglês) na Wikipedia.
Outro exemplo. Na meteorologia temos a Lapse rate (taxa vertical de variação da temperatura em português) que é a variação da temperatura em relação à altura na atmosfera. É uma razão °C / km. Se voarmos para cima ou para baixo sentimos mudanças na temperatura porque estamos nos deslocando em relação a cada nível de temperatura na atmosfera. O oposto disto não acontece porque se ficarmos parados a atmosfera não irá subir ou descer em relação a nós. Voando mais rápido naturalmente resulta em mudanças mais rápidas de temperatura. Nossa velocidade é uma razão km / tempo. Se quisermos a razão °C / tempo precisamos calcular o produto [math]\displaystyle{ \frac{^{\text{o}}C}{km} \frac{km}{tempo} = \frac{^{\text{o}}C}{tempo} }[/math].
[math]\displaystyle{ \frac{dy}{dx} = \frac{dy}{du} \frac{du}{dx} }[/math]
É importante ressaltar uma coisa: o exemplo acima da temperatura atmosférica é um caso linear (assumindo que voamos a uma velocidade constante), que se traduz em [math]\displaystyle{ T_1'(t) = T_2'(h) \cdot h'(t) }[/math]. Onde [math]\displaystyle{ T_1'(t) }[/math] é a variação da temperatura pelo tempo e o lado direito é o produto da variação da temperatura pela altura pela variação da altura pelo tempo. Perceba que a função inserida em [math]\displaystyle{ T_2'(h) }[/math] é a função que dá a razão altura / tempo. Perceba que existem duas taxas de variação diferentes.
[math]\displaystyle{ h'(x) = g'(x) \cdot f'(g(x)) }[/math]
Podemos ter qualquer quantidade de funções inseridas uma na outra. A regra continua válida e o nome advém do fato de que temos uma corrente de operações, uma corrente de derivadas.
Observação: às vezes temos funções compostas mas não as vemos claramente. Por exemplo: [math]\displaystyle{ y = \text{sen}^2(x) }[/math]. É claro que temos um produto [math]\displaystyle{ y = \text{sen}(x) \text{sen}(x) }[/math], mas também poderíamos ver assim [math]\displaystyle{ y = x^2 }[/math] e [math]\displaystyle{ x = \text{sen}(x) }[/math]. Numa notação mais convencional: [math]\displaystyle{ f(x) = x^2 }[/math], [math]\displaystyle{ g(x) = \text{sen}(x) }[/math] e [math]\displaystyle{ f \circ g = \text{sen}^2(x) }[/math]. Isto é especialmente comum com a diferenciação implícita.
Raciocínio gráfico para a regra da cadeia
Eu não conheço livros que mostrem uma interpretação gráfica para a regra da cadeia. Vamos considerar [math]\displaystyle{ f(x) = 3x }[/math] e [math]\displaystyle{ g(x) = x^2 }[/math]. O gráfico da primeira é uma reta e a constante é o coeficiente angular, onde maior significa uma inclinação maior. A segunda é uma parábola. A primeira tem uma taxa de variação constante, enquanto a segunda não tem uma taxa constante.
O gráfico de [math]\displaystyle{ g(f(x)) = (3x)^2 }[/math] tem uma taxa de variação maior do que o gráfico de [math]\displaystyle{ g(x) = x^2 }[/math]. Pense sobre isto: se escolhermos [math]\displaystyle{ x = 2 }[/math] as taxas de variação são, naquele ponto e para cada função, [math]\displaystyle{ f'(2) = 6 }[/math] e [math]\displaystyle{ g'(2) = 4 }[/math]. Para a função composta temos [math]\displaystyle{ g'(f(x)) = f'(2)g'(f(2)) = 6 \cdot 2 \cdot 3 = 36 }[/math]. Eu fiz um exemplo com números positivos mas a regra da cadeia vale para negativos e também para funções mais complicadas.
Observação: neste caso específico poderíamos ter usado a regra do produto. Ou melhor ainda, a regra da potência.
Prova da regra da cadeia
É natural pensar que a derivada da função composta é a composição das derivadas. É a mesma intuição que normalmente acontece com as regras do produto e do quociente. Quando temos uma composição, o valor de uma função depende do valor da outra. Podemos facilmente ser enganados e pensar que a derivada de [math]\displaystyle{ f(g(x)) }[/math] é [math]\displaystyle{ f'(g'(x)) }[/math]. Matematicamente isto não faz sentido porque estamos apenas trocando uma função pela sua derivada. Quem disse que esta certo trocar uma função pela sua derivada e esperar que o resultado desta operação faça sentido? Quem disse que a taxa de variação de [math]\displaystyle{ f }[/math] depende da taxa de variação de [math]\displaystyle{ g }[/math] ?
O problema de achar a reta tangente descreve como uma função diferenciável pode ser aproximada por uma função linear se considerarmos um intervalo suficientemente pequeno ao redor de um ponto. Vamos começar definindo duas funções afim:
[math]\displaystyle{ f(x) = ax + b }[/math]
[math]\displaystyle{ g(x) = cx + d }[/math]
Vamos dar uma olhada em:
[math]\displaystyle{ f(g(x)) = ag(x) + b }[/math]
[math]\displaystyle{ f(cx + d) = a(cx + d) + b }[/math]
[math]\displaystyle{ f \circ g = acx + ad + b }[/math]
Você percebeu o produto entre dois coeficientes angulares, [math]\displaystyle{ a \cdot c }[/math]? Se diferenciarmos a expressão [math]\displaystyle{ acx + ad + b }[/math] em relação à [math]\displaystyle{ x }[/math], a operação resulta em [math]\displaystyle{ ac }[/math]! Surpresa! Porém, esta não é uma demonstração formal. A ideia fundamental por trás dela é que se a função é diferenciável, então nas proximidades de um ponto podemos tratá-la como uma função linear.
Links para a demonstração:
- https://ecalculo.if.usp.br/derivadas/regras_cadeia/links/regra.htm
- https://pt.khanacademy.org/math/ap-calculus-ab/ab-differentiation-2-new/ab-3-1b/a/proving-the-chain-rule
- https://www.obaricentrodamente.com/2016/07/funcoes-compostas-e-regra-da-cadeia.html
- https://www.youtube.com/watch?v=Lqc0DdEm2eI&list=PL7PW7YXa8HO2Fs9_tJXJTT-LaDAeco3Bp&index=40