Regola della catena

Niente fonti!
Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.

In analisi matematica, la regola della catena è una regola di derivazione che permette di calcolare la derivata della funzione composta di due funzioni derivabili.

Definizione

La derivata della funzione composta è il prodotto tra la derivata della funzione esterna, avente come argomento la funzione interna, per la derivata della funzione interna:

D [ f ( g ( x ) ) ] = f ( g ( x ) ) g ( x ) . {\displaystyle \operatorname {D} [f(g(x))]=f'(g(x))\cdot g'(x).}

Le notazioni D [ f ( x ) ] {\displaystyle \operatorname {D} [f(x)]} e f ( x ) {\displaystyle f'(x)} indicano il medesimo significato di derivata.

La formula è valida anche per funzioni di più variabili reali e per funzioni vettoriali. Il teorema di derivazione delle funzioni composte afferma che se:

x ( t ) = ( x 1 ( t ) , x 2 ( t ) , , x n ( t ) ) , t R {\displaystyle \mathbf {x} (t)=(x_{1}(t),x_{2}(t),\dots ,x_{n}(t)),\quad t\in \mathbb {R} }

è un vettore di R n {\displaystyle \mathbb {R} ^{n}} le cui componenti sono funzioni derivabili

x ( t ) = ( x 1 ( t ) , x 2 ( t ) , , x n ( t ) ) {\displaystyle \mathbf {x} '(t)=(x'_{1}(t),x'_{2}(t),\dots ,x'_{n}(t))}

e se f {\displaystyle f} è una funzione differenziabile in x ( t ) {\displaystyle \mathbf {x} (t)} , allora la funzione composta

F ( t ) = f ( x ( t ) ) {\displaystyle F(t)=f(\mathbf {x} (t))}

è differenziabile nella variabile t {\displaystyle t} e si ha:

F ( t ) = i = 1 n f ( x ( t ) ) x i x i ( t ) = F ( t ) , x ( t ) = f ( x ( t ) ) , x ( t ) {\displaystyle F'(t)=\sum _{i=1}^{n}{\frac {\partial f(\mathbf {x} (t))}{\partial x_{i}}}x'_{i}(t)=\langle {\mathbf {\nabla } F(t)},{\mathbf {x} '(t)}\rangle =\langle {\mathbf {\nabla } f(\mathbf {x} (t))},{\mathbf {\mathbf {x} } '(t)}\rangle }

dove f {\displaystyle \nabla f} è il gradiente di f {\displaystyle f} e , {\displaystyle \langle \cdot ,\cdot \rangle } è il prodotto scalare euclideo.

Ad esempio, se f {\displaystyle f} è una funzione di due variabili composta dopo la funzione vettoriale ( g , h ) {\displaystyle (g,h)} , cioè f ( g ( t ) , h ( t ) ) {\displaystyle f(g(t),h(t))} , allora:

d f d t = f g d g d t + f h d h d t . {\displaystyle {df \over dt}={\partial f \over \partial g}{dg \over dt}+{\partial f \over \partial h}{dh \over dt}.}

Inoltre, se f {\displaystyle \mathbf {f} } e g {\displaystyle \mathbf {g} } sono due funzioni vettoriali differenziabili componibili, allora:

J [ ( f g ) ( x ) ] = J [ f ( g ( x ) ) ] J [ g ( x ) ] , {\displaystyle J[(\mathbf {f} \circ \mathbf {g} )(x)]=J[\mathbf {f} (\mathbf {g} (x))]\cdot J[\mathbf {g} (x)],}

dove {\displaystyle \cdot } è la moltiplicazione di matrici e J [ f ( x ) ] {\displaystyle J[\mathbf {f} (x)]} è la matrice jacobiana di f {\displaystyle \mathbf {f} } .

Dimostrazione

Sia, per non appesantire la notazione, Δ g := g ( x + h ) g ( x ) {\displaystyle \Delta g:=g(x+h)-g(x)} , da cui g ( x + h ) = g ( x ) + Δ g {\displaystyle g(x+h)=g(x)+\Delta g} . Definiamo ora

ω ( Δ g ) = { f ( g ( x ) + Δ g ) f ( g ( x ) ) Δ g f ( g ( x ) ) , se  Δ g 0 , 0 , se  Δ g = 0. {\displaystyle \omega (\Delta g)={\begin{cases}{\frac {f(g(x)+\Delta g)-f(g(x))}{\Delta g}}-f'(g(x)),&{\text{se }}\Delta g\neq 0,\\0,&{\text{se }}\Delta g=0.\end{cases}}}

È dunque

f ( g ( x ) + Δ g ) f ( g ( x ) ) = f ( g ( x ) ) Δ g + ω ( Δ g ) Δ g . {\displaystyle f(g(x)+\Delta g)-f(g(x))=f'(g(x))\cdot \Delta g+\omega (\Delta g)\cdot \Delta g.}

Inoltre, per l'ipotesi di derivabilità di f {\displaystyle f} , è

lim Δ g 0 ω ( Δ g ) = 0. {\displaystyle \lim _{\Delta g\to 0}\omega (\Delta g)=0.}

Esaminiamo ora il rapporto incrementale di f ( g ( x ) ) {\displaystyle f(g(x))} :

D [ f ( g ( x ) ) ] = lim h 0 f ( g ( x + h ) ) f ( g ( x ) ) h = lim h 0 f ( g ( x ) + Δ g ) f ( g ( x ) ) h = lim h 0 f ( g ( x ) ) Δ g + ω ( Δ g ) Δ g h . {\displaystyle \operatorname {D} [f(g(x))]=\lim _{h\to 0}{\frac {f(g(x+h))-f(g(x))}{h}}=\lim _{h\to 0}{\frac {f(g(x)+\Delta g)-f(g(x))}{h}}=\lim _{h\to 0}{\frac {f'(g(x))\cdot \Delta g+\omega (\Delta g)\cdot \Delta g}{h}}.}

Spezzando la frazione, abbiamo

lim h 0 f ( g ( x ) ) g ( x + h ) g ( x ) h + lim h 0 ω ( Δ g ) g ( x + h ) g ( x ) h . {\displaystyle \lim _{h\to 0}f'(g(x))\cdot {\frac {g(x+h)-g(x)}{h}}+\lim _{h\to 0}\omega (\Delta g)\cdot {\frac {g(x+h)-g(x)}{h}}.}

E quindi passando al limite

D [ f ( g ( x ) ) ] = f ( g ( x ) ) g ( x ) + 0 g ( x ) = f ( g ( x ) ) g ( x ) . {\displaystyle \operatorname {D} [f(g(x))]=f'(g(x))\cdot g'(x)+0\cdot g'(x)=f'(g(x))\cdot g'(x).}

Dimostrazione alternativa

Siano f : A R {\displaystyle f\colon A\to \mathbb {R} } e g : B A {\displaystyle g\colon B\to A} derivabili in ogni punto, dove A , B R {\displaystyle A,B\subseteq \mathbb {R} } .

Dalla definizione di derivata si ha

D [ ( f g ) ( x ) ] = lim t x f ( g ( t ) ) f ( g ( x ) ) t x . {\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{t-x}}.}

L'idea di fondo è dividere il numeratore del rapporto incrementale per g ( t ) g ( x ) {\displaystyle g(t)-g(x)} in modo da ottenere il rapporto incrementale di f {\displaystyle f} calcolato nel punto g ( x ) {\displaystyle g(x)} , e quindi poter esprimere la derivata della funzione composta in funzione della derivata di f {\displaystyle f} calcolata in g ( x ) {\displaystyle g(x)} . Moltiplichiamo e dividiamo (che equivale a moltiplicare per 1 {\displaystyle 1} , preservando l'uguaglianza), il secondo membro per g ( t ) g ( x ) {\displaystyle g(t)-g(x)} :

D [ ( f g ) ( x ) ] = lim t x f ( g ( t ) ) f ( g ( x ) ) t x g ( t ) g ( x ) g ( t ) g ( x ) . {\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{t-x}}{\frac {g(t)-g(x)}{g(t)-g(x)}}.}

Per le proprietà associativa e commutativa del prodotto otteniamo:

D [ ( f g ) ( x ) ] = lim t x f ( g ( t ) ) f ( g ( x ) ) g ( t ) g ( x ) g ( t ) g ( x ) t x . {\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{t\to x}{\frac {f(g(t))-f(g(x))}{g(t)-g(x)}}{\frac {g(t)-g(x)}{t-x}}.}

Poiché per ipotesi f {\displaystyle f} e g {\displaystyle g} sono derivabili, esistono i limiti dei rapporti incrementali, rispettivamente lim a b f ( a ) f ( b ) a b = D [ f ( b ) ] {\displaystyle \lim _{a\to b}{f(a)-f(b) \over a-b}=\operatorname {D} [f(b)]} e lim α β g ( α ) g ( β ) α β = D [ g ( β ) ] {\displaystyle \lim _{\alpha \to \beta }{g(\alpha )-g(\beta ) \over \alpha -\beta }=\operatorname {D} [g(\beta )]} , in qualsiasi punto del dominio; ma per questo, dopo aver applicato nel primo limite del rapporto incrementale la sostituzione g ( t ) := θ {\displaystyle g(t):=\theta } , il limite del prodotto di quei rapporti incrementali è uguale al prodotto dei loro limiti presi separati:

D [ ( f g ) ( x ) ] = lim θ g ( x ) f ( θ ) f ( g ( x ) ) θ g ( x ) lim t x g ( t ) g ( x ) t x = f ( g ( x ) ) g ( x ) {\displaystyle \operatorname {D} [(f\circ g)(x)]=\lim _{\theta \to g(x)}{\frac {f(\theta )-f(g(x))}{\theta -g(x)}}\lim _{t\to x}{\frac {g(t)-g(x)}{t-x}}=f'(g(x))\cdot g'(x)}


Dimostrazione con "o" piccolo

Si considerino due funzioni f , g : [ a , b ] R {\displaystyle f,g\colon [a,b]\to \mathbb {R} } e la funzione composta H ( x ) = g ( f ( x ) ) , {\displaystyle H(x)=g\left(f(x)\right),} allora è possibile scrivere i rapporti incrementali delle funzioni in questo modo:

  • f ( x + h ) f ( x ) = f ( x ) h + o 1 ( h ) ; {\displaystyle f(x+h)-f(x)=f'(x)h+o_{1}(h);}
  • g ( y + k ) g ( y ) = g ( y ) k o 2 ( k ) ; {\displaystyle g(y+k)-g(y)=g'(y)k-o_{2}(k);}
  • H ( x + h ) H ( x ) = α ( x ) h o 3 ( h ) . {\displaystyle H(x+h)-H(x)=\alpha (x)h-o_{3}(h).}

A questo punto si passa alla riscrittura di H ( x + h ) H ( x ) {\displaystyle H(x+h)-H(x)} tenendo conto che H ( x ) = g ( f ( x ) ) {\displaystyle H(x)=g\left(f(x)\right)} quindi si ha:

H ( x + h ) H ( x ) = g ( f ( x + h ) ) g ( f ( x ) ) . {\displaystyle H(x+h)-H(x)=g(f(x+h))-g(f(x)).}

Si ricordi che f ( x + h ) = f ( x ) + f ( x ) h + o 1 ( h ) , {\displaystyle f(x+h)=f(x)+f'(x)h+o_{1}(h),} quindi si ha:

H ( x + h ) H ( x ) = g ( f ( x ) + f ( x ) h + o 1 ( h ) ) g ( f ( x ) ) . {\displaystyle H(x+h)-H(x)=g(f(x)+f'(x)h+o_{1}(h))-g(f(x)).}

Si effettua la sostituzione f ( x ) = y {\displaystyle f(x)=y} e k = f ( x ) h + o 1 ( h ) {\displaystyle k=f'(x)h+o_{1}(h)} e si scrive:

H ( x + h ) H ( x ) = g ( y + k ) g ( y ) = g ( y ) k o 2 ( k ) = g ( f ( x ) ) ( f ( x ) h + o 1 ( h ) ) o 2 ( k ) = g ( f ( x ) ) f ( x ) h + g ( f ( x ) ) o 1 ( h ) o 2 ( k ) . {\displaystyle H(x+h)-H(x)=g(y+k)-g(y)=g'(y)k-o_{2}(k)=g'(f(x))\cdot (f'(x)h+o_{1}(h))-o_{2}(k)=g'(f(x))f'(x)h+g'(f(x))o_{1}(h)-o_{2}(k).}

Si pone α ( x ) = g ( f ( x ) ) f ( x ) {\displaystyle \alpha (x)=g'(f(x))f'(x)} e inoltre o 3 ( h ) = g ( f ( x ) ) o 1 ( h ) o 2 ( k ) , {\displaystyle o_{3}(h)=g'(f(x))o_{1}(h)-o_{2}(k),} così il teorema è dimostrato.

Osservazioni

  • Nella notazione di Leibniz, questo si riconduce all'identità
d f d x = d f d g d g d x , {\displaystyle {\frac {df}{dx}}={\frac {df}{dg}}\cdot {\frac {dg}{dx}},}

poiché d f ( g ) d x = d f ( g ) d g d g d x {\displaystyle {\frac {df(g)}{dx}}={\frac {df(g)}{dg}}\cdot {\frac {dg}{dx}}} , che è utile per fissare mnemonicamente il risultato (come se il d g {\displaystyle dg} si "semplificasse" nelle due frazioni), anche se ovviamente non costituisce una dimostrazione.

  • Applicando la formula iterativamente si può calcolare la derivata di una composizione di tre o più funzioni. Ad esempio:
D [ ( f g h ) ( x ) ] = f ( g ( h ( x ) ) ) g ( h ( x ) ) h ( x ) , {\displaystyle \operatorname {D} [(f\circ g\circ h)(x)]=f'(g(h(x)))\cdot g'(h(x))\cdot h'(x),}

e così via.

Esempio

Sia f ( x ) = log x 3 {\displaystyle f(x)=\log x-3} , g ( x ) = x 2 + 3 x {\displaystyle g(x)=x^{2}+3x} , h ( x ) = x 2 {\displaystyle h(x)={x \over 2}} . Allora:

( f g h ) ( x ) = log [ ( x 2 ) 2 + 3 x 2 ] 3 {\displaystyle (f\circ g\circ h)(x)=\log \left[\left({x \over 2}\right)^{2}+3{x \over 2}\right]-3}

e

D [ ( f g h ) ( x ) ] = 1 ( x 2 ) 2 + 3 x 2 ( 2 x 2 + 3 ) 1 2 . {\displaystyle \operatorname {D} [(f\circ g\circ h)(x)]={1 \over ({x \over 2})^{2}+3{x \over 2}}\cdot \left(2{x \over 2}+3\right)\cdot {1 \over 2}.}

Derivate successive

Lo stesso argomento in dettaglio: Formula di Faà di Bruno.

L'estensione della formula al calcolo delle derivate successive si deve a Faà di Bruno. In particolare, se f , g {\displaystyle f,g} possiedono tutte le derivate necessarie, allora risulta:

d 2 f d x 2 = d 2 f d g 2 ( d g d x ) 2 + d f d g d 2 g d x 2 ; {\displaystyle {\frac {d^{2}f}{dx^{2}}}={\frac {d^{2}f}{dg^{2}}}\left({\frac {dg}{dx}}\right)^{2}+{\frac {df}{dg}}{\frac {d^{2}g}{dx^{2}}};}
d 3 f d x 3 = d 3 f d g 3 ( d g d x ) 3 + 3 d 2 f d g 2 d g d x d 2 g d x 2 + d f d g d 3 g d x 3 . {\displaystyle {\frac {d^{3}f}{dx^{3}}}={\frac {d^{3}f}{dg^{3}}}\left({\frac {dg}{dx}}\right)^{3}+3{\frac {d^{2}f}{dg^{2}}}{\frac {dg}{dx}}{\frac {d^{2}g}{dx^{2}}}+{\frac {df}{dg}}{\frac {d^{3}g}{dx^{3}}}.}

Voci correlate

  • Regole di derivazione

Collegamenti esterni

  • (EN) William L. Hosch, chain rule, su Enciclopedia Britannica, Encyclopædia Britannica, Inc. Modifica su Wikidata
  • (EN) Eric W. Weisstein, Chain Rule, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàGND (DE) 4163699-5
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica