Pochodna zupełna

Pochodna funkcji f : R n R m {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} w punkcie a {\displaystyle a} albo różniczka funkcji f : R n R m {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} w punkcie a {\displaystyle a} to przekształcenie liniowe L : R n R m {\displaystyle L\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} będące najlepszym liniowym przybliżeniem przyrostu funkcji f {\displaystyle f} w punkcie a . {\displaystyle a.}

W matematyce i naukach ją wykorzystujących szczególnie ważne są funkcje postaci f : R n R , {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} ,} ponieważ można zdefiniować ich ekstremum. Pochodne takich funkcji służą do szukania ich ekstremum.

Definicja

 Zobacz też: Przekształcenie liniowe.

Niech U R n {\displaystyle U\subset \mathbb {R} ^{n}} będzie zbiorem otwartym. Powiemy, że funkcja f : U R m {\displaystyle f\colon U\to \mathbb {R} ^{m}} jest różniczkowalna w punkcie a U {\displaystyle a\in U} jeżeli istnieje przekształcenie liniowe L : R n R m {\displaystyle L\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} takie, że

lim h 0 f ( a + h ) f ( a ) L h h = 0. {\displaystyle \lim _{h\to 0}{\frac {f(a+h)-f(a)-Lh}{\|h\|}}=0.} [1]

Przekształcenie liniowe L {\displaystyle L} nazywamy pochodną funkcji f {\displaystyle f} w punkcie a {\displaystyle a} albo różniczką funkcji f {\displaystyle f} w punkcie a {\displaystyle a} i oznaczamy D f ( a ) ,   d f ( a ) ,   d a f {\displaystyle Df(a),\ df(a),\ d_{a}f} lub podobnie.

Równoważnie funkcja f {\displaystyle f} jest różniczkowalna w punkcie a {\displaystyle a} jeżeli jej przyrost w tym punkcie można przedstawić w postaci:

f ( a + h ) f ( a ) = L h + r ( h ) , {\displaystyle f(a+h)-f(a)=Lh+r(h),}

gdzie reszta r {\displaystyle r} ma własność

lim h 0 r ( h ) h = 0. {\displaystyle \lim _{h\to 0}{\frac {r(h)}{\|h\|}}=0.}

Stąd wynika, że różniczka to najlepsze możliwe liniowe przybliżenie przyrostu funkcji.

Terminologia i notacja

W przypadku funkcji f : R R {\displaystyle f:\mathbb {R} \to \mathbb {R} } tradycyjnie rozróżnia się pochodną funkcji i różniczkę funkcji. W przypadku funkcji f : R n R m {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} ^{m}} literatura matematyczna z reguły nie rozróżnia tych terminów i stosuje je wymiennie. Przykładowo Michael Spivak w Analizie na rozmaitościach przekształcenie liniowe L {\displaystyle L} z powyższej definicji oznacza D f ( a ) {\displaystyle Df(a)} i nazywa pochodną (ang. derivative) funkcji f {\displaystyle f} w punkcie a {\displaystyle a} , podczas gdy Wojciech Wojtyński w Grupach i Algebrach Liego oznacza je d a f {\displaystyle d_{a}f} i nazywa różniczką funkcji f {\displaystyle f} w punkcie a {\displaystyle a} . Wojciech Wojtyński pochodną funkcji różniczkowalnej f : R n R m {\displaystyle f:\mathbb {R} ^{n}\to \mathbb {R} ^{m}} nazywa funkcję f {\displaystyle f'} z R n {\displaystyle \mathbb {R} ^{n}} w przestrzeń przekształceń liniowych z R n {\displaystyle \mathbb {R} ^{n}} w R m {\displaystyle \mathbb {R} ^{m}} daną wzorem

f ( x ) := d x f . {\displaystyle f'(x):=d_{x}f.}

Pochodna zupełna to termin, który pojawia się w literaturze fizycznej oznaczający tam pochodną złożenia f g : R R {\displaystyle f\circ g:\mathbb {R} \to \mathbb {R} } , postaci

( f g ) ( t ) = f ( g 1 ( t ) , g 2 ( t ) , , g n ( t ) , t ) {\displaystyle (f\circ g)(t)=f(g_{1}(t),g_{2}(t),\ldots ,g_{n}(t),t)}

i podobnych złożeń. Pochodna tego złożenia jest równa

d ( f g ) d t ( a ) = i = 1 n + 1 f x i ( g ( a ) ) d g i d t ( a ) = i = 1 n f x i ( g ( a ) ) d g i d t ( a ) + f x n + 1 ( g ( a ) ) . {\displaystyle {\frac {d(f\circ g)}{dt}}(a)=\sum _{i=1}^{n+1}{\frac {\partial f}{\partial x_{i}}}(g(a)){\frac {dg_{i}}{dt}}(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(g(a)){\frac {dg_{i}}{dt}}(a)+{\frac {\partial f}{\partial x_{n+1}}}(g(a)).}

W notacji fizycznej powyższy wzór jest zapisywany

d f d t = i = 1 n f x i d x i d t + f t . {\displaystyle {\frac {df}{dt}}=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}{\frac {dx_{i}}{dt}}+{\frac {\partial f}{\partial t}}.}

lub podobnie.

Pochodna jako funkcja

Niech U R n {\displaystyle U\subset \mathbb {R} ^{n}} będzie zbiorem otwartym. Powiemy, że funkcja f : U R m {\displaystyle f\colon U\to \mathbb {R} ^{m}} jest różniczkowalna, jeżeli jest różniczkowalna w każdym punkcie a U . {\displaystyle a\in U.} Funkcja różniczkowalna f : U R m {\displaystyle f\colon U\to \mathbb {R} ^{m}} indukuje odwzorowanie D f {\displaystyle Df} z U {\displaystyle U} w przestrzeń przekształceń liniowych z R n {\displaystyle \mathbb {R} ^{n}} w R m {\displaystyle \mathbb {R} ^{m}} dane wzorem

x D f ( x ) , {\displaystyle x\mapsto Df(x),}

które nazywamy pochodną funkcji f {\displaystyle f} albo różniczką funkcji f . {\displaystyle f.}

Własności

  • Różniczka jest operatorem liniowym:
D ( α f + β g ) ( a ) = α D f ( a ) + β D g ( a ) . {\displaystyle D(\alpha f+\beta g)(a)=\alpha Df(a)+\beta Dg(a).}
D ( f g ) ( a ) = D f ( g ( a ) ) D g ( a ) , {\displaystyle D(f\circ g)(a)=Df(g(a))\circ Dg(a),}
o ile złożenia mają sens.
  • Jeżeli f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } jest różniczkowalne w punkcie a R n {\displaystyle a\in \mathbb {R} ^{n}} to
D f ( a ) v = f v ( a ) , {\displaystyle Df(a)v={\frac {\partial f}{\partial v}}(a),}
gdzie po prawej stronie stoi pochodna kierunkowa.

Macierz pochodnej

Różniczka jest (z definicji) przekształceniem liniowym, a zatem jest sens rozważać jej macierz. Jeżeli f = ( f 1 , , f m ) , {\displaystyle f=(f_{1},\dots ,f_{m}),} gdzie f i := π i f : R n R , i = 1 , , m {\displaystyle f_{i}:=\pi _{i}\circ f\colon \mathbb {R} ^{n}\to \mathbb {R} ,i=1,\dots ,m} to złożenia rzutowań π i ( x 1 , , x m ) := x i {\displaystyle \pi _{i}(x_{1},\dots ,x_{m}):=x_{i}} z funkcją f , {\displaystyle f,} to macierz różniczki D f ( a ) {\displaystyle Df(a)} jest postaci

[ D f ( a ) ] = [ [ D f 1 ( a ) ] [ D f m ( a ) ] ] . {\displaystyle [Df(a)]={\begin{bmatrix}\left[Df_{1}(a)\right]\\\vdots \\\left[Df_{m}(a)\right]\end{bmatrix}}.}

Jeżeli f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } jest różniczkowalna w punkcie a {\displaystyle a} to macierz jej różniczki w bazie standardowej R n {\displaystyle \mathbb {R} ^{n}} jest postaci

[ D f ( a ) ] = [ f x 1 ( a ) , , f x n ( a ) ] . {\displaystyle [Df(a)]=\left[{\frac {\partial f}{\partial x_{1}}}(a),\dots ,{\frac {\partial f}{\partial x_{n}}}(a)\right].}

Jeżeli f : R n R m {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} jest różniczkowalne w punkcie a {\displaystyle a} to macierz jej różniczki w bazach standardowych R n {\displaystyle \mathbb {R} ^{n}} i R m {\displaystyle \mathbb {R} ^{m}} jest postaci

[ D f ( a ) ] = [ f 1 x 1 ( a ) f 1 x n ( a ) f m x 1 ( a ) f m x n ( a ) ] . {\displaystyle [Df(a)]={\begin{bmatrix}{\frac {\partial f_{1}}{\partial x_{1}}}(a)&\ldots &{\frac {\partial f_{1}}{\partial x_{n}}}(a)\\\vdots &&\vdots \\{\frac {\partial f_{m}}{\partial x_{1}}}(a)&\ldots &{\frac {\partial f_{m}}{\partial x_{n}}}(a)\end{bmatrix}}.}

Reguła łańcuchowa przenosi się na macierz różniczki:

[ D ( f g ) ( a ) ] = [ D f ( g ( a ) ) ] [ D g ( a ) ] . {\displaystyle [D(f\circ g)(a)]=[Df(g(a))]\cdot [Dg(a)].}

Przykłady

(1) Rozważmy funkcję f : R 2 R 2 {\displaystyle f\colon \mathbb {R} ^{2}\to \mathbb {R} ^{2}} daną wzorem

f ( x , y ) := ( x 2 y 3 , x 2 y ) . {\displaystyle f(x,y):=(x^{2}y^{3},x^{2}y).}

Jej różniczka ma w bazach standardowych macierz

[ D f ( x , y ) ] = [ 2 x y 3 3 x 2 y 2 2 x y x 2 ] {\displaystyle [Df(x,y)]={\begin{bmatrix}2xy^{3}&3x^{2}y^{2}\\2xy&x^{2}\end{bmatrix}}}

i jest dana wzorem

D f ( x , y ) ( h 1 , h 2 ) = [ 2 x y 3 3 x 2 y 2 2 x y x 2 ] [ h 1 h 2 ] . {\displaystyle Df(x,y)(h_{1},h_{2})={\begin{bmatrix}2xy^{3}&3x^{2}y^{2}\\2xy&x^{2}\end{bmatrix}}{\begin{bmatrix}h_{1}\\h_{2}\end{bmatrix}}.}

(2) Jeżeli funkcja f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } jest różniczkowalna w punkcie a {\displaystyle a} to jej różniczka w tym punkcie jest dana wzorem

D f ( a ) ( h 1 , , h n ) = i = 1 n f x i ( a ) h i . {\displaystyle Df(a)(h_{1},\dots ,h_{n})=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)h_{i}.}

(3) Przykładowo różniczka funkcji f : R 2 R {\displaystyle f\colon \mathbb {R} ^{2}\to \mathbb {R} } danej wzorem

f ( x , y ) := x 2 y 3 {\displaystyle f(x,y):=x^{2}y^{3}}

jest dana wzorem

D f ( x , y ) ( h 1 , h 2 ) = 2 x y 3 h 1 + 3 x 2 y 2 h 2 {\displaystyle Df(x,y)(h_{1},h_{2})=2xy^{3}h_{1}+3x^{2}y^{2}h_{2}}

i w punkcie ( 1 , 2 ) {\displaystyle (1,2)} na wektorze ( 3 , 4 ) {\displaystyle (3,4)} wynosi

D f ( 1 , 2 ) ( 3 , 4 ) = 2 1 2 3 3 + 3 1 2 2 2 4 = 16 3 + 12 4 = 48 + 48 = 96. {\displaystyle Df(1,2)(3,4)=2\cdot 1\cdot 2^{3}\cdot 3+3\cdot 1^{2}\cdot 2^{2}\cdot 4=16\cdot 3+12\cdot 4=48+48=96.}

(4) Niech π i : R n R ,   i = 1 , , n {\displaystyle \pi ^{i}\colon \mathbb {R} ^{n}\to \mathbb {R} ,\ i=1,\dots ,n} oznaczają rzutowania na i {\displaystyle i} -tą współrzędną względem bazy standardowej R n , {\displaystyle \mathbb {R} ^{n},} tzn.

π i ( x 1 , , x n ) := x i . {\displaystyle \pi ^{i}(x_{1},\dots ,x_{n}):=x_{i}.}

Rzutowania są funkcjami różniczkowalnymi i ich różniczki są dane wzorem

D π i ( a ) ( h 1 , , h n ) = h i {\displaystyle D\pi ^{i}(a)(h_{1},\dots ,h_{n})=h_{i}}

dla każdego a R n . {\displaystyle a\in \mathbb {R} ^{n}.}

(5) Łącząc punkt (2) i (4) widzimy, że różniczkę funkcji f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } (jeżeli istnieje) możemy zapisać w postaci

D f ( a ) = i = 1 n f x i ( a ) D π i {\displaystyle Df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)D\pi ^{i}}

(dla prostoty oznaczeń piszemy D π i {\displaystyle D\pi ^{i}} zamiast D π i ( a ) {\displaystyle D\pi ^{i}(a)} ).

(6) Oznaczając pochodną funkcji f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } w punkcie a {\displaystyle a} przez d f ( a ) , {\displaystyle df(a),} a pochodne D π i {\displaystyle D\pi ^{i}} przez d x i {\displaystyle dx^{i}} możemy nadać wzorowi z poprzedniego punktu klasyczną formę

d f ( a ) = i = 1 n f x i ( a ) d x i . {\displaystyle df(a)=\sum _{i=1}^{n}{\frac {\partial f}{\partial x_{i}}}(a)dx^{i}.}

(7) W przypadku funkcji f : R R {\displaystyle f\colon \mathbb {R} \to \mathbb {R} } wzór z poprzedniego punktu sprowadza się do wzoru

d f ( a ) = f ( a ) d x . {\displaystyle df(a)=f'(a)dx.}

W przypadku funkcji f : R R {\displaystyle f\colon \mathbb {R} \to \mathbb {R} } pojęcia pochodnej (w elementarnym sensie) i różniczki różnią się. Jest to jednak różnica tylko pozorna, gdyż każdej pochodnej f ( a ) {\displaystyle f'(a)} odpowiada różniczka f ( a ) d x {\displaystyle f'(a)dx} a każdej różniczce f ( a ) d x {\displaystyle f'(a)dx} odpowiada pochodna f ( a ) . {\displaystyle f'(a).}

Uogólnienia

Pochodna funkcji f : R n R m {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} ^{m}} ma wiele daleko idących uogólnień. Są to m.in. pochodna Frecheta i pochodna Gateaux. W przypadku gdy m=1 (tzn. w przypadku funkcji f : R n R {\displaystyle f\colon \mathbb {R} ^{n}\to \mathbb {R} } ) pochodna ma bardzo głębokie uogólnienie w postaci k {\displaystyle k} -formy różniczkowej.

Zobacz też

Bibliografia

  • Michael Spivak: Analiza matematyczna na rozmaitościach. Warszawa: Wydawnictwo Naukowe PWN, 2006.

Przypisy

  1. Spivak definiuje pochodną wzorem lim f ( a + h ) f ( a ) L h h = 0 {\displaystyle \lim {\frac {\lVert f(a+h)-f(a)-Lh\rVert }{\lVert h\rVert }}=0} jednakże norma w liczniku jest redundantna, ponieważ w przestrzeniach unormowanych g = lim f ( x ) lim f ( x ) g = 0. {\displaystyle g=\lim f(x)\Leftrightarrow \lim \lVert f(x)-g\rVert =0.}