Feltételes várható érték

Ez a szócikk vagy szakasz lektorálásra, tartalmi javításokra szorul. A felmerült kifogásokat a szócikk vitalapja részletezi (vagy extrém esetben a szócikk szövegében elhelyezett, kikommentelt szövegrészek). Ha nincs indoklás a vitalapon (vagy szerkesztési módban a szövegközben), bátran távolítsd el a sablont!
Csak akkor tedd a lap tetejére ezt a sablont, ha az egész cikk megszövegezése hibás. Ha nem, az adott szakaszba tedd, így segítve a lektorok munkáját!
Ezt a szócikket némileg át kellene dolgozni a wiki jelölőnyelv szabályainak figyelembevételével, hogy megfeleljen a Wikipédia alapvető stilisztikai és formai követelményeinek.
Ezt a szócikket némileg át kellene dolgozni, hogy megfeleljen a Wikipédia cikkszerkezetre vonatkozó követelményeinek.
Ennek a szócikknek hiányzik vagy nagyon rövid, illetve nem elég érthető a bevezetője.
Kérjük, segíts olyan bevezetőt írni, ami jól összefoglalja a cikk tartalmát, vagy jelezd észrevételeidet a cikk vitalapján.
Ez a szócikk nem tünteti fel a független forrásokat, amelyeket felhasználtak a készítése során. Emiatt nem tudjuk közvetlenül ellenőrizni, hogy a szócikkben szereplő állítások helytállóak-e. Segíts megbízható forrásokat találni az állításokhoz! Lásd még: A Wikipédia nem az első közlés helye.

A valószínűségszámításban egy valószínűségi változó feltételes várható értéke a várható érték, feltéve, hogy bekövetkezik egy adott A A {\displaystyle A\in {\mathcal {A}}} esemény. Ha véges sok kimenetel lehetséges, akkor ez azt jelenti, hogy csak bizonyos értékeket vehet fel. Formálisabban, az esemény és komplementere particionálja a valószínűségi mezőt.

Több valószínűségi változó esetén, egy valószínűségi változó várható értékben független egyenként vagy együttesen akkor és csak akkor, ha a feltételes várható értéke megegyezik a feltétel nélküli várható értékkel.

A feltételes várható érték szintén valószínűségi változó, de elemi esemény mint feltétel esetén elfajult eloszlású, vagyis konstans.

A fogalom általánosítható minden valószínűségi mezőre a mértékelmélet felhasználásával.

A modern valószínűségszámításban a feltételes valószínűség definiálására használják.

Példák

1. példa: Tekintsünk egy szabályos dobókockát! Legyen az A esemény az, hogy páros számot dobunk, tehát a kimenetel 2, 4, vagy 6; a B esemény az, hogy az eredmény prímszám, azaz 2, 3 vagy 5. A táblázatban az esemény bekövetkeztét 1, be nem következését 0 jelöli.

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

Az A esemény feltétel nélküli várható értéke E ( A ) = ( 0 + 1 + 0 + 1 + 0 + 1 ) / 6 = 1 / 2 {\displaystyle E(A)=(0+1+0+1+0+1)/6=1/2} . Az A feltéve B (jelben A|B) esemény várható értéke E ( A | B = 1 ) = ( 1 + 0 + 0 ) / 3 = 1 / 3 {\displaystyle E(A|B=1)=(1+0+0)/3=1/3} , míg E ( A | B = 0 ) = ( 0 + 1 + 1 ) / 3 = 2 / 3 {\displaystyle E(A|B=0)=(0+1+1)/3=2/3} a B komplementer eseményén. Hasonlóan, E(B|A) értéke E ( B | A = 1 ) = ( 1 + 0 + 0 ) / 3 = 1 / 3 {\displaystyle E(B|A=1)=(1+0+0)/3=1/3} , és E ( B | A = 0 ) = ( 0 + 1 + 1 ) / 3 = 2 / 3 {\displaystyle E(B|A=0)=(0+1+1)/3=2/3} .

2. példa: Tegyük fel, hogy van egy 10 éves adatsor az időjárásról! Ekkor meg lehet nézni az átlagos napi csapadékmennyiséget (tapasztalati feltétlen várható érték), az év egy szakaszában számított átlagos napi csapadékmennyiséget vagy az év egy bizonyos napjára jutó napi csapadékmennyiséget (tapasztalati feltételes várható értékek). A feltétlen esethez 3652 napi átlagot, március hónaphoz 310 napi átlagot, március 2-ához 10 napi átlagot kell figyelembe venni.

Klasszikus definíció

Eseményre vett feltételes várható érték

A klasszikus valószínűségszámításban egy X {\displaystyle X} valószínűségi változó feltéve egy H {\displaystyle H} esemény X {\displaystyle X} átlaga H {\displaystyle H} összes kimenetelére, azaz

E ( X H ) = ω H X ( ω ) | H | , {\displaystyle \operatorname {E} (X\mid H)={\frac {\sum _{\omega \in H}X(\omega )}{|H|}},}

ahol | H | {\displaystyle |H|} a H {\displaystyle H} elemszáma. H {\displaystyle H} lehet az, hogy egy másik Y {\displaystyle Y} valószínűségi változó egy adott értéket vesz fel, azaz Y = y {\displaystyle Y=y} .

A fenti összeg csoportosítható X ( ω ) {\displaystyle X(\omega )} értékei szerint, vagyis X {\displaystyle {\mathcal {X}}} -en összegzünk, ami X {\displaystyle X} lehetséges kimeneteleinek halmaza:

E ( X H ) = x X x | { ω H X ( ω ) = x } | | H | . {\displaystyle \operatorname {E} (X\mid H)=\sum _{x\in {\mathcal {X}}}x\,{\frac {|\{\omega \in H\mid X(\omega )=x\}|}{|H|}}.}

Általában, ha a H {\displaystyle H} esemény valószínűsége pozitív, akkor hasonló formula teljesül. Külön figyelmet kap az a speciális lehetőség, ha a H {\displaystyle H} azt jelzi, hogy egy másik Y {\displaystyle Y} valószínűségi változó egy adott értéket vesz fel, azaz Y = y {\displaystyle Y=y} . Legyen ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},P)} valószínűségi mező, X {\displaystyle X} valószínűségi változó ezen, és legyen P ( H ) > 0 {\displaystyle P(H)>0} . Ekkor X {\displaystyle X} feltételes várható értéke feltéve, hogy H {\displaystyle H} , nem más, mint

E ( X H ) = E ( 1 H X ) P ( H ) = X x d P ( x H ) , {\displaystyle \operatorname {E} (X\mid H)={\frac {\operatorname {E} (1_{H}X)}{P(H)}}=\int _{\mathcal {X}}x\,dP(x\mid H),}

ahol X {\displaystyle {\mathcal {X}}} az X ( ω ) {\displaystyle X(\omega )} lehetséges kimenetelei, és P ( H ) {\displaystyle P(\cdot \mid H)} a valószínűségi mérték, és minden A {\displaystyle A} mérhető halmazra P ( A H ) = P ( A H ) / P ( H ) {\displaystyle P(A\mid H)=P(A\cap H)/P(H)} A {\displaystyle A} feltételes valószínűsége feltéve H {\displaystyle H} .

Ha P ( H ) = 0 {\displaystyle P(H)=0} és H {\displaystyle H} egy Y = y {\displaystyle Y=y} esemény, akkor a fenti definíció nem terjeszthető ki, habár más számítási módszerekkel egy érték kiszámítható. A Borel–Kolmogorov-paradoxon mutatja, hogy a feltételes valószínűség, így a feltételes várható érték nem határozható meg a definíció alapján. A megoldás a σ-algebrára és a valószínűségi változóra való kiterjesztés, amiből egy olyan definíció adódik, amivel ekkor is meghatározható a feltételes várható érték.

Valószínűségi változóra vett feltételes várható érték

Ha Y {\displaystyle Y} diszkrét valószínűségi változó ugyanazon az ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},P)} valószínűségi mezőn, mint X {\displaystyle X} , és lehetséges kimenetelei Y {\displaystyle {\mathcal {Y}}} , akkor X {\displaystyle X} feltételes várható értéke feltéve Y {\displaystyle Y} egy E ( X Y ) {\displaystyle E(X\mid Y)} valószínűségi változó Y {\displaystyle {\mathcal {Y}}} -on, melynek definíciója

E ( X Y ) ( y ) = E ( X Y = y ) . {\displaystyle \operatorname {E} (X\mid Y)(y)=\operatorname {E} (X\mid Y=y).}

Egy kapcsolódó Ω {\displaystyle \Omega } -ből Y {\displaystyle {\mathcal {Y}}} -ba menő függvény definíciója

E ( X σ ( Y ) ) ( ω ) = E ( X Y = Y ( ω ) ) . {\displaystyle \operatorname {E} (X\mid \sigma (Y))(\omega )=\operatorname {E} (X\mid Y=Y(\omega )).}

Ez a függvény az X {\displaystyle X} valószínűségi változó feltételes várható értéke az Y {\displaystyle Y} által generált σ-algebrára. A két függvény kapcsolata

E ( X σ ( Y ) ) = E ( X Y ) Y . {\displaystyle \operatorname {E} (X\mid \sigma (Y))=\operatorname {E} (X\mid Y)\circ Y.}

Ahogy fentebb említettük, ha Y {\displaystyle Y} folytonos valószínűségi változó, akkor nem lehet definiálni E ( X Y ) {\displaystyle \operatorname {E} (X\mid Y)} -et ezen a módon. A Borel–Kolmogorov-paradoxon szerint meg kell határozni, hogy mely korlátozó procedúra hozza létre az Y = y egyenlőséget. Ha az Ω {\displaystyle \Omega } eseménytérnek van távolságfüggvénye, akkor eljárhatunk a következőképpen. Feltéve, hogy minden H y ε {\displaystyle H_{y}^{\varepsilon }} P-mérhető és P ( H y ε ) > 0 {\displaystyle P(H_{y}^{\varepsilon })>0} minden ε > 0 {\displaystyle \varepsilon >0} esetén. Ekkor az H y ε {\displaystyle H_{y}^{\varepsilon }} szerinti feltételes várható érték jóldefiniált. Az ε {\displaystyle \varepsilon } korláttal a nullához tartva definiálhatjuk, hogy

g ( y ) = lim ε 0 E ( X H y ε ) . {\displaystyle g(y)=\lim _{\varepsilon \to 0}\operatorname {E} (X\mid H_{y}^{\varepsilon }).}

A korlátozó folyamatot a Radon–Nikodym-deriválttal helyettesítve egy általánosabb analóg definícióhoz jutunk.

Formális definíció

Feltételes várható érték rész-σ-algebrára

σ-algebrára vett feltételes várható érték: ebben a példában az ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},P)} valószínűségi mező az [0,1] intervallum a Lebesgue-mértékkel. Definiáljuk a következő σ-algebrákat: A = F {\displaystyle {\mathcal {A}}={\mathcal {F}}} ; B {\displaystyle {\mathcal {B}}} az a σ-algebra, amit a 0, ¼, ½, ¾, 1 végpontú intervallumok generálnak; és C {\displaystyle {\mathcal {C}}} a 0, ½, 1 végpontú intervallumok által generált σ-algebra. Itt a feltételes várható érték éppen a σ-algebra minimális halmazaira számított átlag

Tekintsük a következőket:

  • ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},P)} valószínűségi mező.
  • X : Ω R n {\displaystyle X:\Omega \to \mathbb {R} ^{n}} valószínűségi változó ezen a valószínűségi mezőn, és várható értéke véges.
  • H F {\displaystyle {\mathcal {H}}\subseteq {\mathcal {F}}} egy al-σ-algebrája F {\displaystyle {\mathcal {F}}} -nek.

Mivel H {\displaystyle {\mathcal {H}}} részalgebrája F {\displaystyle {\mathcal {F}}} -nek, azért az X : Ω R n {\displaystyle X:\Omega \to \mathbb {R} ^{n}} függvény nem feltétlenül H {\displaystyle {\mathcal {H}}} -mérhető. Ezért nem biztosított az H X d P | H {\textstyle \int _{H}X\,dP|_{\mathcal {H}}} integrál létezése, ahol H H {\displaystyle H\in {\mathcal {H}}} és P | H {\displaystyle P|_{\mathcal {H}}} P {\displaystyle P} leszűkítése H {\displaystyle {\mathcal {H}}} -ra. Azonban a lokális H X d P {\textstyle \int _{H}X\,dP} átlagok meghatározhatók ( Ω , H , P | H ) {\displaystyle (\Omega ,{\mathcal {H}},P|_{\mathcal {H}})} -ban, a feltételes várható érték használatával. X {\displaystyle X} feltételes várható értéke adott H {\displaystyle {\mathcal {H}}} -ra, amit E ( X H ) {\displaystyle \operatorname {E} (X\mid {\mathcal {H}})} jelöl, egy H {\displaystyle {\mathcal {H}}} -mérhető Ω R n {\displaystyle \Omega \to \mathbb {R} ^{n}} függvény, ami minden H H {\displaystyle H\in {\mathcal {H}}} esetén teljesíti azt, hogy

H E ( X H ) d P = H X d P {\displaystyle \int _{H}\operatorname {E} (X\mid {\mathcal {H}})\,dP=\int _{H}X\,dP} [1]

E ( X H ) {\displaystyle \operatorname {E} (X\mid {\mathcal {H}})} létezése könnyen megmutatható, ha észrevesszük, hogy μ X : F F X d P {\textstyle \mu ^{X}:F\mapsto \int _{F}X\,dP} véges mérték ( Ω , F ) {\displaystyle (\Omega ,{\mathcal {F}})} -n, ha F F {\displaystyle F\in {\mathcal {F}}} , ami abszolút folytonos P {\displaystyle P} -re. Ha h {\displaystyle h} a természetes beágyazása H {\displaystyle {\mathcal {H}}} -nak F {\displaystyle {\mathcal {F}}} -be, akkor μ X h = μ X | H {\displaystyle \mu ^{X}\circ h=\mu ^{X}|_{\mathcal {H}}} μ X {\displaystyle \mu ^{X}} leszűkítése H {\displaystyle {\mathcal {H}}} -ra, és P h = P | H {\displaystyle P\circ h=P|_{\mathcal {H}}} P {\displaystyle P} leszűkítése H {\displaystyle {\mathcal {H}}} -ra. Továbbá, μ X h {\displaystyle \mu ^{X}\circ h} abszolút folytonos P h {\displaystyle P\circ h} -re, hiszen abból, hogy

P h ( H ) = 0 P ( h ( H ) ) = 0 {\displaystyle P\circ h(H)=0\iff P(h(H))=0}

következik, hogy

μ X ( h ( H ) ) = 0 μ X h ( H ) = 0. {\displaystyle \mu ^{X}(h(H))=0\iff \mu ^{X}\circ h(H)=0.}

Tehát

E ( X H ) = d μ X | H d P | H = d ( μ X h ) d ( P h ) , {\displaystyle \operatorname {E} (X\mid {\mathcal {H}})={\frac {d\mu ^{X}|_{\mathcal {H}}}{dP|_{\mathcal {H}}}}={\frac {d(\mu ^{X}\circ h)}{d(P\circ h)}},}

ahol a deriváltak Radon–Nikodym-deriváltak.

Feltételes várható érték valószínűségi változóra

A fentiek mellett legyen még:

  • ( U , Σ ) {\displaystyle (U,\Sigma )} mérhető tér,
  • Y : Ω U {\displaystyle Y:\Omega \to U} valószínűségi változó.

Legyen g : U R n {\displaystyle g:U\to \mathbb {R} ^{n}} Σ {\displaystyle \Sigma } -mérhető függvény úgy, hogy minden f : U R n {\displaystyle f:U\to \mathbb {R} ^{n}} Σ {\displaystyle \Sigma } -mérhető függvényre

g ( Y ) f ( Y ) d P = X f ( Y ) d P . {\displaystyle \int g(Y)f(Y)\,dP=\int Xf(Y)\,dP.}

Ekkor a g ( Y ) {\displaystyle g(Y)} valószínűségi változó X {\displaystyle X} feltételes várható értéke egy adott Y {\displaystyle Y} valószínűségi változóra. Jelölése: E ( X Y ) {\displaystyle \operatorname {E} (X\mid Y)} .

Ez a definíció ekvivalens F {\displaystyle {\mathcal {F}}} al- σ {\displaystyle \sigma } -terére, amit Σ {\displaystyle \Sigma } Y {\displaystyle Y} szerinti ősképe definiál. Hogyha definiáljuk, hogy

H = Y 1 ( Σ ) = { Y 1 ( B ) : B Σ } , {\displaystyle {\mathcal {H}}=Y^{-1}(\Sigma )=\{Y^{-1}(B):B\in \Sigma \},}

akkor

E ( X Y ) = E ( X H ) = d ( μ X Y 1 ) d ( P Y 1 ) Y {\displaystyle \operatorname {E} (X\mid Y)=\operatorname {E} (X\mid {\mathcal {H}})={\frac {d(\mu ^{X}\circ Y^{-1})}{d(P\circ Y^{-1})}}\circ Y} .

Diszkusszió

  • A definíció nem konstruktív, csak megadtuk a szükséges tulajdonságot, aminek a feltételes várható értéknek meg kell felelnie.
  • Az E ( X H ) {\displaystyle \operatorname {E} (X\mid {\mathcal {H}})} definíciója hasonlít a E ( X H ) {\displaystyle \operatorname {E} (X\mid H)} definícióra egy H {\displaystyle H} eseménnyel, azonban ezek nem ugyanazok. Az előbbi egy H {\displaystyle {\mathcal {H}}} -mérhető Ω R n {\displaystyle \Omega \to \mathbb {R} ^{n}} -függvény, az utóbbi R n {\displaystyle \mathbb {R} ^{n}} egy eleme. Az előbb kiértékelése H {\displaystyle H} -n az utóbbit adja.
  • A követelmények nem garantálják a feltételes várható értéket. Létezésére a Radon–Nikodym-tétel ad kritériumokat. Egy elégséges feltétel, hogy X {\displaystyle X} várható értéke létezik.
  • Az egyértelműség majdnem biztos: A különböző feltételes várható értékek csak nulla valószínűségű halmazban különböznek.
  • A H {\displaystyle {\mathcal {H}}} σ-algebra jellemzi a feltételezés szemcsézettségét. Egy nagyobb (finomabb) H {\displaystyle {\mathcal {H}}} σ-algebra fölött több esemény valószínűségét őrzi meg. Egy szűkebb (durvább) σ-algebra több eseményt átlagol.

Kiszámítása

Ha X {\displaystyle X} és Y {\displaystyle Y} diszkrét valószínűségi változó, akkor X {\displaystyle X} feltételes várható értéke az Y = y eseményre tekinthető y {\displaystyle y} függvényének Y {\displaystyle Y} lehetséges kimeneteleinek halmazán:

E ( X Y = y ) = x X x P ( X = x Y = y ) = x X x P ( X = x , Y = y ) P ( Y = y ) , {\displaystyle \operatorname {E} (X\mid Y=y)=\sum _{x\in {\mathcal {X}}}x\,P(X=x\mid Y=y)=\sum _{x\in {\mathcal {X}}}x\,{\frac {P(X=x,Y=y)}{P(Y=y)}},}

ahol X {\displaystyle {\mathcal {X}}} az X {\displaystyle X} lehetséges kimeneteleinek halmaza.

Ha X {\displaystyle X} folytonos, viszont Y {\displaystyle Y} diszkrét valószínűségi változó, akkor a feltételes várható érték az Y = y eseményre

E ( X Y = y ) = X x f X ( x Y = y ) d x , {\displaystyle \operatorname {E} (X\mid Y=y)=\int _{\mathcal {X}}xf_{X}(x\mid Y=y)\,dx,}

ahol f X ( x Y = y ) = f X , Y ( x , y ) P ( Y = y ) {\displaystyle f_{X}(x\mid Y=y)={\frac {f_{X,Y}(x,y)}{P(Y=y)}}} , és f X , Y ( x , y ) {\displaystyle f_{X,Y}(x,y)} az X {\displaystyle X} és Y {\displaystyle Y} közös tömegfüggvénye.

Ha X {\displaystyle X} és Y {\displaystyle Y} folytonos valószínűségi változó, akkor X {\displaystyle X} feltételes várható értéke az Y = y eseményre

E ( X Y = y ) = X x f X Y ( x y ) d x , {\displaystyle \operatorname {E} (X\mid Y=y)=\int _{\mathcal {X}}xf_{X\mid Y}(x\mid y)\,dx,}

ahol f X Y ( x y ) = f X , Y ( x , y ) f Y ( y ) {\displaystyle f_{X\mid Y}(x\mid y)={\frac {f_{X,Y}(x,y)}{f_{Y}(y)}}} és f Y ( y ) {\displaystyle f_{Y}(y)} az Y {\displaystyle Y} sűrűségfüggvénye.

Tulajdonságok

Az alábbi tulajdonságok majdnem biztosak, és a H {\displaystyle {\mathcal {H}}} σ {\displaystyle \sigma } -algebra helyett mindenütt vehető Z {\displaystyle Z} valószínűségi változó.

Alapvető tulajdonságok

Linearitás:

E ( X 1 + X 2 H ) = E ( X 1 H ) + E ( X 2 H ) {\displaystyle E(X_{1}+X_{2}\mid {\mathcal {H}})=E(X_{1}\mid {\mathcal {H}})+E(X_{2}\mid {\mathcal {H}})} és
E ( a X H ) = a E ( X H ) {\displaystyle E(aX\mid {\mathcal {H}})=a\,E(X\mid {\mathcal {H}})} , ha a R {\displaystyle a\in \mathbb {R} } .

Pozitivitás: ha X 0 {\displaystyle X\geq 0} , akkor E ( X H ) 0 {\displaystyle E(X\mid {\mathcal {H}})\geq 0} .

Monotonitás: Ha X 1 X 2 {\displaystyle X_{1}\leq X_{2}} , akkor E ( X 1 H ) E ( X 2 H ) {\displaystyle E(X_{1}\mid {\mathcal {H}})\leq E(X_{2}\mid {\mathcal {H}})} .

Ha X {\displaystyle X} H {\displaystyle {\mathcal {H}}} -mérhető, akkor E ( X Y H ) = X E ( Y H ) {\displaystyle E(XY\mid {\mathcal {H}})=X\,E(Y\mid {\mathcal {H}})} .

Ha Z {\displaystyle Z} valószínűségi változó, akkor E ( f ( Z ) Y Z ) = f ( Z ) E ( Y Z ) {\displaystyle \operatorname {E} (f(Z)Y\mid Z)=f(Z)\operatorname {E} (Y\mid Z)} .

Teljes várható érték tétele: E ( E ( X H ) ) = E ( X ) {\displaystyle E(E(X\mid {\mathcal {H}}))=E(X)} .

Függetlenség

Ha X {\displaystyle X} független H {\displaystyle {\mathcal {H}}} -tól, akkor E ( X H ) = E ( X ) {\displaystyle E(X\mid {\mathcal {H}})=E(X)} .

Ugyanis, ha B H {\displaystyle B\in {\mathcal {H}}} , akkor X {\displaystyle X} független 1 B {\displaystyle 1_{B}} -től, így

B X d P = E ( X 1 B ) = E ( X ) E ( 1 B ) = E ( X ) P ( B ) = B E ( X ) d P . {\displaystyle \int _{B}X\,dP=E(X1_{B})=E(X)E(1_{B})=E(X)P(B)=\int _{B}E(X)\,dP.}

Tehát a definíciónak megfelel egy E ( X ) {\displaystyle E(X)} konstans valószínűségi változó, ahogy azt akartuk.

Ha X {\displaystyle X} független σ ( Y , H ) {\displaystyle \sigma (Y,{\mathcal {H}})} -tól, akkor E ( X Y H ) = E ( X ) E ( Y H ) {\displaystyle E(XY\mid {\mathcal {H}})=E(X)\,E(Y\mid {\mathcal {H}})} . Ez nem feltétlenül teljesül, ha X {\displaystyle X} csak H {\displaystyle {\mathcal {H}}} -tól vagy Y {\displaystyle Y} -tól független.

Ha X , Y {\displaystyle X,Y} független, és G , H {\displaystyle {\mathcal {G}},{\mathcal {H}}} független, továbbá X {\displaystyle X} és H {\displaystyle {\mathcal {H}}} független és Y {\displaystyle Y} és G {\displaystyle {\mathcal {G}}} független, akkor E ( E ( X Y G ) H ) = E ( X ) E ( Y ) = E ( E ( X Y H ) G ) {\displaystyle E(E(XY\mid {\mathcal {G}})\mid {\mathcal {H}})=E(X)E(Y)=E(E(XY\mid {\mathcal {H}})\mid {\mathcal {G}})} .

Doob-féle feltételes függetlenségi tulajdonság:[2] Ha X , Y {\displaystyle X,Y} feltételesen független egy adott Z {\displaystyle Z} -re, akkor P ( X B Y , Z ) = P ( X B Z ) {\displaystyle P(X\in B\mid Y,Z)=P(X\in B\mid Z)} (vagy ekvivalensen, E ( 1 { X B } Y , Z ) = E ( 1 { X B } Z ) {\displaystyle E(1_{\{X\in B\}}\mid Y,Z)=E(1_{\{X\in B\}}\mid Z)} ).

Stabilitás

Ha X {\displaystyle X} H {\displaystyle {\mathcal {H}}} -mérhető, akkor E ( X H ) = X {\displaystyle E(X\mid {\mathcal {H}})=X} .

Ha Z {\displaystyle Z} valószínűségi változó, E ( f ( Z ) Z ) = f ( Z ) {\displaystyle \operatorname {E} (f(Z)\mid Z)=f(Z)} . Más alakban, E ( Z Z ) = Z {\displaystyle \operatorname {E} (Z\mid Z)=Z} .

Torony tulajdonság

A H 1 H 2 F {\displaystyle {\mathcal {H}}_{1}\subset {\mathcal {H}}_{2}\subset {\mathcal {F}}} rész- σ {\displaystyle \sigma } -algebrákra E ( E ( X H 2 ) H 1 ) = E ( X H 1 ) {\displaystyle E(E(X\mid {\mathcal {H}}_{2})\mid {\mathcal {H}}_{1})=E(X\mid {\mathcal {H}}_{1})} .

Speciális esetben, ha Z {\displaystyle Z} H {\displaystyle {\mathcal {H}}} -mérhető valószínűségi változó, akkor σ ( Z ) H {\displaystyle \sigma (Z)\subset {\mathcal {H}}} , így E ( E ( X H ) Z ) = E ( X Z ) {\displaystyle E(E(X\mid {\mathcal {H}})\mid Z)=E(X\mid Z)} .

Doob-féle martingál tulajdonság: Legyenek, mint előbb, és legyen Z = E ( X H ) {\displaystyle Z=E(X\mid {\mathcal {H}})} , ami H {\displaystyle {\mathcal {H}}} -mérhető, ekkor E ( Z Z ) = Z {\displaystyle \operatorname {E} (Z\mid Z)=Z} felhasználásával E ( X E ( X H ) ) = E ( X H ) {\displaystyle E(X\mid E(X\mid {\mathcal {H}}))=E(X\mid {\mathcal {H}})} .

Ha X , Y {\displaystyle X,Y} valószínűségi változó, akkor E ( E ( X Y ) f ( Y ) ) = E ( X f ( Y ) ) {\displaystyle E(E(X\mid Y)\mid f(Y))=E(X\mid f(Y))} .

Ha X , Y , Z {\displaystyle X,Y,Z} valószínűségi változó, akkor E ( E ( X Y , Z ) Y ) = E ( X Y ) {\displaystyle E(E(X\mid Y,Z)\mid Y)=E(X\mid Y)} .

Konvergencia

Monoton konvergencia tétele: Ha 0 X n X {\displaystyle 0\leq X_{n}\uparrow X} , akkor E ( X n H ) E ( X H ) {\displaystyle E(X_{n}\mid {\mathcal {H}})\uparrow E(X\mid {\mathcal {H}})} .

Dominált konvergencia: Ha X n X {\displaystyle X_{n}\to X} és | X n | Y {\displaystyle |X_{n}|\leq Y} , ahol Y L 1 {\displaystyle Y\in L^{1}} , akkor E ( X n H ) E ( X H ) {\displaystyle E(X_{n}\mid {\mathcal {H}})\to E(X\mid {\mathcal {H}})} .

Fatou-lemma: Ha E ( inf n X n H ) > {\displaystyle \textstyle E(\inf _{n}X_{n}\mid {\mathcal {H}})>-\infty } , akkor E ( lim inf n X n H ) lim inf n E ( X n H ) {\displaystyle \textstyle E(\liminf _{n\to \infty }X_{n}\mid {\mathcal {H}})\leq \liminf _{n\to \infty }E(X_{n}\mid {\mathcal {H}})} .

Martingál konvergencia tétele: Ha X {\displaystyle X} valószínűségi változó véges várható értékkel, akkor E ( X H n ) E ( X H ) {\displaystyle E(X\mid {\mathcal {H}}_{n})\to E(X\mid {\mathcal {H}})} , ha H 1 H 2 {\displaystyle {\mathcal {H}}_{1}\subset {\mathcal {H}}_{2}\subset \dotsb } rész- σ {\displaystyle \sigma } -algebrák növekvő sorozata és H = σ ( n = 1 H n ) {\displaystyle \textstyle {\mathcal {H}}=\sigma (\bigcup _{n=1}^{\infty }{\mathcal {H}}_{n})} vagy ha H 1 H 2 {\displaystyle {\mathcal {H}}_{1}\supset {\mathcal {H}}_{2}\supset \dotsb } rész- σ {\displaystyle \sigma } -algebrák csökkenő sorozata és H = n = 1 H n {\displaystyle \textstyle {\mathcal {H}}=\bigcap _{n=1}^{\infty }{\mathcal {H}}_{n}} .

Jensen-egyenlőtlenség

A Jensen-egyenlőtlenség szerint, ha f : R R {\displaystyle f\colon \mathbb {R} \rightarrow \mathbb {R} } konvex függvény, akkor f ( E ( X H ) ) E ( f ( X ) H ) {\displaystyle f(E(X\mid {\mathcal {H}}))\leq E(f(X)\mid {\mathcal {H}})} .

Projekció

A feltételes operátor kontrakciós vetülete az L p ( Ω , F , P ) L p ( Ω , H , P ) {\displaystyle L^{p}(\Omega ,{\mathcal {F}},P)\rightarrow L^{p}(\Omega ,{\mathcal {H}},P)} . Lp-tereknek. Vagyis, E ( | E ( X H ) | p ) E ( | X | p ) {\displaystyle \operatorname {E} {\big (}|\operatorname {E} (X\mid {\mathcal {H}})|^{p}{\big )}\leq \operatorname {E} {\big (}|X|^{p}{\big )}} minden p ≥ 1-re.

A feltételes várható érték mint L 2 {\displaystyle L^{2}} -projekció: Ha X , Y {\displaystyle X,Y} a négyzetesen integrálható valós valószínűségi változók terének Hilbert-terének eleme, azaz második momentuma véges, akkor:

az X E ( X H ) {\displaystyle X\mapsto \operatorname {E} (X\mid {\mathcal {H}})} leképezés önadjungált, E ( X E ( Y H ) ) = E ( E ( X H ) E ( Y H ) ) = E ( E ( X H ) Y ) {\displaystyle \operatorname {E} (X\operatorname {E} (Y\mid {\mathcal {H}}))=\operatorname {E} \left(\operatorname {E} (X\mid {\mathcal {H}})\operatorname {E} (Y\mid {\mathcal {H}})\right)=\operatorname {E} (\operatorname {E} (X\mid {\mathcal {H}})Y)}

ha Y {\displaystyle Y} H {\displaystyle {\mathcal {H}}} -mérhető, akkor E ( Y ( X E ( X H ) ) ) = 0 {\displaystyle E(Y(X-E(X\mid {\mathcal {H}})))=0} , vagyis az E ( X H ) {\displaystyle E(X\mid {\mathcal {H}})} feltételes várható érték az L 2 ( P ) {\displaystyle L^{2}(P)} szerinti értelemben az X {\displaystyle X} ortogonális projekciója mint skaláris szorzat a H {\displaystyle {\mathcal {H}}} -mérhető függvények alterében. Emiatt használható a Hilbert-féle projekciótétel alapján definiálható és bizonyítható a feltételes várható érték.

Számítások

Az X {\displaystyle X} valószínűségi változó várható értékét akarjuk kiszámolni, amennyiben tudjuk, hogy egy A A {\displaystyle A\in {\mathcal {A}}} esemény bekövetkezik.

Legyen ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} valószínűségi mező, X {\displaystyle X} valószínűségi változó és A A {\displaystyle A\in {\mathcal {A}}} esemény, ha P ( A ) 0 {\displaystyle P(A)\neq 0} , akkor E ( X | A ) = 1 P ( A ) A X d P {\displaystyle E(X|A)={\frac {1}{P(A)}}\int _{A}XdP} .

A definíció értelmezése a feltételes valószínűség alapján: E ( X | A ) = Ω X ( ω ) d P ( ω | A ) {\displaystyle E(X|A)=\int _{\Omega }X(\omega )dP(\omega |A)} , ahol a feltételes valószínűség definíciója szerint P ( B | A ) = P ( B A ) P ( A ) {\displaystyle P(B|A)={\frac {P(B\cap A)}{P(A)}}} , a várható értékben lévő valószínűségre alkalmazva P ( ω | A ) = P ( ω A ) P ( A ) {\displaystyle P(\omega |A)={\frac {P(\omega \cap A)}{P(A)}}} , tehát ez a valószínűség csak akkor nem 0, ha ω A {\displaystyle \omega \in A} .

Ezért csak az A {\displaystyle A} eseményen integrálunk, viszont ω A {\displaystyle \omega \in A} esetén P ( ω | A ) = P ( ω ) {\displaystyle P(\omega |A)=P(\omega )} és a mérték szerinti integrál definíciója szerint d P ( ω ) P ( A ) = 1 P ( A ) d P ( ω ) {\displaystyle d{\frac {P(\omega )}{P(A)}}={\frac {1}{P(A)}}dP(\omega )} . Ezt alkalmazva E ( X | A ) = Ω X ( ω ) d P ( ω | A ) = Ω X ( ω ) d P ( ω A ) P ( A ) = A X ( ω ) d P ( ω A ) P ( A ) = A X ( ω ) d P ( ω ) P ( A ) = 1 P ( A ) A X d P {\displaystyle E(X|A)=\int _{\Omega }X(\omega )dP(\omega |A)=\int _{\Omega }X(\omega )d{\frac {P(\omega \cap A)}{P(A)}}=\int _{A}X(\omega )d{\frac {P(\omega \cap A)}{P(A)}}=\int _{A}X(\omega )d{\frac {P(\omega )}{P(A)}}={\frac {1}{P(A)}}\int _{A}XdP} .

A feltételes várható érték tulajdonságai: lineáris: E ( X + Y | A ) = E ( X | A ) + E ( Y | A ) {\displaystyle E(X+Y|A)=E(X|A)+E(Y|A)} ha c R {\displaystyle c\in \mathbb {R} } , akkor E ( c X | A ) = c E ( X | A ) {\displaystyle E(cX|A)=cE(X|A)} .

Az X {\displaystyle X} valószínűségi változó várható értékét akarjuk kiszámolni, amennyiben tudjuk, hogy egy F A {\displaystyle {\mathcal {F}}\subseteq {\mathcal {A}}} σ {\displaystyle \sigma } -algebrában lévő események bekövetkeznek.

Legyen ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} valószínűségi mező, X {\displaystyle X} valószínűségi változó és F A {\displaystyle {\mathcal {F}}\subseteq {\mathcal {A}}} σ {\displaystyle \sigma } -algebra, ha E ( | X | ) < {\displaystyle E(|X|)<\infty } ekkor létezik olyan E ( X | F ) {\displaystyle E(X|{\mathcal {F}})} valószínűségi változó, amely F {\displaystyle {\mathcal {F}}} mérhető és minden A F {\displaystyle A\in {\mathcal {F}}} esemény esetén A X d P = A E ( X | F ) d P {\displaystyle \int _{A}XdP=\int _{A}E(X|{\mathcal {F}})dP} .

Feltételes szórás

A feltételes várható érték segítségével definiálható feltételes szórás is. A képletekben szórás helyett szórásnégyzet szerepel:

Definíció: Var ( X H ) = E ( ( X E ( X H ) ) 2 H ) {\displaystyle \operatorname {Var} (X\mid {\mathcal {H}})=\operatorname {E} {\bigl (}(X-\operatorname {E} (X\mid {\mathcal {H}}))^{2}\mid {\mathcal {H}}{\bigr )}}

Algebrai képlet: Var ( X H ) = E ( X 2 H ) ( E ( X H ) ) 2 {\displaystyle \operatorname {Var} (X\mid {\mathcal {H}})=\operatorname {E} (X^{2}\mid {\mathcal {H}})-{\bigl (}\operatorname {E} (X\mid {\mathcal {H}}){\bigr )}^{2}}

Teljes szórás tétele: Var ( X ) = E ( Var ( X H ) ) + Var ( E ( X H ) ) {\displaystyle \operatorname {Var} (X)=\operatorname {E} (\operatorname {Var} (X\mid {\mathcal {H}}))+\operatorname {Var} (\operatorname {E} (X\mid {\mathcal {H}}))} .

Története

A feltételes valószínűség fogalmát Laplace vezette be, aki feltételes eloszlásokat számított. Andrej Kolmogorov 1933-ban formalizálta a Radon–Nikodym-tétellel.[3]Halmos Pál[4] és Joseph L. Doob[1] [5] 1953-ban általánosította a ma is használt fogalmat al-σ-algebrákkal.[6]

Jegyzetek

  1. a b Billingsley, Patrick. Probability and Measure, 3rd, John Wiley & Sons, 445. o. (1995). ISBN 0-471-00710-2 
  2. Kallenberg, Olav. Foundations of Modern Probability, 2nd, York, PA, USA: Springer, 110. o. (2001). ISBN 0-387-95313-2 
  3. Kolmogorov, Andrey. Grundbegriffe der Wahrscheinlichkeitsrechnung (german nyelven). Berlin: Julius Springer, 46. o. (1933) 
    • Translation: Kolmogorov, Andrey. Foundations of the Theory of Probability, 2nd, New York: Chelsea (1956). ISBN 0-8284-0023-7. Hozzáférés ideje: 2018. szeptember 5. 
  4. Oxtoby, J. C. (1953). „Review: Measure theory, by P. R. Halmos”. Bull. Amer. Math. Soc. 59 (1), 89–91. o. DOI:10.1090/s0002-9904-1953-09662-8.  
  5. J. L. Doob. Stochastic Processes. John Wiley & Sons (1953). ISBN 0-471-52369-0 
  6. Olav Kallenberg: Foundations of Modern Probability. 2. edition. Springer, New York 2002, ISBN 0-387-95313-2, S. 573.

Források

  • William Feller, An Introduction to Probability Theory and its Applications, vol 1, 1950, page 223
  • Paul A. Meyer, Probability and Potentials, Blaisdell Publishing Co., 1966, page 28
  • Probability and Random Processes, 3rd, Oxford University Press (2001). ISBN 0-19-857222-0 , pages 67–69

Fordítás

Ez a szócikk részben vagy egészben a Conditional expectation című angol Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.