Voorwaardelijke verwachting

In de kansrekening geeft de voorwaardelijke verwachting of conditionele verwachting van een stochastische variabele, gegeven een gebeurtenis, aan wat de verwachting van de variabele zal zijn, als we ons beperken tot de gegeven gebeurtenis.

Voorbeeld

Het volgende eenvoudige voorbeeld maakt het begrip duidelijk.

De gemiddelde leeftijd in Nederland, de verwachte leeftijd, is vermoedelijk niet gelijk aan de gemiddelde leeftijd per provincie. De voorwaardelijke verwachting van de leeftijd voor (gegeven) een bepaalde provincie, is niets anders dan de gemiddelde leeftijd in die provincie. Zo kan voor elke provincie de voorwaardelijk verwachte leeftijd bepaald worden. Daarmee is de informatie in de verdeling van de leeftijd alvast gereduceerd tot de provincies. De gemiddelde leeftijd in heel Nederland kan nu bepaald worden als het gewogen gemiddelde van de gemiddelden voor de provincies.

In een formele beschrijving kunnen we de leeftijd met X {\displaystyle X} aanduiden en de provincie met Y {\displaystyle Y} . De verdeling van de leeftijd in de provincie Zeeland wordt dan gegeven door de voorwaardelijke verdeling van X {\displaystyle X} , gegeven Y = Zeeland {\displaystyle Y={\text{Zeeland}}} :

P ( X = x | Y = Zeeland ) {\displaystyle P(X=x|Y={\text{Zeeland}})}

De gemiddelde (verwachte) leeftijd in Zeeland is de verwachtingswaarde van deze verdeling, die we de voorwaardelijke verwachting van de leeftijd X {\displaystyle X} , gegeven Y = Zeeland {\displaystyle Y={\text{Zeeland}}} , noemen:

E ( X | Y = Zeeland ) = x x P ( X = x | Y = Zeeland ) {\displaystyle E(X|Y={\text{Zeeland}})=\sum _{x}xP(X=x|Y={\text{Zeeland}})}

Voor elke provincie y {\displaystyle y} kan zo de gemiddelde leeftijd bepaald worden:

E ( X | Y = y ) = x x P ( X = x | Y = y ) {\displaystyle \operatorname {E} (X|Y=y)=\sum _{x}xP(X=x|Y=y)}

Duidelijk is dat deze voorwaardelijke verwachting een functie van y {\displaystyle y} , de provincie, is. Als functie van de stochastische variabele Y {\displaystyle Y} opgevat, noteren we die als:

E ( X | Y ) {\displaystyle \operatorname {E} (X|Y)}

en noemen die de voorwaardelijke verwachting van X {\displaystyle X} gegeven Y {\displaystyle Y} .

Dit is als functie van Y {\displaystyle Y} weer een stochastische variabele. Het toeval bepaalt immers een willekeurige bewoner van Nederland, en daarmee de provincie waarin die woont en uiteindelijk de gemiddelde leeftijd in die provincie. Als de uitkomst ω {\displaystyle \omega } (een willekeurige Nederlander) is gevonden, neemt Y {\displaystyle Y} de waarde Y ( ω ) {\displaystyle Y(\omega )} (de provincie waarin ω {\displaystyle \omega } woont) aan en neemt de voorwaardelijke verwachting van X {\displaystyle X} gegeven Y {\displaystyle Y} de waarde:

E ( X | Y ) ( ω ) = E ( X | Y = Y ( ω ) ) {\displaystyle \operatorname {E} (X|Y)(\omega )=\operatorname {E} (X|Y=Y(\omega ))}

aan, de gemiddelde leeftijd in de provincie Y {\displaystyle Y} .

Definitie voor discrete stochastische variabelen

In het geval van een simultane verdeling van twee discrete stochastische variabelen X {\displaystyle X} en Y {\displaystyle Y} , laat zich het begrip voorwaardelijke verwachting eenvoudig definiëren. De voorwaardelijke verwachting van X {\displaystyle X} gegeven (de gebeurtenis) dat Y {\displaystyle Y} de waarde y {\displaystyle y} aanneemt, genoteerd als:

E ( X | Y = y ) {\displaystyle \operatorname {E} (X|Y=y)} ,

is dan niets anders dan de verwachtingswaarde van de voorwaardelijke verdeling van Y {\displaystyle Y} gegeven de gebeurtenis Y = y {\displaystyle Y=y} .

Door de beperking tot de mogelijkheden waarvoor Y {\displaystyle Y} de waarde y {\displaystyle y} aanneemt, kan X {\displaystyle X} niet meer alle waarden aannemen, en "verandert" z'n verdeling in de voorwaardelijke verdeling. Dit heet wel voorwaardelijke verdeling, maar het is een gewone kansverdeling, waarvan de verwachtingswaarde, mits die bestaat, afhangt van de waarde y {\displaystyle y} . De voorwaardelijk verwachting, gegeven Y = y {\displaystyle Y=y} is dus een functie van y {\displaystyle y} . Beschouwen we deze functie als functie van de stochastische variabele Y {\displaystyle Y} , dan wordt de voorwaardelijke verwachting een stochastische variabele, genoteerd als:

E ( X | Y ) {\displaystyle \operatorname {E} (X|Y)} ,

die als Y {\displaystyle Y} de waarde y {\displaystyle y} aanneemt zelf de waarde E ( X | Y = y ) {\displaystyle \operatorname {E} (X|Y=y)} aanneemt. Anders gezegd: als ω {\displaystyle \omega } de uitkomst is, neemt Y {\displaystyle Y} de waarde Y ( ω ) {\displaystyle Y(\omega )} aan en E ( X | Y ) {\displaystyle \operatorname {E} (X|Y)} de waarde E ( X | Y = Y ( ω ) ) {\displaystyle \operatorname {E} (X|Y=Y(\omega ))} .

In het inleidende voorbeeld is X {\displaystyle X} de leeftijd van een Nederlander en Y {\displaystyle Y} de provincie waarin hij woont.

Abstracte definitie

Zij ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},P)} een kansruimte, X {\displaystyle X} een integreerbare stochastische variabele (een variabele waarvan de absolute waarde integreerbaar is ten opzichte van de maat P {\displaystyle P} ) en D A {\displaystyle {\mathcal {D}}\subset {A}} een deel-sigma-algebra die de informatie weergeeft waarover we beschikken.

Een stochastische variabele Y {\displaystyle Y} die meetbaar is ten opzichte van D {\displaystyle {\mathcal {D}}} en met de eigenschap dat voor elke meetbare verzameling D D {\displaystyle D\in {\mathcal {D}}} geldt:

E ( X 1 D ) = E ( Y 1 D ) {\displaystyle \operatorname {E} (X\cdot 1_{D})=E(Y\cdot 1_{D})} ,

heet voorwaardelijke verwachting van X {\displaystyle X} ten opzichte van D {\displaystyle {\mathcal {D}}} .

Hierbij is E {\displaystyle \operatorname {E} } de gewone verwachting (Lebesgue-integraal) en 1 D {\displaystyle 1_{D}} de indicatorfunctie van D {\displaystyle D} .

Omdat een voorwaardelijke verwachting op een nulverzameling na, uniek bepaald is, noteert men voor de (equivalentieklasse van de) voorwaardelijke verwachting meestal:

E ( X | D ) {\displaystyle \operatorname {E} (X|{\mathcal {D}})} of ook wel E [ X | D ] {\displaystyle \operatorname {E} [X|{\mathcal {D}}]} .

Verantwoording

De variabele Y {\displaystyle Y} is uniek bepaald op een nulverzameling na (bijna overal). Dat er altijd een dergelijke variabele bestaat, kan als volgt worden aangetoond. De afbeeldingen

f + : D R : D E [ ( X 0 ) 1 D ] {\displaystyle f^{+}:{\mathcal {D}}\to \mathbb {R} :D\mapsto \operatorname {E} [(X\vee 0)\cdot 1_{D}]}
f : D R : D E [ ( X 0 ) 1 D ] {\displaystyle f^{-}:{\mathcal {D}}\to \mathbb {R} :D\mapsto -\operatorname {E} [(X\wedge 0)\cdot 1_{D}]}

zijn maten op de meetbare ruimte ( Ω , D ) {\displaystyle (\Omega ,{\mathcal {D}})} die absoluut continu zijn ten opzichte van de restrictie van P {\displaystyle P} tot D {\displaystyle {\mathcal {D}}} . Wegens de stelling van Radon-Nikodym bestaan er dan dichtheden Y + {\displaystyle Y^{+}} en Y {\displaystyle Y^{-}} met de eigenschap dat voor elke meetbare verzameling D D {\displaystyle D\in {\mathcal {D}}} geldt:

f + ( D ) = D Y + d P ( ω ) {\displaystyle f^{+}(D)=\int _{D}Y^{+}\,\mathrm {d} P(\omega )}
f ( D ) = D Y d P ( ω ) {\displaystyle f^{-}(D)=\int _{D}Y^{-}\,\mathrm {d} P(\omega )}

Het verschil Y = Y + Y {\displaystyle Y=Y^{+}-Y^{-}} levert de gewenste variabele.

Verband met voorwaardelijke kans

De voorwaardelijke verwachting van een stochastische variabele is een veralgemening van het begrip voorwaardelijke kans. Zij A {\displaystyle A} en B {\displaystyle B} twee gebeurtenissen in een kansruimte, en noem

Y = P ( A | B ) 1 B + P ( A | B c ) 1 B c {\displaystyle Y=P(A|B)\cdot 1_{B}+P(A|B^{c})\cdot 1_{B^{c}}}

Dan is Y {\displaystyle Y} een "stochastische variabele" die meetbaar is ten opzichte van

σ ( { B } ) = { , B , B c , Ω } {\displaystyle \sigma (\{B\})=\{\emptyset ,B,B^{c},\Omega \}} ,

de sigma-algebra voortgebracht door de gebeurtenis B {\displaystyle B} . Deze stochastische variabele is meteen de voorwaardelijke verwachting van de stochastische variabele 1 A {\displaystyle 1_{A}} ten opzichte van σ ( { B } ) {\displaystyle \sigma (\{B\})} .

Verwachting ten opzichte van een andere variabele

Als X {\displaystyle X} en Y {\displaystyle Y} twee stochastische variabelen zijn, noemen we voorwaardelijke verwachting van X {\displaystyle X} ten opzichte van Y {\displaystyle Y} , de voorwaardelijke verwachting van X {\displaystyle X} ten opzichte van de sigma-algebra voortgebracht door Y {\displaystyle Y} :

E ( X | Y ) = E ( X | σ ( Y ) ) {\displaystyle \operatorname {E} (X|Y)=\operatorname {E} (X|\sigma (Y))}

Elementaire eigenschappen

  1. De voorwaardelijke verwachting is integreerbaar, en haar verwachting is gelijk aan de verwachting van de oorspronkelijke variabele: E ( E ( X | D ) ) = E ( X ) {\displaystyle \operatorname {E} (\operatorname {E} (X|{\mathcal {D}}))=\operatorname {E} (X)}
  2. Als X {\displaystyle X} zelf al meetbaar is ten opzichte van D {\displaystyle {\mathcal {D}}} , is ze (bijna overal) gelijk aan haar eigen voorwaardelijke verwachting.
  3. Als C D A {\displaystyle {\mathcal {C}}\subset {\mathcal {D}}\subset {\mathcal {A}}} een stijgende keten van deelstammen is, dan is de voorwaardelijke verwachting transitief: E ( E ( X | D ) | C ) = E ( X | C ) {\displaystyle \operatorname {E} (\operatorname {E} (X|{\mathcal {D}})|{\mathcal {C}})=\operatorname {E} (X|{\mathcal {C}})}

Onafhankelijkheid

De stochastische variabele X {\displaystyle X} is onafhankelijk van de sigma-algebra D {\displaystyle {\mathcal {D}}} als haar voorwaardelijke verwachting bijna overal gelijk is aan een constante.

In het bijzonder is X {\displaystyle X} onafhankelijk van een andere stochastische variabele Y {\displaystyle Y} als E ( X | Y ) {\displaystyle \operatorname {E} (X|Y)} constant is. Deze eigenschap blijkt symmetrisch te zijn in X {\displaystyle X} en Y {\displaystyle Y} , en we zeggen dan ook simpelweg dat X {\displaystyle X} en Y {\displaystyle Y} (onderling) onafhankelijk zijn.

Algemener heet een familie stochastische variabelen { X i | i I } {\displaystyle \{X_{i}|i\in I\}} onderling onafhankelijk als ieder lid van de familie onafhankelijk is van de sigma-algebra voortgebracht door alle andere leden.

Het onafhankelijkheidsbegrip van gebeurtenissen A {\displaystyle A} en B {\displaystyle B} komt overeen met de onafhankelijkheid van hun indicatorfuncties 1 A {\displaystyle 1_{A}} en 1 B {\displaystyle 1_{B}} , opgevat als stochastische variabelen.