Distribuzione multinomiale

Niente fonti!
Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.

In teoria delle probabilità la distribuzione multinomiale è una distribuzione di probabilità discreta che generalizza la distribuzione binomiale in più variabili.

In altri termini, laddove la distribuzione binomiale descrive il numero di successi in un processo di Bernoulli, per il quale ogni singola prova può fornire due soli risultati, la distribuzione multinomiale descrive il caso più generale in cui ogni prova possa fornire un numero finito di risultati, ognuno con la propria probabilità.

Un esempio di distribuzione multinomiale è dato dal numero di occorrenze di ogni faccia per alcuni lanci successivi di un dado a 6 facce.

Definizione

Distribuzione binomiale

La distribuzione binomiale B ( p , n ) {\displaystyle {\mathcal {B}}(p,n)} descrive le probabilità per ogni coppia ( k , n k ) {\displaystyle (k,n-k)} ("successi", "fallimenti") in n {\displaystyle n} prove indipendenti, ognuna delle quali ha probabilità p {\displaystyle p} e 1 p {\displaystyle 1-p} di fornire un "successo" o un "fallimento".

Distribuzione multinomiale

La distribuzione multinomiale di parametri ( ( p 1 , . . . , p s ) , n ) {\displaystyle ((p_{1},...,p_{s}),n)} , con p 1 + . . . + p s = 1 {\displaystyle p_{1}+...+p_{s}=1} , descrive le probabilità per ogni s-upla ( n 1 , . . . , n s ) {\displaystyle (n_{1},...,n_{s})} (con n 1 + . . . + n s = n {\displaystyle n_{1}+...+n_{s}=n} ) di risultati x 1 , . . . , x s {\displaystyle x_{1},...,x_{s}} in n {\displaystyle n} prove indipendenti, ognuna delle quali ha probabilità p i {\displaystyle p_{i}} di fornire x i {\displaystyle x_{i}} .

Questa distribuzione può essere descritta prendendo un vettore aleatorio X j {\displaystyle X_{j}} per i risultati di ogni singola prova, con

P ( X j = e i ) = p i {\displaystyle P(X_{j}=e_{i})=p_{i}} ,

dove { e 1 , . . . , e s } {\displaystyle \{e_{1},...,e_{s}\}} è la base canonica per R s {\displaystyle \mathbb {R} ^{s}} , e 1 = ( 1 , 0 , . . . , 0 ) {\displaystyle e_{1}=(1,0,...,0)} ,... , e s = ( 0 , . . . , 0 , 1 ) {\displaystyle e_{s}=(0,...,0,1)} . La distribuzione multinomiale descrive allora la variabile aleatoria S = X 1 + . . . + X n {\displaystyle S=X_{1}+...+X_{n}} .

Probabilità

La funzione di probabilità della distribuzione multinomiale di parametri ( ( p 1 , . . . , p s ) , n ) {\displaystyle ((p_{1},...,p_{s}),n)} , con p 1 + . . . + p s = 1 {\displaystyle p_{1}+...+p_{s}=1} , è

P ( n 1 , . . . , n s ) = ( n n 1 , . . . , n s ) i p i n i = n ! n 1 ! n s ! p 1 n 1 p s n s {\displaystyle P(n_{1},...,n_{s})={\binom {n}{n_{1},...,n_{s}}}\prod _{i}p_{i}^{n_{i}}={\frac {n!}{n_{1}!\cdots n_{s}!}}p_{1}^{n_{1}}\cdots p_{s}^{n_{s}}} per tutte le s-uple ( n 1 , . . . , n s ) { 0 , 1 , . . , n } s {\displaystyle (n_{1},...,n_{s})\in \{0,1,..,n\}^{s}} con n 1 + . . . + n s = n {\displaystyle n_{1}+...+n_{s}=n} .

Qui il coefficiente multinomiale ( n n 1 , . . . , n s ) {\displaystyle \textstyle {\binom {n}{n_{1},...,n_{s}}}} "conta" il numero di possibili sequenze con n 1 {\displaystyle n_{1}} risultati x 1 {\displaystyle x_{1}} , n 2 {\displaystyle n_{2}} risultati x 2 {\displaystyle x_{2}} e così via. Il prodotto i p i n i {\displaystyle \textstyle \prod _{i}p_{i}^{n_{i}}} fornisce la probabilità di ognuna di queste sequenze.

Il teorema multinomiale mostra come la probabilità totale sia pari a 1:

n 1 + . . . + n s = n P ( n 1 , . . . , n s ) = ( p 1 + . . . + p n ) n = 1 n = 1 {\displaystyle \sum _{n_{1}+...+n_{s}=n}P(n_{1},...,n_{s})=(p_{1}+...+p_{n})^{n}=1^{n}=1} .

Caratteristiche

Caso binomiale

La distribuzione binomiale di parametri ( p , n ) {\displaystyle (p,n)} è una distribuzione multinomiale di parametri ( ( p , 1 p ) , n ) {\displaystyle ((p,1-p),n)} .

Se il vettore aleatorio S = ( S 1 , . . . , S s ) {\displaystyle S=(S_{1},...,S_{s})} segue la distribuzione multinomiale di parametri ( ( p 1 , . . . , p s ) , n ) {\displaystyle ((p_{1},...,p_{s}),n)} allora ogni sua coordinata S i {\displaystyle S_{i}} è una variabile aleatoria che segue la distribuzione binomiale ( p i , n ) {\displaystyle (p_{i},n)} . In altri termini ogni coordinata i {\displaystyle i} considera i "successi" dell'evento x i {\displaystyle x_{i}} .

Indici

Molte degli usuali indici di una distribuzione su R {\displaystyle \mathbb {R} } non si estendono al caso multidimensionale.

La speranza matematica del vettore aleatorio S {\displaystyle S} (definita come somma pesata dei possibili vettori) per trasformazione lineare ha come componenti le speranze delle componenti ed è pari a n {\displaystyle n} volte la speranza di una singola prova:

E [ S ] = ( E [ S 1 ] , . . . , E [ S s ] ) = n E [ X ] = n ( p 1 , . . . , p s ) = ( n p 1 , . . . , n p s ) {\displaystyle E[S]={\big (}E[S_{1}],...,E[S_{s}]{\big )}=nE[X]=n(p_{1},...,p_{s})=(np_{1},...,np_{s})} .

Come nel caso binomiale la matrice delle covarianze di S = ( S 1 , . . . , S s ) {\displaystyle S=(S_{1},...,S_{s})} (la matrice s × s {\displaystyle s\times s} con elementi m i , j = cov ( S i , S j ) {\displaystyle m_{i,j}={\text{cov}}(S_{i},S_{j})} ) è pari a n {\displaystyle n} volte la matrice delle covarianze di una singola prova X {\displaystyle X} , dunque è data da

m i , i = n Var ( X i ) = n p i ( 1 p i ) {\displaystyle m_{i,i}=n\,{\text{Var}}(X_{i})=np_{i}(1-p_{i})}
m i , j = n cov ( X i , X j ) = n p i p j {\displaystyle m_{i,j}=n\,{\text{cov}}(X_{i},X_{j})=-np_{i}p_{j}} se i j {\displaystyle i\neq j} .

Distribuzioni correlate

Nella statistica bayesiana la distribuzione di Dirichlet è una coniugata della distribuzione multinomiale. Più precisamente, se il parametro ( p 1 , . . . , p s ) {\displaystyle (p_{1},...,p_{s})} di una distribuzione multinomiale segue una distribuzione di Dirichlet di parametro α = ( α 1 , . . . , α s ) {\displaystyle \alpha =(\alpha _{1},...,\alpha _{s})} allora la sua distribuzione condizionata dall'evento S = σ = ( n 1 , . . . , n s ) {\displaystyle S=\sigma =(n_{1},...,n_{s})} segue ancora una distribuzione di Dirichlet, di parametro α + σ = ( α 1 + n 1 + . . . + α s + n s ) {\displaystyle \alpha +\sigma =(\alpha _{1}+n_{1}+...+\alpha _{s}+n_{s})} . (La distribuzione di Dirichlet è la generalizzazione multivariata della distribuzione Beta, che svolge lo stesso ruolo per la distribuzione binomiale.)

Il test del χ 2 {\displaystyle \chi ^{2}} di adeguamento può essere descritto a partire dalla distribuzione multinomiale, poiché per valori "grandi" di n {\displaystyle n} la distribuzione di ogni componente S i {\displaystyle S_{i}} (centrata e ridotta) viene approssimata da una distribuzione normale (standard).

Esempio

Il numero di risultati "1", "2", "3", "4", "5" e "6" per n lanci di un dado equilibrato a 6 facce è descritto dalla distribuzione multinomiale di parametri ( ( 1 6 , 1 6 , 1 6 , 1 6 , 1 6 , 1 6 ) , n ) {\displaystyle (({\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}},{\tfrac {1}{6}}),n)} .

Un diverso esempio è dato dall'estrazione (con reinserimento) di una pallina da un'urna che contenga palline di diversi colori. Per un'urna con sei palline, di cui una verde, due bianche e tre blu, si hanno i parametri ( p 1 , p 2 , p 3 ) = ( 1 6 , 1 3 , 1 2 ) {\displaystyle (p_{1},p_{2},p_{3})=({\tfrac {1}{6}},{\tfrac {1}{3}},{\tfrac {1}{2}})} ; il risultato di cinque estrazioni (con reinserimento della pallina estratta) è descritto dalla distribuzione multinomiale di parametri ( ( 1 6 , 1 3 , 1 2 ) , 5 ) {\displaystyle (({\tfrac {1}{6}},{\tfrac {1}{3}},{\tfrac {1}{2}}),5)} .
Per calcolare la probabilità che la pallina estratta sia due volte verde, una volta bianca e due volte blu basta calcolare la probabilità

P ( 2 , 1 , 2 ) = ( 5 2 , 1 , 2 ) ( 1 6 ) 2 ( 1 3 ) 1 ( 1 2 ) 2 = 5 ! 2 ! 1 ! 2 ! 1 6 2 1 3 1 2 2 = 5 72 7 % {\displaystyle P(2,1,2)={\binom {5}{2,1,2}}\left({\frac {1}{6}}\right)^{2}\left({\frac {1}{3}}\right)^{1}\left({\frac {1}{2}}\right)^{2}={\frac {5!}{2!\,1!\,2!}}{\frac {1}{6^{2}}}{\frac {1}{3}}{\frac {1}{2^{2}}}={\frac {5}{72}}\approx 7\%}

Collegamenti esterni

  • (EN) William L. Hosch, multinomial distribution, su Enciclopedia Britannica, Encyclopædia Britannica, Inc. Modifica su Wikidata
  • (EN) Eric W. Weisstein, Distribuzione multinomiale, su MathWorld, Wolfram Research. Modifica su Wikidata
Controllo di autoritàGND (DE) 4263656-5
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica