Kupon toplayıcısının problemi

Kupon toplayıcısının problemi bir olasılık kuramı pratik problemi olarak "bütün kuponları topla ve ödün kazan" tipli yarışmalar için olasılık modeli içerir. Sorulan soru şöyle ifade edilebilir:

Yarışma için n sayıda kupon olduğu kabul edilsin ve kuponların geri koyup tekrar seçme ile toplandığı varsayılsın. Bütün n kuponları toplamak icin t sayıda örneklem deneysel seçiminden daha fazla sayıda seçim yapılması gerekliliğinin olasılığı nedir?"

Bu problemin matematik analizi gereken deneysel seçimin beklenen sayısının O ( n log ( n ) ) {\displaystyle O(n\log(n))} haddinde büyüyeceğini açıklamaktadır. Örneğin n=50 olursa bütün 50 kuponun toplanması için gereken örneklem yaklaşık sayısı 225 olmalıdır.

Problemin anlaşılması

Bu problemi çözmeye anahtar ilk düşük sayıda kuponun toplanması zamanının çok küçük olduğudur. Son birkaç kuponun toplanması ise, buna tam karşıt olarak, gayet çok zaman alması gerekmektedir. Örnegin 50 kuponlu bir problem için 49uncu kuponu topladıktan sonra 50. kuponu bulmak için asgari 50 deneysel seçim yapmak gerekmektedir. Beklenen zaman dönemini hesap edebilmek için toplam zamanı 50 zaman aralığına bölmek gerekmektedir.

Çözüm

Bekleyişin hesaplanması

Tum n kuponu toplamak icin gerekli zaman T olarak ve ti i - 1 kupon toplandıktan sonra iinci kuponu toplamak için gerekli zaman olduğu kabul edilsin. T ve ti rassal değişkenler olarak görülebilir. i - 1 kupon elde bulunduğu verilmiş ise bir yeni kuponu toplama olasılığı
'pi = (n - i + 1)/n
olduğu gözümlenebilir. Bundan dolayı ti beklenen değeri 1/pi olan bir geometrik dağılım gösterir. beklenen değerlerin doğrusallığı dolayısıyla şu yazılabilir:

E ( T ) = E ( t 1 ) + E ( t 2 ) + + E ( t n ) = 1 p 1 + 1 p 2 + + 1 p n = n n + n n 1 + + n 1 = n ( 1 1 + 1 2 + + 1 n ) = n H n . {\displaystyle {\begin{aligned}\operatorname {E} (T)&=\operatorname {E} (t_{1})+\operatorname {E} (t_{2})+\cdots +\operatorname {E} (t_{n})={\frac {1}{p_{1}}}+{\frac {1}{p_{2}}}+\cdots +{\frac {1}{p_{n}}}\\&={\frac {n}{n}}+{\frac {n}{n-1}}+\cdots +{\frac {n}{1}}=n\cdot \left({\frac {1}{1}}+{\frac {1}{2}}+\cdots +{\frac {1}{n}}\right)\,=\,n\cdot H_{n}.\end{aligned}}}

Burada Hn bir harmonik sayı olur ve harmonik sayıların "asimptotik" özelliğini kullanarak, şu ifade bulunur:

E ( T ) = n H n = n ln n + γ n + 1 2 + o ( 1 ) ,     as   n , {\displaystyle \operatorname {E} (T)=n\cdot H_{n}=n\ln n+\gamma n+{\frac {1}{2}}+o(1),\ \ {\text{as}}\ n\to \infty ,}

Burada γ 0.5772156649 {\displaystyle \gamma \approx 0.5772156649} Euler–Mascheroni sabiti olur.

Şimdi Markov eşitsizliği kullanarak istenilen olasılık sayısı için sınırlar konulur:

P ( T c n H n ) 1 c . {\displaystyle \operatorname {P} (T\geq c\,nH_{n})\leq {\frac {1}{c}}.}

Varyansın hesaplanması

ti rassal degişkenlerinin bağımsızlığı özelliği kullanılarak şu elde edilir:

Var ( T ) = Var ( t 1 ) + Var ( t 2 ) + + Var ( t n ) = 1 p 1 p 1 2 + 1 p 2 p 2 2 + + 1 p n p n 2 n 2 n 2 + n 2 ( n 1 ) 2 + + n 2 1 2 n 2 ( 1 1 2 + 1 2 2 + ) = π 2 6 n 2 2 n 2 , {\displaystyle {\begin{aligned}\operatorname {Var} (T)&=\operatorname {Var} (t_{1})+\operatorname {Var} (t_{2})+\cdots +\operatorname {Var} (t_{n})\\&={\frac {1-p_{1}}{p_{1}^{2}}}+{\frac {1-p_{2}}{p_{2}^{2}}}+\cdots +{\frac {1-p_{n}}{p_{n}^{2}}}\\&\leq {\frac {n^{2}}{n^{2}}}+{\frac {n^{2}}{(n-1)^{2}}}+\cdots +{\frac {n^{2}}{1^{2}}}\\&\leq n^{2}\cdot \left({\frac {1}{1^{2}}}+{\frac {1}{2^{2}}}+\cdots \right)={\frac {\pi ^{2}}{6}}n^{2}\leq 2n^{2},\end{aligned}}}

Burada son eşitlilik baz problem olarak anılan Riemann zeta fonksiyonunun değeridir.

Şimdi istenilen olasılık değerine sınırlar koymak için Çebişev eşitsizliği kullanılır:

P ( | T n H n | c n ) 2 c 2 . {\displaystyle \operatorname {P} \left(|T-nH_{n}|\geq c\,n\right)\leq {\frac {2}{c^{2}}}.}

Kuyruk kestirimleri

Diğer bir yaklaşım kullanılarak başka bir yukarı sınır ifadesi de elde etmek mümkündür: İlk r {\displaystyle r} sayıda deneysel seçimde i {\displaystyle i} -inci kuponun ele geçmeme olayı Z i r {\displaystyle {Z}_{i}^{r}} ile ifade edilsin. O zaman

P [ Z i r ] = ( 1 1 n ) r e r / n {\displaystyle {\begin{aligned}P\left[{Z}_{i}^{r}\right]=\left(1-{\frac {1}{n}}\right)^{r}\leq e^{-r/n}\end{aligned}}}

Böylece, r = β n log n {\displaystyle r=\beta n\log n} , için şu elde edilir P [ Z i r ] e ( β n log n ) / n = n β {\displaystyle P\left[{Z}_{i}^{r}\right]\leq e^{(-\beta n\log n)/n}=n^{-\beta }} .

P [ T > β n log n ] P [ i Z i β n log n ] n P [ Z 1 ] n β + 1 {\displaystyle {\begin{aligned}P\left[T>\beta n\log n\right]\leq P\left[\bigcup _{i}{Z}_{i}^{\beta n\log n}\right]\leq n\cdot P[{Z}_{1}]\leq n^{-\beta +1}\end{aligned}}}

Olasılık üretici fonksiyonları ile bağlantı

Kupon toplayıcısının problemini çözmek için üretici fonksiyon yaklaşımı da kullanılabilir.

Ayrıca bakınız

  • Watterson kestirmcisi

Kaynakça

  • Paul Erdős ve Alfréd Rényi, "On a classical problem of probability theory (Olasılık kuramında bir klasik problem)", Magyar Tud. Akad. Mat. Kutato Int. Kozl, 1961.(İngilizce)

Dış bağlantılar

  • İngilizce Wikipedia'da Coupon collector's problem maddesi 30 Ekim 2021 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim tarihi: 30.8.2009)
  • Kupon toplayıcı problemi Wolfram gösterimler projesi içeriğinde Mathematica komputer paketi uygulaması 18 Eylül 2009 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim tarihi: 30.8.2009)
  • Kupon toplayıcı problemi için küçük bir Java applet 15 Ekim 2009 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim tarihi: 30.8.2009)
  • Bir kupon toplayıcı kaç tane tek, çift, üçlü vb. beklemelidir. 10 Ekim 2008 tarihinde Wayback Machine sitesinde arşivlendi. Doron Zeilberger tarafından küçük bir not (İngilizce) (Erişim tarihi: 30.8.2009)