618. On considère une urne contenant a boules blanches et b boules rouges. Après chaque tirage, on remet c boules de la couleur tirée dans l’urne. On effectue n tirages et on note X la variable aléatoire donnant le nombre de boules rouges tirées.

a) Déterminer la loi de X et calculer son espérance.

b) On considère Y la variable aléatoire donnant le numéro du premier tirage pour lequel on tire une boule rouge. Montrer que Y admet une espérance et calculer la loi de Y .

La modélisation proposée est celle des urnes de Polya . L’énoncé ne précise pas si la boule tirée est remise ou non dans l’urne. Nous supposons qu’elle est remise, le problème serait le même si la boule n’était pas remise, mais que l’on rajoutait c + 1 boules de la couleur choisie. Par ailleurs, nous noterons dans l’exercice Xn au lieu de X la variable aléatoire qui correspond au nombre de boules rouges tirées au n-ième tirage. Au bout de ces n tirages, il y a alors a + b + nc boules dans l’urne, dont b + Xnc sont rouges.

Précisons aussi que l’énoncé est incorrect : Y n’admet une espérance que si b⁄c > 1.

a) Notons Rk (resp. Bk) l’événement une boule rouge (resp. blanche) est tirée au ke tirage . Par la formule des probabilités composées, la probabilité de tirer k ∈ [ [0,n]] boules rouges en premier, suivies de n - k boules blanches, est P(R1 ⋅⋅⋅Rk Bk+1 ⋅⋅⋅Bn) qui vaut

bb+ c       b+ (k- 1)c       a       a+ (n- k - 1)c
a+b⋅a+-b+-c ⋅⋅⋅a-+-b+-(k---1)c-⋅a-+b-+-kc ⋅⋅⋅a+-b-+(n---1)c⋅
Si on change l’ordre dans lequel on tire les k boules rouges et les n-k boules blanches, le dénominateur ne change pas, tandis que l’ordre des facteurs du numérateur est permuté, mais le produit restera le même. Ainsi,
         (  )k-1       n-k-1       n-1
P(X  = k) =  n  ∏ (b+ jc) ∏   (a + jc)∏  ----1---⋅
 n         k j=0        j=0        j=0 a+ b + jc
Traditionnellement, l’urne de Polya est étudiée dans le cas ou c = 1 (voire aussi a = b = 1), ce qui permet de simplifier l’expression précédente. Mais l’examinateur a souhaité dans sa grande sagesse généraliser à des valeurs quelconques, ce qui rend la simplification du produit précédent impossible et handicape l’exploitation de la loi pour le calcul de l’espérance. Nous allons calculer celle-ci différemment. Il est facile d’obtenir la loi conditionnelle de Xn+1 sachant que Xn = r :
P(Xn+1=r+1|Xn = r) = --b+-rc-- ;  P (Xn+1 = r |Xn = r) = a-+-(n---r)c⋅
            a+ b+ nc                           a + b+ nc

On dispose alors d’une relation sur l’espérance conditionnelle :

E (Xn+1 |Xn ) = Xn +-b-+-cXn--
                   a + b+ nc
d’où, en passant à l’espérance cette égalité de variables aléatoires :
          ----b----  a-+-b+-(n-+-1)c
E(Xn+1) = a+ b +nc +    a+ b+ nc   E(Xn).
Remarquons que l’on peut obtenir cette relation par la formule standard de l’espérance, en conditionnant les probabilités. On a alors
(      )    (                         )    (         )
EXn+1----- =  b ----1----- ------1------- + E  ---Xn----
a+b+(n+ 1)c    c a +b + nc  a + b+ (n+ 1)c      a+ b + nc
et par télescopage :
 ( ---Xn---)   b( -1---  ---1----)
E  a+ b+ nc  = c  a+ b - a+ b+ nc
d’où E(Xn ) = nb
a+bLa forme simple de ce résultat laisse penser qu’il y a peut-être une façon plus simple de répondre à la question. En effet, si on avait a = b, alors le problème serait symétrique sur les boules blanches et rouges, et donc la loi de Xn et celle de n-Xn serait la même, ce qui conduit alors mécaniquement à E(Xn) = n
2

b) Par les calculs précédents, on a

            n∏-1--a+-kc--
P (Xn = 0) =    a +b + kc⋅
            k=0

On en déduit la loi de Y  : P(Y = 1) = P(X1 = 1) = -b-
a+b et

                                             n-2
P(Y=n)=P(Xn- 1 = 0)⋅P(Xn = 1 |Xn-1 = 0) =-----b-------∏  --a+-kc--⋅
                               a +b + (n - 1)c k=0a + b+ kc
De plus, Y pourrait n’être pas définie : on a alors P(Y = +) = limn→∞P(Xn = 0).

Calculons un développement asymptotique de un := P(Xn = 0) : on écrit

     n-∏ 1           n∏-1(            )
un :=     -a-+-kc--=     1 - ----b---- .
      k=0 a+ b+ kc   k=0     a+ b+ kc
Alors ln un = n-1∑

k=0 ---b---
a+b+kc + O(1⁄k2) = λ-b
c lnn + O(1) après une étude classique. Ainsi, il existe une constante A > 0 telle que
            -A--               -A-- -b
P(Xn = 0) ~ nb⁄c  et P (Y = n) ~ nb⁄c ⋅cn

On en déduit au passage que P(Xn = 0)-→n+0 et donc que Y est définie presque sûrement. Et Y n’admet une espérance que si b⁄c > 1.

De façon complémentaire, on peut démontrer à l’aide de la relation sur l’espérance conditionnelle que la variable aléatoire

         1    (     b)
Zn := a-+-b+-nc Xn + c
est une martingale bornée, donc qui converge presque sûrement. Il en est donc de même de la convergence presque sûre de Xn-
 n. La loi de la limite se calcule dans les cas simples : on obtient la loi uniforme dans le cas où a = b = c = 1, et la loi bêta de paramètres a et b lorsque a et b sont quelconques mais c = 1. Il ne serait pas choquant que dans le cas général, la loi limite de Xn
n soit la loi bêta de paramètres a
c et b
c, de densité sur [0,1] proportionnelle à xa⁄c-1 (1 - x)b⁄c-1.
[Liste des corrigés]