Expérimentation Numérique Interactive et grains logiciels 3.0

Accueil > Expériences en ligne > Probabilités > Processus de Bienaymé-Galton-Watson

Processus de Bienaymé-Galton-Watson

Modèle de reproduction aléatoire en temps discret

Rajouté le jeudi 30 janvier 2014
Jean-René Chazottes , Marc Monticelli

Ce modèle a été introduit par Bienaymé en 1845 et indépendamment par Galton en 1873. Leur préoccupation était de comprendre comment pouvaient disparaître des patronymes de la noblesse.
Ils proposèrent le modèle suivant :
À la génération $t=0$, il y a un seul homme qui a une probabilité $p_k$ d’avoir $k$ enfants mâles, $k=0,1,2,\ldots, k_{\mathrm{max}}$.
À la génération $t=1$, chaque descendant mâle a une probabilité $p_k$ d’avoir $k$ enfants mâles.
Et ainsi de suite.
On définit donc le nombre $X_t$ de descendants de l’individu initial à la génération $t$ par une récurrence aléatoire démarrant avec $X_0=1$ : $X_t$ s’obtient en prenant le nombre de descendants de chaque individu de la génération $t-1$ et en faisant la somme de ces nombres. Observons que si $X_{T}=0$ pour une certaine génération $T\geq 1$, alors $X_{T+1}=0, X_{T+2}=0,\ldots$ : la descendance de l’individu initial s’éteint. La première génération $T$ telle que $X_{T}=0$ s’appelle le temps d’extinction. C’est une quantité aléatoire.

Ce modèle a été réintroduit pour de toutes autres raisons en 1922 par Fisher qui voulait étudier la disparition ou le maintien d’un gène mutant dans une population. Dans ce cas, $p_k$ est la probabilité qu’un gène soit transmis d’un individu à $k$ de ses descendants.

L’ensemble des $p_k$ s’appelle la loi de reproduction. La somme de tous les nombres $p_k$, qui sont compris entre $0$ et $1$, doit valoir $1$.

L’expérience numérique suivante illustre la construction des « arbres » aléatoires créés par ce processus. On a pris comme exemples un cas où il y a $0$ ou $2$ descendants par individu et par génération et un autre cas où il y a $0$, $1$ ou $2$ descendants.
Noter que chaque fois qu’on recommence, la lignée de l’individu initial est différente à cause du caractère aléatoire de la reproduction.



La question fondamental est la suivante : a-t-on, selon les valeurs de $p_k$, extinction de la descendance de l’individu initial ou bien sa persistence indéfinie ? Autrement dit, quelle est la probabilité d’extinction de la population résultant d’un individu initial ?

Intuitivement, on peut se dire que le paramètre clé est le nombre moyen de descendants par individu en une génération qu’on note $m$, c.-à-d. l’espérance de la loi de reproduction : $m=p_1+2p_2+3 p_3+\cdots$. Si $m<1$, on peut s’attendre à l’extinction certaine, tôt ou tard. On pourrait s’attendre à la non extinction certaine dans le cas $m>1$. Nous allons voir que c’est plus subtil.

Si on note $s_t$ la probabilité qu’à la génération $t$ la population soit éteinte, c.-à-d. la probabilité que $X_t=0$, on peut démontrer la relation de récurrence suivante :

$$ s_{t}=\varphi(s_{t-1}) $$

où $\varphi$ est la fonction génératrice de la loi de reproduction :

$$ \varphi(s)=p_0+p_1 s + p_2 s^2+\cdots $$

Dans l’exemple où il n’y a que $0$ ou $2$ descendants, cette série se réduit à un polynôme du second degré : $\varphi(s)=p_0+p_2 s^2$. Une propriété générale de la fonction génératrice est que sa dérivée en $s=1$ donne le nombre moyens de descendants : $\varphi'(1)=m$ (pente de la tangente au graphe de $\varphi$ en $s=1$).

L’autre point clé est qu’on démontre que la probabilité d’extinction est la limite, quand $t$ tend vers l’infini, de $s_t$. On doit donc voir vers quoi converge la suite $(s_t)$ définie par la récurrence $s_t=\varphi(s_{t-1})$. On a $s_0=0$ car à la génération $t=0$ il y a un individu, donc la probabilité que la population soit éteinte est nulle.

L’expérience numérique suivante permet de voir ce qui se passe dans l’exemple où $\varphi(s)=p_0+p_2 s^2$ lorsque $p_0$ ou $p_2$ varie, ce qui modifie bien sûr $m$ qui vaut $2p_2$. En cliquant on sélectionne un $s_0$ (la valeur naturelle est $0$ mais on peut prendre n’importe quelle valeur différente de $1$) et on visualise vers quoi converge la suite $(s_t)$, donc ce que vaut la probabilité d’extinction.



Expérimentalement, on constate que si $m\leq 1$, $(s_n)$ converge vers $1$ : la probabilité d’extinction vaut $1$ (elle est certaine) ; si $m>1$, cette probabilité est comprise strictement entre $0$ et $1$ et vaut $s^*$.
C’est en fait un théorème qui est valable pour toute loi de reproduction $\{p_0,p_1,\ldots\}$ (pourvu que $m=\sum_{k=1}^{\infty} k\, p_k<\infty$). En fait, quelle que soit la loi de reproduction, on a qualitativement le même phénomène que dans l’expérience numérique ci-dessus (une fonction génératrice quelconque a les propriétés suivantes : $\varphi(0)=p_0$, $\varphi(1)=1$, $\varphi$ est convexe et $\varphi'(1)=m$).

Pour aller un peu plus loin.
Lorsque $m>1$, on vient de voir que la probabilité d’extinction n’est ni nulle ni égale à un. Cela signifie qu’il existe une génération $T\geq 1$ telle que $X_t=0$ pour tout $t\geq T$ et que cet événement a une probabilité égale à $s^*$. Quel est l’événement complémentaire ? A priori, $X_t$ pourrait soit atteindre une certaine valeur stable $N$ ou bien tendre vers l’infini. On peut démontrer que seule la seconde possibilité est vraie, donc, avec une probabilité égale à $1-s^*$, $X_t\to+\infty$. À quelle vitesse a lieu cette « explosion » ? La réponse est : en $m^t$, c.-à-d. exponentiellement vite.
L’expérience numérique qui suit corrobore cette affirmation. On y calcule la quantité $X_t/m^t$ en fonction de $t$ pour plusieurs réalisations.

$X_t/m^t$ en fonction de $t$ ($m>1$)



Cette expérience numérique illustre ce que nous avons décrit :
- soit l’extinction a lieu ($X_t$ devient nul donc également $X_t/m^t$) ;
- soit la descendance ne s’éteint pas auquel cas $X_t$ croît exponentiellement avec $t$, ce qui correspond à la stabilisation de $X_t/m^t$.
La proportion de réalisations pour lesquelles il y a extinction devrait être proche de la probabilité d’extinction si on avait un très grand nombre d’entre elles.
Observons aussi que $X_t/m^t$ ne se stabilise pas autour d’une valeur commune pour différentes réalisations. La raison est que $X_t/m^t$ tend vers une variable aléatoire, pas une quantité déterministe.

Pour en savoir plus, on peut lire cet article en ligne ainsi que celui-là.

Code HTML pour intégrer ces simulations dans vos pages :

<iframe style="overflow: hidden;" src="http://experiences.math.cnrs.fr/simulations/branchements/ProcessusBGW/index.html" height="550" width="100%" frameborder="0" scrolling="no"></iframe>

et

<iframe style="overflow: hidden;" src="http://experiences.math.cnrs.fr/simulations/branchements/FonctionGeneratrice/index.html" height="450" width="100%" frameborder="0" scrolling="no"></iframe>

et

<iframe style="overflow: hidden;" src="http://experiences.math.cnrs.fr/simulations/branchements/Serie/index.html" height="450" width="100%" frameborder="0" scrolling="no"></iframe>