Fonctions de répartition d'une variable discrète, d'une variable continue et d'une variable avec atome, mais non discrète.
Enthéorie des probabilités, lafonction de répartition d'unevariable aléatoire réelleX est la fonctionFX qui, à tout réelx, associe la probabilité queX prenne une valeur inférieure ou égale àx :Cette fonction caractérise laloi de probabilité de la variable aléatoire : elle permet de calculer la probabilité de chaque intervalle semi-ouvert à gauche]a,b] oùa <b, par
Fonction de répartition de laloi normale centrée réduite.
La fonction de répartitionFX d'une variable aléatoireX dedensité de probabilitéfX est uneprimitive (en un sens un peu relâché) de cette densitéfX. Plus précisément,FX est définie, pour tout nombre réelx, par :
Toutefois, il ne s'agit pas d'une primitive au sens strict du terme car il se peut que qu'une fonction de répartition ne soit pas dérivable sur tout comme c'est le cas pour la fonction de répartition de laloi uniforme sur l'intervalle[a,b] (non dérivable ena ou enb), ou encore de laloi exponentielle (non dérivable en0). On peut seulement affirmer :
que si la variableX est à densité, alors la dérivée deFX est égale àfX presque partout pour la mesure de Lebesgue.
On peut remarquer que, contrairement aux variables discrètes, une variable à densitéX vérifie pour tout nombre réela : en conséquence, la fonction de répartition des variables à densité est continue en tout point. En fait une variable aléatoire réelleX possède une densité de probabilité si et seulement si sa fonction de répartition estabsolument continue sur chaque intervalle borné.
Fonction de répartition de laloi uniforme discrète sur {0,2 ; 0,4 ; 0,6 ; 0,8 ; 1} (pour laquellepi = 0,2 ; 1 ≤i ≤ 5, en violet) et de la loi uniforme (continue) sur l'intervalle[0, 1] (en rouge).
Une variable aléatoireX est dite discrète si sonsupportS estfini oudénombrable, ou bien, de manière équivalente, s'il existe un ensembleA fini ou dénombrable tel que
La loi deX est déterminée sans ambiguïté par la donnée de(ps)s ∈S ou de(ps)s ∈A, où
Si, par exemple,X est une variable aléatoireréelle, on aoù1E est lafonction indicatrice de l'ensemble E.
Pour les variables aléatoires discrètes les plus courantes (par exemple, les loisuniformes,binomiales,de Poisson)S est unensemble bien ordonné : on peut alors numéroter ses éléments de manière croissante, p.e.s1 ≤s2 ≤s3 ≤ ... et numéroter les probabilitésps en conséquence, p.e. en posantpi = psi,i ≥ 1. On a alors, six ∈ [si,si + 1[,
Soit encore, plus généralement :
La fonction de répartition est alors unefonction constante par intervalles et sa représentation graphique est enescalier. Les sauts d'une marche à l'autre de l'escalier se situent aux abscissessi, et l'amplitude du saut d'abscisses estps =FX(s) –FX(s–). En particulier la fonction de répartition d'une variable discrèteX estdiscontinue exactement aux pointss tels que Voir la sectionPropriétés de la fonction de répartition pour une démonstration.
Cas spécial : fonction de répartition continue purement singulière
L'escalier de CantorF est un exemple de fonction de répartition continue mais dont la dérivée est presque partout nulle. Ainsi, les formules précédentes ne sont plus vraies pour l'escalier de Cantor : par exemple pourx > 0, on n'a pascarF prend des valeurs strictement positives sur]0, +∞[, alors que l'intégrale constituant le membre de droite est identiquement nulle. En effet, l'ensembleest de mesure de Lebesgue nulle. Par ailleurs, la loi de probabilité associée à l'escalier de Cantor est continue (sansatome), puisqueF est une fonction continue sur. L'escalier de Cantor est en fait un exemple de fonction de répartition continue mais qui n'est pas absolument continue sur chaque intervalle : on dit alors qu'elle est continue purement singulière.
Le point 1 découle de la propriété de croissance des mesures de probabilitéCommeFX est unefonction monotone, le point 2 se réduit à montrer queou encore, de façon équivalente,Mais les boréliens]–∞ ,x +1/n[ forment une suite décroissante, etdonc le point 2 est une conséquence desaxiomes des probabilités.CommeFX est monotone, le point 3 se réduit à montrer queCeci est encore une conséquence desaxiomes des probabilités, puisqueLe point 4 découle, de la même manière, de
Réciproquement, toute fonction définie sur et satisfaisant ces quatre propriétés est la fonction de répartition d’une certaine variable aléatoire. Autrement dit, les points 1 à 4 sont caractéristiques de la fonction de répartition d'une variable aléatoire réelleX : étant donné une fonction réelle de la variable réelle, on noteF, satisfaisant les points 1 à 4, on peut construireconcrètement une variable aléatoire réelleX ayantF pour fonction de répartition, voir ci-dessous lethéorème de la réciproque. On note que la construction utilisant lethéorème de la réciproque sert concrètement à produire, sur ordinateur, des échantillons de taille arbitraire d'une loi de probabilité arbitraire, ce qui est l'ingrédient de base desméthodes de Monte-Carlo.
On peut ainsi définir la notion de fonction de répartition sans introduire celle de variable aléatoire : il suffit juste qu'elle vérifie les points 1 à 4 précédents. Si on ajoute à cela la notion defonction arithmétique, on arrive rapidement dans lathéorie probabiliste des nombres.
À cause des points 1, 3 et 4,FX est bornée, plus précisément
Comme toutefonction monotone bornée,FX admet en tout pointx une limite à gaucheFX(x–), limite à gauche égale ou non àFX(x) selon queFX est continue en x ou non.FX est une fonctioncàdlàg.
La connaissance de la fonction de répartition permet de calculer la probabilité de tout intervalle
et
Démonstration
est la définition d'une fonction de répartition.
on obtient par passage au complémentaire,
pour on utilise pourA = ]–∞,x] etB = ]–∞,y],
La relation est la plus délicate et fait intervenir une conséquence desaxiomes des probabilités sur la probabilité de l'union d'une suite croissante d'ensembles. On considère une suite(xn) de réelscroissante, convergeant versx. L'intervalle]-∞,x[ est alors union dénombrable de la suite croissante d'intervalles]-∞,xn]. La probabilité de l'intervalle]-∞,x[ est donc la limite des probabilités des intervalles]-∞,xn], i.e. la limite de la suiteFX(xn). Par propriété des fonctions croissantes, cette limite existe et vautFX(x–).
Les 5 dernières propriétés découlent de pour différents choix deA etB :
On appelleatome de la variable aléatoireX tout réela pour lequel. Ainsi, en vertu de la dernière propriété de la liste ci-dessus,
Propriété — Les atomes de la variable aléatoireX sont exactement les points de discontinuité de la fonction de répartition.
La fonction de répartition d'une variable aléatoireX est donccontinue si et seulement siX n'a aucun atome, i.e. si et seulement si
On dit alors que la loi deX estcontinue (ou encorediffuse) et, par extension, que la variable aléatoireX elle-même estcontinue. En particulier, les variables aléatoires réelles possédant une densité de probabilité sont continues. Il existe cependant des variables aléatoires continues mais ne possédant pas pour autant une densité de probabilité, c'est le cas, par exemple, de la variable aléatoire ayant pour fonction de répartition l'escalier de Cantor.
On peut noter que l'ensemble des points de discontinuité deFX est fini oudénombrable, comme c'est le cas pour toutefonction monotone bornée :
Conséquence — L'ensembleS des atomes de la variable aléatoireX est fini oudénombrable.
Caractérisation de la loi par la fonction de répartition
Ou de façon plus explicite : si deux variables aléatoires réelles ont même fonction de répartition, alors elles ont même loi (et réciproquement).
Démonstration
Sous l'hypothèseFX = FY, on peut démontrer de manière élémentaire que dès queA est un borélien "simple" (par exemple, siA est un intervalle). Par contre, la démonstration générale (pour tout borélienA) est un cas particulier dulemme d'unicité des probabilités, lui-même corollaire dulemme de classe monotone, appliqué à la classe
On vérifie 1. SoitI une partie finie de. Soity l'élément minimal deI. Alors
On vérifie 2. La tribu engendrée par est notée. Latribu borélienne est notée, comme souvent. On note
On a en vertu de la stabilité des tribus par passage au complémentaire, donc par définition d'unetribu engendrée. On peut interchanger et dans ce qui précède, donc, par double inclusion,
Comme est une partie de l'ensemble des ouverts, on en déduit que
Mais il nous faut surtout démontrer l'inclusion en sens inverse, et, pour cela, démontrer que tout ouvert de est dans (ainsi est une tribu contenant tous les ouverts de, alors que estla plus petite tribu contenant tous les ouverts de). Un argument rapide est de constater que
tout ouvert de est réunion dénombrable d'intervalles ouverts, et que
les intervalles ouverts sont dans.
Le premier point résulte de ce que
un ouvert est réunion disjointe de ses composantes connexes (cela est vrai pour toute partie de),
les parties connexes de (et en particulier les composantes connexes ci-dessus) sont exactement les intervalles de
comme est localement connexe, les composantes connexes d'un ouvert sont automatiquement ouvertes.
dans chaque composante connexeA de notre ouvert, on peut choisir un nombre rationnelqA. LesqA sont distincts car les composantes sont disjointes. AinsiA →qA est une bijection entre la famille des composantes connexes de et une partie de La famille des composantes connexes de est donc finie ou dénombrable.
Le deuxième point tient à ce que
comme on l'a vu plus haut ;
;
CQFD
En d'autres termes, si deux variables aléatoires réelles,X etY, vérifient
alors elles vérifient aussi que pour toutborélienA,
SoitF une fonction de dans satisfaisant les 4 propriétés caractéristiques. On noteG la fonction définie pourω ∈ ]0, 1[ parAlorsG est une variable aléatoire réelle définie sur l'espace probabilisé où et où désigne la restriction àde lamesure de Lebesgue sur. Le théorème stipule que :
Théorème — Sur l'espace, la fonction de répartition deG estF.
Ainsi toute fonctionF de dans satisfaisant les quatre propriétés caractéristiques est fonction de répartition d'unevariable aléatoire réelle (deG, par exemple), ou encore d'unemesure de probabilité sur (de la loi deG, par exemple).
Démonstration
Pourω ∈ Ω = ]0, 1[, on noteDoncG(ω) = infAω. À cause du point 4,, et à cause du point 3,Aω est bornée inférieurement, doncG est bien définie.
On commence par un cas simple à titre d'entrainement :
F est continue strictement croissante
SiF est continue strictement croissante sur, alorsF est une bijection de dans]0, 1[, etG est la réciproque deF (on peut s'en convaincre en traçantAω à l'aide du graphe deF). À ce titre,G est continue et strictement croissante sur]0, 1[, et en particulierG est mesurable (c'est donc une v.a.r.). On a, de plus,doncAinsi,
Cas général
Dans le cas général, on a également la relation d'adjonctionet on conclut donc exactement de la même manière que précédemment, mais la démonstration de l'équivalence ci-dessus est moins directe. Tout d'abord, pourω ≤ω',Aω' ⊂Aω, et doncG(ω) ≤G(ω'). Du fait queG est monotone, il résulte queG est mesurable.
On a, par définition deAω et deG(ω),La réciproque vient de ce que{G(ω) ∈Aω}, i.e.{ω ≤F(G(ω))}, ce qui, avec{G(ω) ≤x} entraîne, par croissance deF,{F(G(ω)) ≤F(x)}, et finalement{ω ≤F(x)}. On suppose en effet queG(ω) ∉Aω, et on considère une suite strictement décroissante(xn)n ≠ 0 d'éléments deAω telle quePar continuité à droite deF,mais également, par définition deAω,ce qui conduit àG(ω) ∈Aω, d'où une contradiction (démonstration largement reprise de Sidney Resnick,A Probability Path).
Remarques.
LorsqueF est unebijectionbicontinue d'un intervalleI dans]0, 1[ (i.e.F est continue strictement croissante),G est tout simplement laréciproque deF (i.e.G ∘F = IdI etF ∘G = Id]0, 1[). Pour cette raison,G est parfois appeléeréciproque généralisée deF.
Cette généralisation n'est en rien arbitraire. La condition clé, à savoir, fait l'objet de théories générales utiles dans de nombreux domaines des mathématiques, à savoir les connexions de Galois et plus généralement la notion d'adjonction enthéorie des catégories.
SiU désigne une variable aléatoire réelleuniforme sur[0, 1], alorsX =G(U) a pour fonction de répartitionF.
Ainsi dans toutlangage de programmation possédant ungénérateur de nombres aléatoires, on peut simuler une suite de longueur arbitraire de v.a.r. indépendantes de même fonction de répartitionF, pourvu queG soit connue : il suffit alors d'appeler ce générateur de manière répétée, et d'appliquer la fonctionG aux nombres produits par ces appels répétés.
comme il n'y a pas de formule suffisamment explicite pour la fonction de répartition, et encore moins de formule explicite pour la réciproque de cette dernière, le théorème est alors inopérant.
La loi normale peut cependant être simulée, par laméthode de Box-Muller, à l'aide de deux variables aléatoires indépendantes suivant chacune une loi uniforme : si de manière indépendante alors suit uneloi normale centrée réduite. L'établissement de ce résultat fait également appel au théorème de la réciproque.
On trouvera tout sur l'art d'engendrer des variables aléatoires de lois arbitraires, par exemple à l'aide de variablesuniformes, dansNon-Uniform Random Variate Generation, édité chez Springer, disponible sur le web[1].
La réciproque généralisée deF est un exemple de v.a.r. dont la fonction de répartition estF, mais c'est un exemple privilégié. Ses utilisations sont nombreuses, allant de propriétés de l'ordre stochastique, à des propriétés de ladistance de Wasserstein[2], en passant par le théorème de représentation deSkorokhod, voir section suivante.
On considère une suite de variables aléatoires(Xn)n ≥ 0 (resp. une variable aléatoireX) définies sur des espaces probabilisés (resp.) éventuellement différents, mais toutes à valeurs dans le même espace métrique(S,d). On dit que(Xn)n ≥ 0converge en loi versX si, pour toute fonction continue bornée de(S,d) dans,
On a le théorème suivant :
Théorème — Dans le cas de variables aléatoiresréelles (), on note(Fn)n ≥ 0,F les fonctions de répartitions de(Xn)n ≥ 0 et deX. Il y a alors équivalence entre les trois propositions ci-dessous :
On utilise la famille de fonctions continues bornées définies par le graphe ci-contre. Elles vérifient, pour toute variable aléatoire réelleY,
et en particulier
On remarque alors que, pour toutε > 0,
et
En faisant tendreε vers 0, on obtient
Ainsi, dès quex est un point de continuité deF,
2. implique 3.
On note(Gn)n ≥ 0,G, les réciproques généralisées de(Fn)n ≥ 0,F. Pour le triplet, on choisit, et on prend pour la tribu des boréliens et la mesure de Lebesgue correspondantes (i.e. restreintes à]0, 1[). Le choix deX'n =Gn,X' =G satisfait à 3.1. et à 3.2. en vertu duthéorème de la réciproque. De plus, en conséquence de 2.,(Gn)n ≥ 0 converge presque sûrement versG.