Construction de différentes moyennes de deux nombres réels positifs dans untrapèze.Construction de différentes moyennes de deux nombres réels positifs sur un demi-cercle[1].
Enmathématiques, lamoyenne est un outil de calcul permettant de résumer une liste de valeursnumériques en un seulnombre réel (oucomplexe), indépendamment de l’ordre dans lequel la liste est donnée. À défaut de précision supplémentaire, le terme désigne lamoyenne arithmétique, qui se calcule comme lasomme des termes de la liste divisée par son nombre de termes[2]. D’autres moyennes peuvent être plus adaptées selon le contexte. Dans tous les cas, la moyenne est intermédiaire entre les valeurs extrêmes de la liste.
La moyenne est un des premiersindicateurs statistiques pour une liste de nombres (unesérie statistique). Elle est couramment utilisés pour estimer un niveau global, par exemple celui d’une classe, à partir des notes obtenues par les élèves à un examen.
Lorsqu'une certaine quantité est globalement distribuée à une population, la moyenne des quantités reçues individuellement exprime la quantité que chacun aurait reçue avec une répartition à parts égales.
La notion de moyenne est historiquement reliée à celle de valeur intermédiaire, appelée aussimédiété[3]. Étant donnés deux nombresa etb, comment choisir une valeurc pour quea soit àc ce quec est àb ? La réponse diffère selon l’opération choisie pour aller d’un nombre à l’autre.
Par exemple, pour aller de 2 à 18, on peut ajouter deux fois 8, avec une étape en 10, ou multiplier deux fois par 3, avec une étape en 6. Le premier cas décrit unemoyenne arithmétique (10), qui s’obtient par la fraction. Le second cas est unemoyenne géométrique (6) qui s’obtient avec laracine carrée.
Lesidentités remarquables usuelles permettent de montrer rapidement que la moyenne géométrique de deux nombres positifs est toujours inférieure à leur moyenne arithmétique.
Une démonstration de l’inégalité arithmético-géométrique sur deux valeurs
Une autre manière de définir ces moyennes est de cumuler les nombres choisis puis de chercher comment on peut obtenir le même résultat en cumulant plusieurs fois la même valeur. Tout dépend alors de la procédure de cumul. Avec une addition, on trouve 2+18=20, qu’on aurait pu obtenir en posant 10+10=20. Avec une multiplication, on trouve 2×18=36, qu’on aurait pu obtenir avec 6×6=36.
Cette approche permet d’introduire naturellement la notion demoyenne pondérée. Par exemple, on peut souhaiter que la moyenne soit trois fois plus proche de la première valeur que de la deuxième. Entre 7 et 19, le nombre 10 est bien trois fois plus proche de 7 (avec un écart de 3) que de 19 (avec un écart de 9). On dit alors que 10 est la moyenne pondérée des nombres 7 et 19 avec les coefficients 3 et 1. On le trouve en calculant la somme pondérée que l’on divise par la somme des coefficients.
Dans le cas où on cherche à évaluer une moyenne de plusieurs points, il vient naturellement de s'intéresser aux distances. La moyenne d'unn-uplet de points(x1, ... ,xn) dans un ensemble de réelsX devient alors la valeur qui minimise[4],[5]
pour une distanced définie surX.
Le problème est que cette valeur minimale peut être atteinte en plusieurs points, voire ne pas être atteinte du tout.
Plusieurs moyennes sont induites par un problème de distance minimale :
ne donnera pas une valeur moyenne dun-uplet mais sonmode, et la distance usuelled(x,y) = |x – y| renvoie lamédiane.
Pour d'autres moyennes, comme lamoyenne logarithmique, le problème reste ouvert car aucune distance associée n'a été déterminée.
On peut aussi évoquer lamoyenne de Fréchet dans le cas où la fonctionnelle à minimiser est la variance de Fréchet[6] :
On parlera de moyenne de Karcher quand le minimum n'est pas atteint en un unique point, et de moyenne de Fréchet quand ce minimum est en un unique point.
Hardy,Littlewood etPólya, dans leur ouvrageInequalities définissent la moyenne d'un ensemble discret de nombres(x1, ...,xn) à partir d'une fonctionφ telle que, avec,φ est continue et strictement monotone sur [m ,M], et pour un ensemble de poids(ω1, ..., ωn) strictement positifs et de somme égale à 1, la moyenne de(x1, ...,xn) est la valeurx telle que[9]:
Pour toute liste(x1, ...,xn) de réels, on définit sa moyenne arithmétique par la formule, qui ne dépend pas de l’ordre des termes et est toujours comprise entre les valeurs minimale et maximale de la liste.
Cette moyenne estlinéaire, c’est-à-dire que l’addition ou la multiplication par une constante sur les valeurs de la liste se traduit par la même opération sur la moyenne.
Pour calculer une moyenne sur une liste dans laquelle beaucoup de valeurs sont répétées, on peut noter(x1, ...,xk) la liste desvaleurs (sans répétition) et(n1, ...,nk) la liste deseffectifs (le nombre de fois qu’apparait chaque valeur dans la liste initiale). La moyenne s’écrit alors.
On retrouve la notion demoyenne pondérée, dans laquelle les facteursni ne représentent pas nécessairement des effectifs, mais des coefficients appeléspoids, par exemple pour calculer la moyenne de notes sur unbulletin scolaire dans lequel on souhaite accorder plus d’importance à certaines disciplines ou à certains devoirs, en leur attribuant un coefficient plus grand que les autres.
La moyenne arithmétique est aussi cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
Étant donnée une liste(x1, ...,xn) de réels positifs (voire strictement positifs pour la moyenne harmonique), avec éventuellement une liste(m1, ...,mn) de poids associés, positifs et non tous nuls, on définit les moyennes usuelles suivantes.
Ces moyennes reprennent certaines propriétés de la moyenne arithmétique :
la moyenne ne dépend pas de l’ordre des termes ;
la moyenne est toujours comprise entre la valeur minimale et la valeur maximale de la liste ;
la moyenne esthomogène, c’est-à-dire que si toutes les valeurs de la liste sont multipliées par un même facteur, la moyenne est multipliée par ce même facteur ;
la moyenne est cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
Toutes ces moyennes s’obtiennent sous la forme ou commelimite d’expressions sous cette forme, et entrent dans la définition de lamoyenne d'ordrep.Plus précisément, on retrouve :
pourp = 1, la moyenne arithmétique ;
pourp = 2, la moyenne quadratique ;
pourp = –1, la moyenne harmonique ;
lorsquep → 0, la limite dexp est la moyenne géométrique ;
lorsquep → +∞, la limite dexp est le maximum de la liste;
lorsquep → –∞, la limite dexp est le minimum de la liste.
À partir de deux nombresa etb, la moyenne arithmétique et la moyenne géométrique fournissant deux nouveaux nombres, et l’on peutitérer le processus pour obtenir deuxsuites adjacentes quiconvergent vers un réel intermédiaire (parfois notéM(a,b)) appelémoyenne arithmético-géométrique et qui est relié à lalongueur d’uneellipse.
Cette définition n’est cependant pas cumulative, et ne s’étend donc pas à plus de deux valeurs.
Étant donnée une liste(a1, … ,an) de réels et une liste(x1, … ,xn) de réels strictement positifs, laa-moyenne dex est égale à la moyenne arithmétique des monômes de la formex1aσ(1) × ⋯ ×xnaσ(n) lorsqueσ décrit l’ensemble des permutations de⟦1,n⟧.
Cette moyenne est homogène lorsque la somme des exposantsai est égale à 1, et appelée dans ce casmoyenne de Muirhead.
Dans le cas particuliern = 2, cette moyenne est appeléemoyenne de Heinz.
Pour deux nombres réelsa etb, Eves et Chen ont remarqué qu'on pouvait définir plusieurs moyennes par une fonction définie comme le rapport de deux intégrales similaires[16]. Plus précisément, pour une fonctionf positive, continue, strictement croissante sur ]0;1] et telle que, alors
est bien une moyenne. De plus, en posant, pour une fonctionφ positive, continue, strictement croissante sur ]0;1], alors :
permet de définir une moyenne sur le modèle précédent.
Par exemple,φ(x) :=φt(x) =xt, on peut retrouver plusieurs moyennes définies plus haut :
le cast = –3 donne la moyenne harmonique ;
le cast = –3/2 donne la moyenne géométrique;
le cast = –1 donne la moyenne logarithmique ;
le cast = –1/2 donne la moyenne de Héron ;
le cast = 0 donne la moyenne arithmétique;
le cast = 1 donne lacentroid mean.
De plus, la monotonie def permet de retrouver les résultats d'inégalité entre les différentes moyennes.
La moyenne est beaucoup utilisée enévaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple
en France, en Tunisie,Algérie et auMaroc : de 0 à 10 ou de 0 à 20 (0 étant la plus mauvaise note, 10 ou 20 la meilleure) ;
enSuisse : de 1 à 6 (1 étant la plus mauvaise note, 6 la meilleure) ;
enAllemagne : de 6 à 1 (6 étant la plus mauvaise note, 1 la meilleure) ;
au Canada : de 0 à 100 (0 étant la plus mauvaise note, 100 la meilleure) ;
auDanemark : de -3 à 12 (-3 étant la plus mauvaise note, 12 la meilleure).
On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :
la moyenne de la classe est censée représenter un « niveau global », si tant est que cela ait un sens ;
dans le cas d'un examen de grande ampleur, comme lebaccalauréat en France, où de nombreux élèves passent la même épreuve mais sont corrigés par différents professeurs, la différence des moyennes entre les groupes peut indiquer une différence de correction selon le professeur (certains étant plus sévères, d'autres plus tolérants), et l'on peut par exemple effectuer une correction de notes, une « mise en adéquation », afin que les groupes aient tous la même moyenne ; par exemple, sim1,m2… sont les moyennes des groupes etM la moyenne globale, alors les notes du groupei seront multipliées parM/mi ;
dans le cas d'un élève : la moyenne des notes sur une matière permet de niveler les résultats ; ainsi, si les résultats sont fluctuants, les faiblesses d'un moment sont rattrapées par les réussites d'un autre moment ;
la moyenne des notes d'un élève dans plusieurs matières est une autre manière de niveler les résultats, non plus dans le temps mais selon la matière : les points forts rattrapent les points faibles ; la moyenne est alors un critère de sélection, sachant que ce que l'on demande d'un élève, ce n'est pas qu'il soit bon partout, mais qu'il ait des qualités permettant de rattraper ses défauts ; lorsque certaines matières sont plus importantes que d'autres, on applique des coefficients de pondération (cf.infra).
Dans ces exemples, la moyenne est unlissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voirÉvaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours.
La moyenne est la valeur unique que devraient avoir tous lesindividus d'une population (ou d'unéchantillon) pour que leurtotal soit inchangé. C'est uncritère de position.
Dans la plupart des cas, letotal formé par les individus d'unepopulation est lasomme de leurs valeurs. La moyenne est alors lamoyenne arithmétique. Mais si letotal représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique.
Si, par exemple, letotal d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leurmoyenne géométrique.
Lebarycentre d’un ensemble fini de points du plan ou de l’espace affine (éventuellement munis depoids positifs ou négatifs) est défini par une relation vectorielle et correspond essentiellement à la notion physique decentre de masse.
Lescoordonnées cartésiennes de ce barycentre dans unrepère sont alors données par la moyenne arithmétique pondérée des coordonnées des différents points.
Lelemme de Cesàro assure que pour toutesuiteuconvergente, la suite des moyennes partielles converge également vers la même limite.
Ce résultat permet d’étendre la notion de limite à des suites divergentes mais pour lesquelles la suite des moyennes partielles converge, comme la suite((−1)n)n⩾0, dont les moyennes partielles tendent vers 0, ou lasérie associée, appeléesérie de Grandi, à laquelle on attribue alors la limite1/2.
Ce procédé est utilisé par exemple dans la définition desomme de Fejér.
Lamoyenne glissante est une notion statistique, où la moyenne, au lieu d'être calculée sur lesN valeurs fixes d'une liste, est calculée sur les sous-ensembles den valeurs consécutives de la liste (n<N). On remarquera que pour ce calcul, l'ordre d'apparition des termes dans la liste est essentiel. Cette notion permet par exemple d'exprimer une tendance dans le temps en observant l'évolution le la moyenne (« glissante ») calculée sur quelques mesures successives, dans une liste de mesures.
Ce type de calcul est aussi utilisé eninformatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de périoden :
(une moyenne glissante de période 0 ne prend qu'un terme)
Unemoyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble « central » des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux.
Les statistiques tronquées, en anglaistrimmed estimators(en), ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle larobustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition « collective » de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique.
Pour toute fonctionfcontinue sur unsegment[a,b] non dégénéré (i. e.b >a) ou plus généralementintégrable sur]a,b[, lavaleur moyenne def sur[a,b] est le réel défini par :
Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition ensérie de Fourier d'une fonction périodique : c'est la composante constante. Entraitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset).
On peut aussi, par analogie avec lesmoyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonctionpoids
(w pour l'initiale deweight, « poids » en anglais) :
.
Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (i. e. aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille despolynômes de Tchebychev :
où la fonctionTn×Tp est continue sur le fermé [0,1] et où lafonction poids est
est intégrable sur [0;1[, et dont l'intégrale vaut.
Note : lorsque la fonction estpériodique de périodeT, elle a la même valeur moyenne sur toute période [a,a +T]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2.