Der Titel dieses Artikels ist mehrdeutig. Weitere Bedeutungen sind unterMittelwert (Begriffsklärung) aufgeführt.
EinMittelwert (kurz auch nurMittel; anderes WortDurchschnitt) ist eine Zahl, die aus gegebenen Zahlen nach einer bestimmtenRechenvorschrift ermittelt wird. Gebräuchlich sind Rechenvorschriften für dasarithmetische, dasgeometrische und dasquadratische Mittel. Mit dem WortMittel oderDurchschnitt ist meistens das arithmetische Mittel gemeint.
In derStatistik ist der Mittelwert einer der Parameter, die den typischen Wert einer Verteilung charakterisieren bzw. die die zentraleTendenz einer Verteilung zum Ausdruck bringen (Lageparameter).
Eng verwandt ist der arithmetische Mittelwert mit demErwartungswert einer Verteilung. Während der Mittelwert aus konkreten vorliegenden Zahlenwerten ermittelt wird, beruht der Erwartungswert auf der theoretisch zu erwartenden Häufigkeit.
In der Mathematik treten Mittelwerte, insbesondere die drei klassischen Mittelwerte (arithmetisches, geometrisches undharmonisches Mittel), bereits in der Antike auf.Pappos von Alexandria kennzeichnet zehn verschiedene Mittelwerte von zwei Zahlen und () durch spezielle Werte des Streckenverhältnisses. Auch die Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel ist in der Antike bereits bekannt und geometrisch interpretiert. Im 19. und 20. Jahrhundert spielen Mittelwerte in der Analysis eine spezielle Rolle, dort im Wesentlichen im Zusammenhang mit berühmten Ungleichungen und wichtigen Funktionseigenschaften wie Konvexität (Hölder-Ungleichung,Minkowski-Ungleichung,Jensensche Ungleichung usw.). Dabei wurden die klassischen Mittelwerte in mehreren Schritten verallgemeinert, zunächst zu denPotenzmittelwerten (siehe AbschnittHölder-Mittel unten) und diese wiederum zu denquasi-arithmetischen Mittelwerten. Die klassische Ungleichung zwischen harmonischem, geometrischem und arithmetischem Mittel geht dabei über in allgemeinere Ungleichungen zwischen Potenzmittelwerten bzw. quasi-arithmetischen Mittelwerten.
Visualisierung des arithmetischen Mittels mit einer Wippe. Nachrechnung ohneDimension: Kugelgewicht gleich Abstände zum Drehpunkt gleich und ergibt
Den meistbenutzten Mittelwert, das arithmetische Mittel, kann man z. B. mithilfe gleich schwerer Kugeln auf einer Wippe visualisieren, die aufgrund derHebelgesetze durch ein Dreieck (Drehpunkt) ausbalanciert sind. Unter der Annahme, dass das Gewicht des Balkens vernachlässigt werden kann, entspricht die Position des Dreiecks, das die Balance herbeiführt, dem arithmetischen Mittel der Kugelpositionen.
Im Fall von Zahlen, die nicht auf Grund ihrer Summe, sondern ihres Produktes interpretiert werden, kann das geometrische Mittel berechnet werden. Dazu werden die Zahlen miteinander multipliziert und die-te Wurzel gezogen, wobei der Anzahl der zu mittelnden Zahlen entspricht.
Das harmonische Mittel findet Verwendung, wenn die Zahlen im Bezug auf eine Einheit definiert sind. Dazu wird die Anzahl der Werte durch die Summe derKehrwerte der Zahlen geteilt.
Beispiele für die Verwendung unterschiedlicher Mittelwerte
Im Folgenden soll beispielhaft an den sieben rechts angegebenen Einträgen in der Wertetabelle gezeigt werden, wo welche Definition des Mittelwerts sinnvoll ist.
Dasarithmetische Mittel wird beispielsweise zum Berechnen der Durchschnittsgeschwindigkeit genutzt, die Werte werden also als Geschwindigkeiten interpretiert: Läuft eine Schildkröte erst eine Stunde lang drei Meter pro Stunde, dann drei Stunden lang je zwei Meter und beschleunigt für jeweils eine Stunde nochmals auf drei, vier und fünf Meter pro Stunde, so ergibt sich als arithmetisches Mittel bei einer Strecke von 21 Metern in 7 Stunden:
Auch dasharmonische Mittel kann zur Berechnung einer durchschnittlichen Geschwindigkeit sinnvoll sein, wenn nicht über gleiche Zeiten, sondern über gleiche Strecken gemessen wird. In dem Fall geben die Werte der Tabelle die Zeiten an, in der eine einheitliche Strecke zurückgelegt wird: Die Schildkröte laufe den 1. Meter mit 3 Metern pro Stunde, weitere 3 m mit jeweils 2 m/h und beschleunigt auf den letzten 3 Metern nochmals auf jeweils 3, 4 und 5 m/h. Die Durchschnittsgeschwindigkeit ergibt sich bei einer Strecke von 7 Metern in Stunden:
Mit demgeometrischen Mittel errechnet man den mittleren Wachstumsfaktor. Die Wertetabelle wird also als die Angabe von Wachstumsfaktoren interpretiert. Eine Bakterienkultur wachse beispielsweise am ersten Tag auf das Fünffache, am zweiten auf das Vierfache, dann zweimal auf das Dreifache und die letzten drei Tage verdoppelt sie sich täglich. Der Bestand nach dem siebten Tag errechnet sich also durchAlternativ kann mit dem geometrischen Mittel der Endbestand ermittelt werden, denn
und somit ist
Ein tägliches Wachstum der Bakterienkultur um das 2,83-Fache hätte also nach sieben Tagen zum selben Ergebnis geführt.
Gemeinsame Definition der drei klassischen Mittelwerte
Die Idee, die den drei klassischen Mittelwerten zugrunde liegt, lässt sich auf folgende Weise allgemein formulieren:
Beimarithmetischen Mittel sucht man die Zahl, für die
gilt, wobei sich die Summe links über Summanden erstreckt. Das arithmetische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Summe“. Anschaulich bestimmt man mit dem arithmetischen Mittel aus Stäben verschiedener Länge einen mit einer durchschnittlichen oder mittleren Länge.
Beimgeometrischen Mittel sucht man die Zahl, für die
gilt, wobei sich das Produkt links über Faktoren erstreckt. Das geometrische Mittel mittelt also bzgl. der arithmetischen Verknüpfung „Produkt“.
Der generelle Unterschied zwischen einem Mittelwert und dem Erwartungswert ist, dass der Mittelwert auf einen konkreten Datensatz angewendet wird, während derErwartungswert Information über die Verteilung einerZufallsvariablen liefert. Von Bedeutung ist die Verbindung zwischen diesen beiden Parametern. Wenn der Datensatz, auf den das Mittel angewendet wird, eine Stichprobe der Verteilung der Zufallsvariablen ist, ist das arithmetische Mittel der erwartungstreue und konsistenteSchätzer des Erwartungswertes der Zufallsvariablen. Da der Erwartungswert dem erstenMoment einer Verteilung entspricht, wird der Mittelwert daher häufig genutzt, um aus empirischen Daten die Verteilung einzuschränken. Im Falle der häufig genutzten Normalverteilung, die durch die ersten beiden Momente vollkommen festgelegt ist, ist der Mittelwert daher von entscheidender Bedeutung.
Zusammenhang von arithmetischem, harmonischem und geometrischem Mittel
DieUngleichung vom arithmetischen und geometrischen Mittel vergleicht die Werte des arithmetischen und geometrischen Mittels zweier gegebener Zahlen: Es gilt für positive Variable stets
Die Ungleichung lässt sich auch auf weitere Mittelwerte ausdehnen, z. B. (für positive Variable)
Für zwei (positive) Variablen gibt es auch eine grafische Veranschaulichung:
Geometrischer Beweis der Ungleichung für Mittelwerte zweier Variablen, Visualisierung von arithmetischem, geometrischem und harmonischem Mittel nachPappos von Alexandria[2]
Vergleich von arithmetischem, geometrischem, harmonischem und weiteren Mittelwerten zweier positiver reeller Zahlen und in dimensionsloser Darstellung
Häufig wird ein Mittelwert genutzt, um einen zentralen Wert eines Datensatz zu beschreiben. Dabei gibt es weitere Parameter, die ebenfalls diese Funktion erfüllen: Median und Modus. Der Median beschreibt einen Wert, der den Datensatz in zwei Hälften teilt, während der Modus den Wert mit der höchsten Häufigkeit im Datensatz angibt. Im Vergleich zum Median ist der Mittelwert anfälliger fürAusreißer und daher wenigerrobust. Der Median wird allgemein mit der folgenden Rechenvorschrift ermittelt.[1]
Diegewichteten oder auchgewogenen Mittelwerte entstehen, wenn man den einzelnen Werten unterschiedliche Gewichte zuordnet, mit denen sie in das Gesamtmittel einfließen; zum Beispiel, wenn bei einer Prüfung mündliche und schriftliche Leistung unterschiedlich stark in die Gesamtnote einfließen.
Weitere Mittel, die Verwendung finden, sind dasquadratische Mittel und daskubische Mittel. Das quadratische Mittel wird mit der folgenden Rechenvorschrift berechnet:
Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert (für ist er wegen derDivision durch null nicht definiert).
Kann man davon ausgehen, dass die Daten durch „Ausreißer“, das heißt einige wenige zu hohe oder zu niedrige Werte, kontaminiert sind, so kann man die Daten entweder durch Stutzen oder durch „Winsorisieren“ (benannt nachCharles P. Winsor) bereinigen und den getrimmten (bzw. gestutzten) (engl.truncated mean) oder winsorisierten Mittelwert (engl.Winsorized mean) berechnen. In beiden Fällensortiert man die Beobachtungswerte zuerst nach aufsteigender Größe. Beim Trimmen schneidet man sodann eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Hingegen werden beim Winsorisieren die Ausreißer am Anfang und Ende der Folge durch den nächstgrößeren (bzw. -kleineren) Wert der restlichen Daten ersetzt.
Beispiel: Hat man 10 aufsteigend sortierte reelle Zahlen, so ist das 10-%-getrimmte Mittel gleich
Indes ist der 10-%-winsorisierte Mittelwert gleich
D. h., das getrimmte Mittel liegt zwischen dem arithmetischen Mittel (keine Stutzung) und dem Median (maximale Stutzung). Üblicherweise wird ein 20-%-getrimmtes Mittel verwendet, d. h., 40 % der Daten bleiben unberücksichtigt für die Mittelwertberechnung. Die Prozentzahl richtet sich im Wesentlichen nach der Zahl der vermuteten Ausreißer in den Daten; für Bedingungen für eine Trimmung von weniger als 20 % sei auf die Literatur verwiesen.[3][4]
Sei das kürzeste Intervall unter allen Intervallen mit, so ist dessen Mitte (middle of the shortest half). Bei unimodalensymmetrischen Verteilungen konvergiert dieser Wert gegen das arithmetische Mittel.[5]
DieBereichsmitte[7] (oder dasBereichsmittel) (englischMid-range) ist definiert als der arithmetische Mittelwert aus dem größten und dem kleinsten Beobachtungswert:
Gleitende Durchschnitte werden in der dynamischen Analyse vonMesswerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in derFinanzmathematik. Mit gleitenden Durchschnitten kann dasstochastischeRauschen aus zeitlich voranschreitendenSignalen herausgefiltert werden. Häufig handelt es sich dabei umFIR-Filter. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z. B.Kalman-Filter.
Gleitende Durchschnitte benötigen normalerweise eineunabhängige Variable, die die Größe der nachlaufendenStichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.
Gängige gleitende Durchschnitte sind:
arithmetische gleitende Durchschnitte (Simple Moving Average – SMA),
doppelt exponentiell gleitende Durchschnitte (Double EMA – DEMA),
dreifach,-fach exponentiell gleitende Durchschnitte (Triple EMA – TEMA),
linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung),
quadratisch gewichtete gleitende Durchschnitte und
weitere Gewichtungen: Sinus, Triangular, …
In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andererVolatilität/Streuung etc.) anpassen:
Mittelwerte lassen sich kombinieren; so entsteht etwa dasarithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.
Man beachte, dass sowohl Notation als auch Bezeichnung uneinheitlich sind.
Für ergeben sich daraus etwa das harmonische, das geometrische, das arithmetische, das quadratische und das kubische Mittel. Für ergibt sich das Minimum, für das Maximum der Zahlen.
Außerdem gilt bei festen Zahlen: Je größer ist, desto größer ist; daraus folgt dann die verallgemeinerte Ungleichung der Mittelwerte
Peter S. Bullen:Handbook of Means and Their Inequalities. Kluwer Acad. Pub., 2003,ISBN 1-4020-1522-4 (umfassende Diskussion von Mittelwerten und den mit ihnen verbundenen Ungleichungen).
Horst Hischer:4000 Jahre Mittelwertbildung. Eine fundamentale Idee der Mathematik und didaktische Implikationen. In:mathematica didactica. 25(2), 2002.
↑abF. Ferschl:Deskriptive Statistik. 3. Auflage. Physica-Verlag Würzburg,ISBN 3-7908-0336-7. S. 48–74.
↑Horst Hischer: Viertausend Jahre Mittelwertbildung. Babylonische Ungleichungskette. Universität des Saarlandes, 2003, S. 12, abgerufen am 26. Mai 2022.
↑R. K. Kowalchuk, H. J. Keselman, R. R. Wilcox, J. Algina:Multiple comparison procedures, trimmed means and transformed statistics. In:Journal of Modern Applied Statistical Methods.Band5, 2006,S.44–65,doi:10.22237/jmasm/1146456300.
↑R. R. Wilcox, H. J. Keselman:Power analysis when comparing trimmed means. In:Journal of Modern Applied Statistical Methods.Band1, 2001,S.24–31,doi:10.22237/jmasm/1020254820.
↑J. L. Gastwirth, M. L. Cohen:Small sample behavior of some robust linear estimators of location, J Amer Statist Assoc 65:946–973, 1970,doi:10.1080/01621459.1970.10481137,JSTOR:2284600.