Dielogarithmische Normalverteilung (kurzLog-Normalverteilung) ist eine kontinuierlicheWahrscheinlichkeitsverteilung für eine Variable, die nur positive Werte annehmen kann. Sie beschreibt die Verteilung einerZufallsvariablen, wenn die mit dem Logarithmus transformierte Zufallsvariablenormalverteilt ist.Sie bewährt sich als Modell für viele Messgrößen in Naturwissenschaften, Medizin und Technik, beispielsweise für Energien, Konzentrationen, Längen und Mengenangaben.
In Analogie zu einer normalverteilten Zufallsvariablen, die nach demzentralen Grenzwertsatz alsSumme vieler verschiedener Zufallsvariablen aufgefasst werden kann, entsteht eine logarithmisch normalverteilte Zufallsvariable durch dasProdukt vieler positiver Zufallsvariablen. Somit ist die Log-Normalverteilung die einfachste Verteilungsart für multiplikativeZufallsprozesse. Da multiplikative Gesetze in den Naturwissenschaften, der Ökonomie und der Technik eine größere Rolle spielen als additive, ist die Log-Normalverteilung in vielen Anwendungen diejenige, die der Theorie am besten entspricht – der zweite Grund, weshalb sie vielfach anstelle der gewöhnlichen, additiven Normalverteilung verwendet werden sollte.
Wenn eine standardnormalverteilte Zufallsvariable ist, dann ist log-normalverteilt mit den Parametern und, geschrieben als. Alternativ können als Parameter die Größen und verwendet werden. ist ein Skalen-Parameter. oder ebenso bestimmt die Form der Verteilung.
Wenn log-normalverteilt ist, dann ist auch log-normalverteilt, und zwar mit den Parametern und respektive und. Ebenso ist log-normalverteilt, mit den Parametern und respektive und.
Eine stetige, positiveZufallsvariable unterliegt einer logarithmischen Normalverteilung mit den Parametern und, wenn die transformierte Zufallsvariable einerNormalverteilung folgt. Ihre Dichtefunktion ist dann
,
wobei die Dichtefunktion der Standardnormalverteilung bezeichnet.
Seieinmehrdimensional (oder multivariat) normalverteilterZufallsvektor.Dann ist (d. h.) multivariat log-normalverteilt.Die mehrdimensionale Log-Normalverteilung ist viel weniger bedeutsam als die eindimensionale. Deshalb bezieht sich der nachfolgende Text fast ausschließlich auf den eindimensionalen Fall.
Ist das p-Quantil einerStandardnormalverteilung (d. h., wobei die Verteilungsfunktion der Standardnormalverteilung sei), so ist das p-Quantil der Log-Normalverteilung gegeben durch
DerMedian der logarithmischen Normalverteilung beträgt demnach. Er wird auchmultiplikativer odergeometrischer Erwartungswert genannt (vgl.geometrisches Mittel). Er ist ein Skalen-Parameter, da gilt.
In Analogie zum multiplikativen Erwartungswert ist diemultiplikative odergeometrische Standardabweichung. Sie bestimmt (ebenso wie selbst) die Form der Verteilung. Es gilt.
Da das multiplikative oder geometrische Mittel einer Stichprobe von lognormalen Beobachtungen (siehe „Parameterschätzung“ unten) selbst log-normalverteilt ist, kann man seine Standardabweichung angeben, sie beträgt.
DerModus, also der häufigste Wert der Verteilung bzw. der Wert, für den die Dichtefunktion ihr Maximum annimmt, beträgt für die logarithmische Normalverteilung
Je größer die Differenz zwischen Erwartungswert und Median, desto ausgeprägter ist i. a. dieSchiefe einer Verteilung. Hier unterscheiden sich diese Parameter um den Faktor. Die Wahrscheinlichkeit für extrem große Ausprägungen ist also bei der Log-Normalverteilung mit großem hoch.
Die Lognormalverteilung ist ein Beispiel einer Wahrscheinlichkeitsverteilung, die durch die Angabe aller Momente nicht charakterisiert ist, da es andere Wahrscheinlichkeitsverteilungen mit denselben Momenten gibt.[1]
Multipliziert man zwei unabhängige, log-normalverteilte Zufallsvariable und, so ergibt sich wieder eine log-normalverteilte Zufallsvariable mit den Parametern und, wobei. Entsprechendes gilt für das Produkt von solchen Variablen.
Das geometrische Mittel von unabhängigen, gleich verteilten, positiven Zufallsvariablen zeigt für genähert eine Log-Normalverteilung, die immer mehr einer gewöhnlichen Normalverteilung gleicht, da abnimmt.
Erwartungswert und Kovarianzmatrix einer mehrdimensionalen Log-Normalverteilung
Der Logarithmus einer logarithmisch normalverteilten Zufallsvariablen ist normalverteilt. Genauer: Ist eine-verteilte reelle Zufallsvariable (d. h. normalverteilt mit Erwartungswert und Varianz), so ist die Zufallsvariable log-normalverteilt mit diesen Parametern und.
Wenn und damit geht, geht die Form der Log-Normalverteilung gegen diejenige einer gewöhnlichen Normalverteilung.
Die Schätzung der Parameter aus einer Stichprobe von Beobachtungen erfolgt über die Bestimmung von Mittelwert und (quadrierter) Standardabweichung der logarithmierten Werte:
.
Die Schätzung der multiplikativen Parameter erfolgt durch und. ist dasgeometrische Mittel. Seine Verteilung ist log-normal mit multiplikativem Erwartungswert und geschätzter multiplikativer Standardabweichung (besser als multiplikativerStandardfehler bezeichnet).
Wenn keine Einzelwerte vorliegen, sondern nur der Mittelwert und die empirische Varianz der nicht logarithmierten Werte bekannt sind, erhält man passende Parameterwerte über
Allgemein erfolgt die statistische Analyse von log-normalverteilten Größen am einfachsten und Erfolg versprechendsten so, dass die Größen logarithmiert werden und auf diese transformierten Werte die Methoden verwendet werden, die auf der gewöhnlichen Normalverteilung beruhen. Im Bedarfsfall werden dann die Ergebnisse, beispielsweise Vertrauens- oder Vorhersage-Intervalle, in die ursprüngliche Skala zurücktransformiert.
Grundlegendes Beispiel dafür ist die Berechnung von Streuungs-Intervallen. Da für eine gewöhnliche Normalverteilung in einem Bereich von etwa 2/3 (genauer 68 %) und in 95 % der Wahrscheinlichkeit enthalten sind, gilt für die Log-Normalverteilung:
Das Intervall enthält 2/3
und das Intervall enthält 95 %
der Wahrscheinlichkeit (und also etwa diese Prozentzahl der Beobachtungen einer Stichprobe).Die Intervalle können in Analogie zu als und notiert werden.
Variation in vielen natürlichen Phänomenen lässt sich gut mit derLog-Normalverteilung beschreiben. Dies kann erklärt werden durch dieVorstellung, dass kleine prozentuale Abweichungen zusammenwirken,die einzelnen Effekte sich also multiplizieren.Bei Wachstumsprozessen ist dies besonders naheliegend.Zudem bestehen die Formeln für die meisten grundlegenden Naturgesetze ausMultiplikationen und Divisionen.Auf der logarithmischen Skala ergeben sich dann Additionen undSubtraktionen, und der entsprechendeZentrale Grenzwertsatz führt zurNormalverteilung – zurücktransformiert auf die ursprüngliche Skala alsozur Log-Normalverteilung.Diese multiplikative Version des Grenzwertsatzes ist auch alsGesetz von Gibrat bekannt. Robert Gibrat (1904–1980) formulierte es fürUnternehmen.[5]
In einigen Wissenschaften ist es üblich, Messgrößen in Einheiten anzugeben,die durch Logarithmieren einer gemessenen Konzentration (Chemie) oderEnergie (Physik, Technologie) erhalten werden.So wird der Säuregrad einer wässerigen Lösung durch denpH-Wert gemessen, der als negativer Logarithmus der Wasserstoffionen-Aktivität definiert ist.Eine Lautstärke wird inDezibel (dB) angegeben, das, wobeidas Verhältnis desSchalldruckpegels zu einem entsprechenden Referenzwert ist.Analoges gilt für andere Energie-Pegel.In der Finanzmathematik wird ebenfalls oft direkt mit logarithmierten Größen (Preisen, Kursen, Erträgen) gerechnet, siehe unten.
Für solche „bereits logarithmierte“ Größen ist dann die gewöhnlicheNormalverteilung oft eine gute Wahl; also wäre hier, wenn man dieursprünglich gemessene Größe betrachten wollte, die Log-Normalverteilung geeignet.
Generell eignet sich die Log-Normalverteilung für Messgrößen, die nur positive Werte annehmen können,also Konzentrationen, Massen und Gewichte, räumliche Größen, Energien usw.
Die folgende Liste zeigt mit Beispielen die breite Palette der Anwendungen der Log-Normalverteilung.
Hydrologie: Die Log-Normalverteilung nützt bei der Analyse von Extremwerten wie – beispielsweise – monatliche oder jährliche Maxima der täglichen Regenmenge oder des Abflusses von Gewässern.[7]
Ökologie: Die Häufigkeit von Arten zeigt oft eine Log-Normalverteilung.[8]
Maße der Größe von Lebewesen (Länge, Hautfläche, Gewicht);[9]
Physiologische Größen wie der Blutdruck von Männern und Frauen.[10] Als Konsequenz solltenReferenzbereiche für gesunde Werte auf der Grundlage einer Log-Normalverteilung geschätzt werden.
In der Neurologie zeigt die Verteilung der Impulsrate von Nervenzellen oft eine log-normale Form, so im Cortex und Striatum[12] und im Hippocampus und im entorhinalen Cortex[13] sowie in anderen Hirnregionen.[14][15] Ebenso für weitere neurobiologische Größen.[16]
In derFinanzmathematik werden logarithmierte Erträge, Preise etc. als normalverteilt modelliert, was bedeutet, dass die ursprünglichen Größen log-normalverteilt sind. Das gilt auch für das berühmteBlack-Scholes-Modell,[22] das der Preisbildung vonOptionen undDerivaten zugrunde liegt. Allerdings mag bei genauer Analyse dieLévy-Verteilung für die extrem großen Werte besser passen,[23] vor allem beiBörsenstürzen.
In der Modellierung derZuverlässigkeit werden Reparaturzeiten als log-normalverteilt beschrieben.[27]
Internet: DieDateigröße von öffentlich verfügbaren Audio- und Video-Dateien ist genähert log-normalverteilt.[28] Analoges gilt für den Datenverkehr.[29]
Lognormal Distributions, Theory and Applications (= Statistics: Textbooks and Monographs.Band88). Marcel Dekker, Inc., 1988,ISBN 978-0-8247-7803-3,S.xvi+387.
j Aitchison, J A C Brown:The Lognormal Distribution. Cambridge University Press, 1957.
↑Eckhard Limpert, Werner A Stahel:Problems with Using the Normal Distribution – and Ways to Improve Quality and Efficiency of Data Analysis. In:PlosOne.Band51,Nr.5, 2011,S.341–352,doi:10.1641/0006-3568(2001)051[0341:LNDATS]2.0.CO;2.
↑John Sutton:Gibrat's Legacy. In:Journal of Economic Literature.Band32,Nr.1, 1997,S.40–59.
↑L H Ahrens:The log-normal distribution of the elements (A fundamental law of geochemistry and its subsidiary) journal.Band5, 1954,S.49–73.
↑R.J. Oosterbaan:Drainage Principles and Applications, Publication 16. International Institute for Land Reclamation and Improvement (ILRI), Wageningen, The Netherlands 1994,ISBN 978-90-70754-33-4, 6: Frequency and Regression Analysis,S.175–224 (Online [PDF]).
↑G Sugihara:Minimal community structure: An explanation of species abundance patterns. In:American Naturalist.Band116, 1980,S.770–786,JSTOR:2460407.
↑Robert W. Makuch, D H Freeman, M F Johnson:Justification for the lognormal distribution as a model for blood pressure. In:Journal of Chronic Diseases.Band32,Nr.3, 1979,S.245–250,doi:10.1016/0021-9681(79)90070-5.
↑P E Sartwell:The incubation period and the dynamics of infectious disease. In:American Journal of Epidemiology.Band83, 1966,S.204–216.
↑Gabriele Scheler, Johann Schumann:Diversity and stability in neuronal output rates. 36th Society for Neuroscience Meeting, Atlanta. 8. Oktober 2006 (englisch).
↑R A Romero, T B Sutton:Sensitivity of Mycosphaerella fijiensis, causal agent of black sigatoka of banana, to propiconozole. In:Phytopathology.Band87, 1997,S.96–100.
↑S S Hirano, E V Nordheim, D C Arny, C D Upper:Log-normal distribution of epiphytic bacterial populations on leaf surfaces. In:Applied and Environmental Microbiology.Band44, 1982,S.695–700.
↑P Baur:Log-normal distribution of water permeability and organic solute mobility in plant cuticles. In:Plant, Cell and Environment.Band20, 1997,S.167–177.
↑Sobkowicz Pawel et al.:Lognormal distributions of user post lengths in Internet discussions - a consequence of the Weber-Fechner law? In:EPJ Data Science. 2013.
↑Peifeng Yin, Ping Luo, Wang-Chien Luo, Min Wang:Silence is also evidence: interpreting dwell time for recommendation from psychological perspective. ACM International Conference on KDD. 2013 (englisch,mldm.ict.ac.cn (Memento desOriginals vom 10. Mai 2017 imInternet Archive) [abgerufen am 26. August 2019]).