In derStochastik ist eineZufallsvariable eine Größe, deren Wert vom Zufall abhängig ist.[1] Formal ist eine Zufallsvariable eineFunktion, die jedemmöglichen Ergebnis einesZufallsexperiments eine Größe zuordnet.[2] Ist diese Größe einereelle Zahl, so spricht man von einerreellen Zufallsvariablen oderZufallsgröße.[3] Beispiele für reelle Zufallsvariablen sind die Augensumme von zwei geworfenen Würfeln und die Gewinnhöhe in einemGlücksspiel. Zufallsvariablen können aber auch komplexeremathematische Objekte sein, wieZufallsfelder,Zufallsbewegungen,Zufallspermutationen oderZufallsgraphen. Über verschiedene Zuordnungsvorschriften können einem Zufallsexperiment auch verschiedene Zufallsvariablen zugeordnet werden.[2]
Heutzutage istZufallsvariable die gängigste Bezeichnung; in älterer Literatur finden sich aber auchzufällige Variable[3],zufällige Größe[2],zufällige Veränderliche[3],zufälliges Element[3],Zufallselement[5] undZufallsveränderliche[6][7]
WährendA. N. Kolmogorow zunächst vondurch den Zufall bestimmten Größen sprach[8][9], führte er 1933 den Begriffzufällige Größe ein[10] und sprach später vonZufallsgrößen.[11] Im Jahr 1933 ist auch schon der BegriffZufallsvariable in Gebrauch.[12] Bereits 1935 ist der Begriffzufällige Variable nachweisbar.[13] Später hat sich (ausgehend vom englischenrandom variable, das sich gegenchance variable undstochastic Variable durchsetzte[14]) der etwas irreführende Begriff[15]Zufallsvariable durchgesetzt.
Die Grundidee hinter der Zufallsvariable ist es, den Zufall mit Hilfe des Begriffes derFunktion zu modellieren. Dies wird einige Vorteile mit sich bringen. Angenommen, wir betrachten ein Zufallsexperiment, welches nur zwei Ausgänge hat, welche wir mit und notieren. Mit Hilfe der Funktion können wir nun eine„zufällige Variable“ definieren, die berücksichtigt, ob oder eingetroffen ist.
Ein Beispiel einer Zufallsvariable. Die Menge steht für eine beliebige Menge, welche die Zahlen enthält.
Dies geschieht durch die Funktion
wobei die Werte und vom Experiment abhängen, welches man modelliert. Man nennt
Wir notieren die Menge der Realisierungen mit. In den meisten Fällen wählt man für entweder die reellen Zahlen oder eine diskrete Menge wie zum Beispiel oder. Allgemeiner kann aber auch, einBanach-Raum oder eintopologischer Vektorraum sein.
Eine Zufallsvariable ist somit eine Abbildung der Form.
Beispiel (Münzwurf): Wir möchten einen Münzwurf modellieren. Seien und das zufällige Ergebnis des Münzwurfs und. Nun können wir verschiedene Zufallsvariablen bilden, zum Beispiel eine Wette, bei der 1 EUR ausgezahlt wird, wenn Zahl erscheint und sonst nichts. Dann ist die Auszahlungssumme die Zufallsvariable
Wir haben also und gewählt, hätten wir hingegen bei falscher Wette 1 EUR bezahlen müssen, dann hätten wir uns für entschieden.
Beispiel (Würfelwurf): Wir möchten einen Würfelwurf modellieren. Seien, dann ist und der Würfel die Zufallsvariable
Beispiel (2-facher Münzwurf): Wir möchten den 2-fachen Münzwurf modellieren. Die Ergebnismenge ist, ihre Elemente haben die Form. Wettet man bei zwei Münzwürfen beide Male auf Zahl, so lassen sich beispielsweise folgende Zufallsvariablen untersuchen:
als Auszahlung nach der ersten Wette,
als Auszahlung nach der zweiten Wette,
als Summe der beiden Auszahlungen.
Zufallsvariablen werden üblicherweise mit einem Großbuchstaben bezeichnet (hier), während man für die Realisierungen die entsprechenden Kleinbuchstaben verwendet (zum Beispiel,,,).
Im Münzwurf-Beispiel hat die Menge eine konkrete Interpretation. In der weiteren Entwicklung der Wahrscheinlichkeitstheorie ist es oft zweckmäßig, die Elemente von als abstrakte Repräsentanten des Zufalls zu betrachten, ohne ihnen eine konkrete Bedeutung zuzuweisen, und dann sämtliche zu modellierende Zufallsvorgänge als Zufallsvariable zu erfassen.
Häufig verzichtet man auf die Schreibweise und benutzt stattdessen die Kurzschreibweise. Dies sollte aber nicht falsch verstanden werden, denn es handelt sich hier nur um eine Abkürzung für respektive für die Menge aller, so dass.
Konkret brauchen wir für ein System, welches mit dem System von verträglich ist. Dies führt zum Begriff derMessbarkeit. Es soll gelten
für jedes Element muss dasUrbild unter der Zufallsvariable, das bedeutet die Menge, ein Ereignis in dem System sein, das bedeutet.
Wenn diese Eigenschaft gilt, dann nennen wir eine-messbare Funktion. Zufallsvariablen erfüllen diese Eigenschaft (für ein und) und sind messbare Funktionen.
Als Letztes ermöglicht uns die Messbarkeit, das Wahrscheinlichkeitsmaß auf den Raum zu übertragen. Dies führt zum Begriff derWahrscheinlichkeitsverteilung, welche als sogenanntesBildmaß unter der Zufallsvariable durch für alle definiert ist.
Will man zwei unabhängige Würfe mit einem fairen Würfel modellieren, so setzt man alle 36 Ergebnisse gleich wahrscheinlich, wählt also dasWahrscheinlichkeitsmaß als für.
Die Zufallsvariablen (gewürfelte Zahl des ersten Würfels), (gewürfelte Zahl des zweiten Würfels) und (Augensumme des ersten und zweiten Würfels) werden als folgende Funktionen definiert:
In der Regel wird auf die konkrete Angabe der zugehörigen Räume verzichtet; es wird angenommen, dass aus dem Kontext klar ist, welcher Wahrscheinlichkeitsraum auf und welcher Messraum auf gemeint ist.
Bei einer endlichen Ergebnismenge wird meistens als die Potenzmenge von gewählt. Die Forderung, dass die verwendete Funktion messbar ist, ist dann immer erfüllt. Messbarkeit wird erst wirklich bedeutsam, wenn die Ergebnismengeüberabzählbar viele Elemente enthält.
Einige Klassen von Zufallsvariablen mit bestimmten Wahrscheinlichkeits- und Messräumen werden besonders häufig verwendet. Diese werden teilweise mit Hilfe alternativer Definitionen eingeführt, die keine Kenntnisse der Maßtheorie voraussetzen:
Bei reellen Zufallsvariablen ist der Bildraum die Menge derreellen Zahlen versehen mit derborelschen-Algebra. Die allgemeine Definition von Zufallsvariablen lässt sich in diesem Fall zur folgenden Definition vereinfachen:
Eine reelle Zufallsvariable ist eine Funktion, die jedem Ergebnis aus einerErgebnismenge eine reelle Zahl zuordnet und die folgende Messbarkeitsbedingung erfüllt:
Das bedeutet, dass die Menge aller Ergebnisse, deren Realisierung unterhalb eines bestimmten Wertes liegt, ein Ereignis bilden muss.
Im Beispiel des zweimaligen Würfelns sind, und jeweils reelle Zufallsvariablen.
Eine mehrdimensionale Zufallsvariable ist eine messbare Abbildung für eine Dimension. Sie wird auch als Zufallsvektor bezeichnet. Damit ist gleichzeitig ein Vektor von einzelnen reellen Zufallsvariablen, die alle auf dem gleichen Wahrscheinlichkeitsraum definiert sind. Die Verteilung von wird alsmultivariat bezeichnet, die Verteilungen der Komponenten nennt man auchRandverteilungen. Die mehrdimensionalen Entsprechungen von Erwartungswert und Varianz sind derErwartungswertvektor und dieKovarianzmatrix.
Im Beispiel des zweimaligen Würfelns ist eine zweidimensionale Zufallsvariable.
Zufallsvektoren sollten nicht mitWahrscheinlichkeitsvektoren (auch stochastische Vektoren genannt) verwechselt werden. Diese sind Elemente des, deren Komponenten positiv sind und deren Summe 1 ergibt. Sie beschreiben die Wahrscheinlichkeitsmaße auf Mengen mit Elementen.
Bei komplexen Zufallsvariablen ist der Bildraum die Menge derkomplexen Zahlen versehen mit der durch die kanonische Vektorraumisomorphie zwischen und „geerbten“ borelschen σ-Algebra. ist genau dann eine Zufallsvariable, wenn Realteil und Imaginärteil jeweils reelle Zufallsvariablen sind.
Der BegriffZufallsvariable ohne weitere Charakterisierung bedeutet meistens – und fast immer in anwendungsnahen Darstellungen –reelle Zufallsvariable. Zur Unterscheidung von einer solchen wird eine Zufallsvariable mit Werten in denerweiterten reellen Zahlen alsnumerische Zufallsvariable[17] – entsprechend der Terminologie dernumerischen Funktion – oder alserweiterte Zufallsvariable[17] (engl.extended random variable[18]) bezeichnet. Es gibt aber auch eine abweichende Terminologie, bei derZufallsvariable eine numerische Zufallsvariable bezeichnet und eine reelle Zufallsvariable immer als solche bezeichnet wird.[19]
In der Literatur wird die obige Definition der Zufallsvariable manchmal für den BegriffZufallselement oderzufälliges Element (resp.englischrandom element) verwendet, um reelle Zufallsvariablen von allgemeineren Objekten wie demZufallsvektor, demzufälligen Maß, derZufallsfunktion, derZufallsmenge, derZufallsmatrix usw. zu unterscheiden.
Eng verknüpft mit dem eher technischen Begriff einer Zufallsvariablen ist der Begriff der auf dem Bildraum von induziertenWahrscheinlichkeitsverteilung. Mitunter werden beide Begriffe auch synonym verwendet. Formal wird die Verteilung einer Zufallsvariablen als dasBildmaß des Wahrscheinlichkeitsmaßes definiert, also
für alle, wobei die auf dem Bildraum der Zufallsvariable gegebene σ-Algebra ist.
Statt werden in der Literatur für die Verteilung von auch die Schreibweisen oder verwendet.
Spricht man also beispielsweise von einer normalverteilten Zufallsvariablen, so ist damit eine Zufallsvariable mit Werten in den reellen Zahlen gemeint, deren Verteilung einerNormalverteilung entspricht.
Eigenschaften, welche sich allein über gemeinsame Verteilungen von Zufallsvariablen ausdrücken lassen, werden auchwahrscheinlichkeitstheoretisch genannt.[20] Für Behandlung solcher Eigenschaften ist es nicht notwendig, die konkrete Gestalt des (Hintergrund-)Wahrscheinlichkeitsraumes zu kennen, auf dem die Zufallsvariablen definiert sind.
Häufig wird deswegen von einer Zufallsvariablen lediglich die Verteilungsfunktion angegeben und der zu Grunde liegende Wahrscheinlichkeitsraum offen gelassen. Dies ist vom Standpunkt der Mathematik erlaubt, sofern es tatsächlich einen Wahrscheinlichkeitsraum gibt, der eine Zufallsvariable mit der gegebenen Verteilung erzeugen kann. Ein solcher Wahrscheinlichkeitsraum lässt sich aber zu einer konkreten Verteilung leicht angeben, indem beispielsweise, als die Borelsche σ-Algebra auf den reellen Zahlen und als das durch die Verteilungsfunktion induzierteLebesgue-Stieltjes-Maß gewählt wird. Als Zufallsvariable kann dann dieidentische Abbildung mit gewählt werden.[21]
Wenn eineFamilie von Zufallsvariablen betrachtet wird, reicht es aus wahrscheinlichkeitstheoretischer Perspektive genauso, die gemeinsame Verteilung der Zufallsvariablen anzugeben, die Gestalt des Wahrscheinlichkeitsraums kann wiederum offen gelassen werden.
Die Frage nach der konkreten Gestalt des Wahrscheinlichkeitsraumes tritt also in den Hintergrund, es ist jedoch von Interesse, ob zu einer Familie von Zufallsvariablen mit vorgegebenen endlichdimensionalen gemeinsamen Verteilungen ein Wahrscheinlichkeitsraum existiert, auf dem sie sich gemeinsam definieren lassen. Diese Frage wird für unabhängige Zufallsvariablen durch einen Existenzsatz vonÉ. Borel gelöst, der besagt, dass man im Prinzip auf den von Einheitsintervall und Lebesgue-Maß gebildeten Wahrscheinlichkeitsraum zurückgreifen kann. Ein möglicher Beweis nutzt, dass sich die binären Nachkommastellen der reellen Zahlen in [0,1] als ineinander verschachtelteBernoulli-Folgen betrachten lassen (ähnlichHilberts Hotel).[22]
Verschiedene mathematische Attribute, die teilweise denen für allgemeine Funktionen entlehnt sind, finden bei Zufallsvariablen Anwendung. Die häufigsten werden in der folgenden Zusammenstellung kurz erklärt:
Zwei reelle Zufallsvariablen heißen unabhängig, wenn für je zwei Intervalle und die Ereignisse undstochastisch unabhängig sind. Das sind sie, wenn gilt:.
In obigem Beispiel sind und unabhängig voneinander; die Zufallsvariablen und hingegen nicht.
Unabhängigkeit mehrerer Zufallsvariablen bedeutet, dass das Wahrscheinlichkeitsmaß des Zufallsvektors demProduktmaß der Wahrscheinlichkeitsmaße der Komponenten, also dem Produktmaß von entspricht.[25] So lässt sich beispielsweise dreimaliges unabhängiges Würfeln durch den Wahrscheinlichkeitsraum mit
,
der Potenzmenge von und
modellieren; die Zufallsvariable „Ergebnis des-ten Wurfes“ ist dann
für.
Die Konstruktion eines entsprechenden Wahrscheinlichkeitsraums für eine beliebige Familie unabhängiger Zufallsvariable mit gegebenen Verteilungen ist ebenfalls möglich.[26]
Zwei oder mehr Zufallsvariablen heißen identisch verteilt (bzw.i.d. für identically distributed), wenn ihreinduzierten Wahrscheinlichkeitsverteilungen gleich sind. In Beispiel des zweimaligen Würfelns sind, identisch verteilt; die Zufallsvariablen und hingegen nicht.
Häufig werdenFolgen von Zufallsvariablen untersucht, die sowohl unabhängig als auch identisch verteilt sind; demnach spricht man von unabhängigen, identisch verteilten Zufallsvariablen, üblicherweise mitu.i.v. bzw.i.i.d. (fürindependent and identically distributed) abgekürzt.
In obigem Beispiel des dreimaligen Würfelns sind, und u.i.v. Die Summe der ersten beiden Würfe und die Summe des zweiten und dritten Wurfs sind zwar identisch verteilt, aber nicht unabhängig. Dagegen sind und unabhängig, aber nicht identisch verteilt.
Austauschbare Familien von Zufallsvariablen sind Familien, deren Verteilung sich nicht ändert, wenn man endlich viele Zufallsvariablen in der Familie vertauscht. Austauschbare Familien sind stets identisch verteilt, aber nicht notwendigerweise unabhängig.
Mathematische Attribute für reelle Zufallsvariablen
Zur Charakterisierung von Zufallsvariablen dienen einige wenige Funktionen, die wesentliche mathematische Eigenschaften der jeweiligen Zufallsvariable beschreiben. Die wichtigste dieser Funktionen ist dieVerteilungsfunktion, die Auskunft darüber gibt, mit welcher Wahrscheinlichkeit die Zufallsvariable einen Wert bis zu einer vorgegebenen Schranke annimmt, beispielsweise die Wahrscheinlichkeit, höchstens eine Vier zu würfeln. Bei stetigen Zufallsvariablen wird diese durch dieWahrscheinlichkeitsdichte ergänzt, mit der die Wahrscheinlichkeit berechnet werden kann, dass die Werte einer Zufallsvariablen innerhalb eines bestimmtenIntervalls liegen. Des Weiteren sind Kennzahlen wie derErwartungswert, dieVarianz oder höhere mathematischeMomente von Interesse.
Das Attributstetig wird für unterschiedliche Eigenschaften verwendet.
Eine reelle Zufallsvariable wird als stetig (oder auch absolut stetig) bezeichnet, wenn sie eineDichte besitzt (ihre Verteilungabsolutstetig bezüglich desLebesgue-Maßes ist).[27]
Eine reelle Zufallsvariable wird als stetig bezeichnet, wenn sie eine stetigeVerteilungsfunktion besitzt.[28] Insbesondere bedeutet das, dass für alle gilt.
Wenn eine reelle Zufallsvariable auf dem Ergebnisraum und eine messbare Funktion gegeben ist, dann ist auch eine Zufallsvariable auf demselben Ergebnisraum, da die Verknüpfung messbarer Funktionen wieder messbar ist. wird auch alsTransformation der Zufallsvariablen unter bezeichnet. Die gleiche Methode, mit der man von einem Wahrscheinlichkeitsraum nach gelangt, kann benutzt werden, um die Verteilung von zu erhalten.
Die Verteilungsfunktion der transformierten Zufallsvariablen kann mit der Wahrscheinlichkeitsverteilung bestimmt werden
Eine Zufallsvariable heißtintegrierbar, wenn derErwartungswert der Zufallsvariable existiert und endlich ist. Die Zufallsvariable heißtquasi-integrierbar, wenn der Erwartungswert existiert, möglicherweise aber unendlich ist. Jede integrierbare Zufallsvariable ist folglich auch quasi-integrierbar.
Eine Zufallsvariable nennt man standardisiert, wenn ihrErwartungswert 0 und ihreVarianz 1 ist. Die Transformation einer Zufallsvariable in eine standardisierte Zufallsvariable
bezeichnet man als Standardisierung der Zufallsvariable.
Eine Zufallsvariable erzeugt eine σ-Algebra, wobei dieBorelsche σ-Algebra des ist.
Es gibt Zufallsvariablen, die weder diskret noch stetig sind. Ein Beispiel ist die Lebensdauer einer Maschine. ist eine Zufallsvariable mit (und daher nicht stetig), weil eine Maschine eine Wahrscheinlichkeit hat, von Anfang nicht zu funktionieren. Außerdem ist für alle (und daher ist nicht diskret).[30] Ein anderes Beispiel ist die Wartezeit eines Autos vor einer Ampel.[31] Man kann in diesen Fällen eine Zerlegung in eine Summe aus einer stetigen und einer diskreten Zufallsvariablen vornehmen.
P. H. Müller (Hrsg.):Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991,ISBN 3-05-500608-9, Zufällige Variable (random variable),S.511.
↑abcdP. H. Müller (Hrsg.):Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991,ISBN 3-05-500608-9, Zufällige Variable (random variable),S.511.
↑David Meintrup, Stefan Schäffler:Stochastik. Theorie und Anwendungen. Springer-Verlag, Berlin Heidelberg New York 2005,ISBN 3-540-21676-6,S.456–457,doi:10.1007/b137972.
↑Pál Révész:Die Gesetze der Grossen Zahlen (= Lehrbücher und Monographien aus dem Gebiete der exakten Wissenschaften.Band35). Birkhäuser, Basel 1980,ISBN 3-0348-6941-X, Kap. 2Unabhängige Zufallsveränderliche,doi:10.1007/978-3-0348-6940-9 (Originalausgabe:The Laws of Large Numbers, Budapest 1967, übersetzt von Eva Vas).
↑Andrei Nikolajewitsch Kolmogorow:Bemerkungen zu meiner Arbeit „Über die Summen durch den Zufall bestimmter unabhängiger Größen“. In:Mathematische Annalen.Band99, 1930,S.484ff. (uni-goettingen.de).
↑Andrei Nikolajewitsch Kolmogorow:Grundbegriffe der Wahrscheinlichkeitsrechnung. Springer, Berlin 1933.
↑Boris Gnedenko, Andrei Nikolajewitsch Kolmogorow:Grenzverteilung von Summen unabhängiger Zufallsgrößen. Akademie Verlag, 1959.
↑Z. Birnbaum, J. Schreier:Anmerkung zum starken Gesetz der großen Zahlen. In:Studia Mathematica.Band4, 1933,doi:10.4064/sm-4-1-85-89.
↑Klaus D. Schmidt:Maß und Wahrscheinlichkeit. 2.,durchgesehene Auflage. Springer, Berlin / Heidelberg 2011,ISBN 978-3-642-21025-9,S.194.
↑Loève:Probability Theory. 4. Auflage. Band 1, Springer 1977,ISBN 0-387-90210-4, S. 172f.
↑Robert B. Ash:Real Analysis and Probability. Academic Press, New York 1972,ISBN 0-12-065201-3, Definition 5.6.2.
↑Olav Kallenberg:Foundations of Modern Probability. 2. Ausgabe. Springer, New York 2002,ISBN 0-387-95313-2, S. 55.
↑David Meintrup, Stefan Schäffler:Stochastik. Theorie und Anwendungen. Springer-Verlag, Berlin Heidelberg New York 2005,ISBN 3-540-21676-6,S.90,doi:10.1007/b137972.
↑Robert B. Ash:Real Analysis and Probability. Academic Press, New York 1972,ISBN 0-12-065201-3 (Definition 5.8.1)
↑Klaus D. Schmidt:Maß und Wahrscheinlichkeit. Springer-Verlag, Berlin / Heidelberg 2009,ISBN 978-3-540-89729-3, Kapitel 11.4.
↑Marek Fisz:Wahrscheinlichkeitsrechnung und mathematische Statistik. 11. Auflage. VEB Deutscher Verlag der Wissenschaften, Berlin 1989, Definition 2.3.3.
↑Robert B. Ash:Real Analysis and Probability. Academic Press, New York 1972,ISBN 0-12-065201-3, S. 210.
Das letzte Gleichheitszeichen folgt, da die Verteilungsfunktion von als stetig vorausgesetzt ist, woraus folgt. Typischerweise werden solche Berechnungen in der Statistik mit etwas Übung ohne expliziten Rückgriff auf die zugrundeliegende Ergebnismenge und damit den zugrundeliegenden Wahrscheinlichkeitsraum durchgeführt, z. B. für den Fall in der Form
↑Günter Mühlbach:Repetitorium Stochastik: Ein Zugang über Beispiele. 1. Auflage. Carl Hanser Verlag GmbH & Co. KG, 2011,ISBN 978-3-446-47597-7,S.53.
↑Matthias Vierkötter:Grundlagen der modernen Finanzmathematik. 2021,ISBN 978-3-662-63062-4,S.16–17.