Einstatistisches Modell, manchmal auchstatistischer Raum oderstatistisches Experiment genannt, ist ein Begriff aus dermathematischen Statistik, dem Teilbereich derStatistik, der sich der Methoden derStochastik undWahrscheinlichkeitstheorie bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchenMengen von Werten soll eineWahrscheinlichkeit zugeordnet werden und welcheWahrscheinlichkeitsmaße sind möglich beziehungsweise sollen in Betracht gezogen werden?
Ein statistisches Modell ist ein Tripel bestehend aus
Oftmals ist es handlicher, die Menge von Wahrscheinlichkeitsmaßen als Familie (mit beliebiger Indexmenge) zu notieren, um auf ausgewiesene Elemente leichter zugreifen zu können. Die Menge von Wahrscheinlichkeitsmaßen wird dann auch mit notiert. Dies bedeutet nicht zwangsläufig, dass es sich um ein parametrisches Modell handelt.
Es existieren mehrere alternative Definitionen eines statistischen Modells, die sich in ihrer Detailliertheit unterscheiden.
Einerseits findet sich die Beschreibung eines statistischen Modells als eineZufallsvariable, die Werte in demMessraum annimmt entsprechend den Verteilungen aus.[1] Der zugrunde liegende Wahrscheinlichkeitsraum der Zufallsvariable wird nicht näher präzisiert, da er für die Verteilungen nicht relevant ist. Diese Beschreibung macht im Gegensatz zur obigen Beschreibung klarer, dass die Stichproben, also die Elemente aus, alsRealisierung einer Zufallsvariable mit unbekannter Verteilung zu sehen sind. Die Menge heißt dann auchStichprobenraum.
Bei vielen statistischen Anwendungen in der statistischenSchätz- undTesttheorie ist einZufallsvektor vonstochastisch unabhängigen und identisch verteiltenreellen Zufallsvariablen, die eineZufallsstichprobe bilden. Der Stichprobenraum ist dann häufig.
Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen.[2] Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall,Borelsche σ-Algebra sonst).
Lucien Le Cam verwendete wieDavid Blackwell den Begriff des statistischen Experiments statt des statistischen Modells, definierte dieses aber abstrakter über bestimmteBanachverbände, derenNorm additiv auf dempositiven Kegel ist, den sogenanntenabstrakten L-Räumen. Le Cam definierte das statistische Modell wie folgt:
Ein statistisches Modell ist somit eine Abbildung auf den nichtnegativenRand desEinheitsball in einem abstrakten L-Raum.
Lässt sich die Menge von Wahrscheinlichkeitsmaßen über eine Parametermenge, auch Parameterraum genannt, beschreiben, ist also
für eine Parametermenge, so spricht man von einemparametrischen Modell, ansonsten von einemnichtparametrischen Modell. Ist, so spricht man von einemeinparametrigen Modell.
Die Parameter des Modells können zum Beispiel mit derMaximum-Likelihood-Methode mithilfe von Stichproben geschätzt werden.
Ist endlich oderabzählbar unendlich und ist diePotenzmenge, so spricht man von einemdiskreten Modell. Die Wahrscheinlichkeitsmaße lassen sich dann durchWahrscheinlichkeitsfunktionen beschreiben.
Ist eineBorel-Menge des und ist die Einschränkung derBorelschen σ-Algebra auf diese Menge, also und besitzt jedes der Wahrscheinlichkeitsmaße in eineWahrscheinlichkeitsdichte, so spricht man von einemstetigen Modell.
Handelt es sich um ein stetiges Modell oder um ein diskretes Modell, so spricht man von einemStandardmodell[4]. Bei Standardmodellen existiert also insbesondere eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsfunktion. Manche Autoren nennen diese Modelle auch reguläre Modelle[5].
Reguläre statistische Modelle sind einparametrige Standardmodelle, bei denen noch Anforderungen an die Existenz von Ableitungen der Dichtefunktion gestellt werden. Sie werden zur Formulierung derCramér-Rao-Ungleichung benötigt.
Statistische Modelle, deren Verteilungsklasse eineLokationsklasse ist, also durch Verschiebung einer einzigen Wahrscheinlichkeitsverteilung entstehen, werdenLokationsmodelle genannt, ebenso werden statistische Modelle mitSkalenfamilienSkalenmodell genannt.
Produktmodelle entstehen, wenn man das mehrmalige Produkt eines statistischen Modells mit sich selbst bildet. Sie formalisieren die Vorstellung, dass man einen Versuch mehrmals hintereinander ausführt und die Ergebnisse der Einzelversuche sich nicht gegenseitig beeinflussen. Viele der gängigen Modelle wie dasNormalverteilungsmodell sind Produktmodelle.
Ein Beispiel für ein statistisches Modell ist der Grundraum versehen mit der σ-Algebra und als Menge der Wahrscheinlichkeitsmaße die Menge
allerBinomialverteilungen mit Parametern 100 und. Dieses statistische Modell könnte man beispielsweise wählen, wenn man eine Münze 100-mal wirft und die Anzahl der Erfolge zählt. Diese ist binomialverteilt, aber zu einem unbekannten Parameter, da nicht klar ist, ob die Münze gefälscht ist oder nicht. Es handelt sich bei diesem Modell um ein einparametriges Modell, da ist. Außerdem ist es ein diskretes Modell, da die Grundmenge endlich ist und die σ-Algebra durch die Potenzmenge definiert wird. Damit ist es auch automatisch ein Standardmodell. Die Menge von Wahrscheinlichkeitsmaßen
ergibt hingegen ein nichtparametrisches Modell.
Prinzipiell lassen sich zwei Ansätze bei der Erstellung statistischer Modelle unterscheiden:[6]