Movatterモバイル変換


[0]ホーム

URL:


Zum Inhalt springen
WikipediaDie freie Enzyklopädie
Suche

Statistisches Modell

aus Wikipedia, der freien Enzyklopädie

Einstatistisches Modell, manchmal auchstatistischer Raum oderstatistisches Experiment genannt, ist ein Begriff aus dermathematischen Statistik, dem Teilbereich derStatistik, der sich der Methoden derStochastik undWahrscheinlichkeitstheorie bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchenMengen von Werten soll eineWahrscheinlichkeit zugeordnet werden und welcheWahrscheinlichkeitsmaße sind möglich beziehungsweise sollen in Betracht gezogen werden?

Definition

[Bearbeiten |Quelltext bearbeiten]

Ein statistisches ModellE{\displaystyle {\mathcal {E}}} ist ein TripelE=(X,A,P){\displaystyle {\mathcal {E}}=({\mathcal {X}},{\mathcal {A}},{\mathcal {P}})} bestehend aus

Oftmals ist es handlicher, die Menge von Wahrscheinlichkeitsmaßen als Familie (mit beliebiger Indexmenge) zu notieren, um auf ausgewiesene Elemente leichter zugreifen zu können. Die Menge von Wahrscheinlichkeitsmaßen wird dann auch mit(Pϑ)ϑΘ{\displaystyle (P_{\vartheta })_{\vartheta \in \Theta }} notiert. Dies bedeutet nicht zwangsläufig, dass es sich um ein parametrisches Modell handelt.

Alternative Definitionen

[Bearbeiten |Quelltext bearbeiten]

Es existieren mehrere alternative Definitionen eines statistischen Modells, die sich in ihrer Detailliertheit unterscheiden.

Einerseits findet sich die Beschreibung eines statistischen Modells als eineZufallsvariableX{\displaystyle X}, die Werte in demMessraum(X,A){\displaystyle ({\mathcal {X}},{\mathcal {A}})} annimmt entsprechend den Verteilungen ausP{\displaystyle {\mathcal {P}}}.[1] Der zugrunde liegende Wahrscheinlichkeitsraum der Zufallsvariable wird nicht näher präzisiert, da er für die Verteilungen nicht relevant ist. Diese Beschreibung macht im Gegensatz zur obigen Beschreibung klarer, dass die Stichproben, also die Elemente ausX{\displaystyle {\mathcal {X}}}, alsRealisierung einer Zufallsvariable mit unbekannter Verteilung zu sehen sind. Die MengeX{\displaystyle {\mathcal {X}}} heißt dann auchStichprobenraum.

Bei vielen statistischen Anwendungen in der statistischenSchätz- undTesttheorie istX{\displaystyle X} einZufallsvektorX=(X1,,Xn){\displaystyle X=(X_{1},\dots ,X_{n})} vonstochastisch unabhängigen und identisch verteiltenreellen ZufallsvariablenX1,,Xn{\displaystyle X_{1},\dots ,X_{n}}, die eineZufallsstichprobe bilden. Der Stichprobenraum ist dann häufigRn{\displaystyle \mathbb {R} ^{n}}.

Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von WahrscheinlichkeitsmaßenP{\displaystyle {\mathcal {P}}}.[2] Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall,Borelsche σ-Algebra sonst).

Definition nach Le Cam

[Bearbeiten |Quelltext bearbeiten]

Lucien Le Cam verwendete wieDavid Blackwell den Begriff des statistischen Experiments statt des statistischen Modells, definierte dieses aber abstrakter über bestimmteBanachverbände, derenNorm additiv auf dempositiven Kegel ist, den sogenanntenabstrakten L-Räumen. Le Cam definierte das statistische Modell wie folgt:

Ein statistisches ExperimentE{\displaystyle {\mathcal {E}}}, indexiert von einer MengeΘ{\displaystyle \Theta }, ist eine Abbildung der FormθPθ{\displaystyle \theta \mapsto P_{\theta }} vonΘ{\displaystyle \Theta } in einen abstrakten L-Raum(L,){\displaystyle (L,\|\cdot \|)}, bestehend aus positiven normierten linearenFunktionalenPθ{\displaystyle P_{\theta }}, das heißt es giltPθ=1{\displaystyle \|P_{\theta }\|=1} und für allef0{\displaystyle f\geq 0} giltPθf0{\displaystyle P_{\theta }f\geq 0}.[3]

Ein statistisches Modell ist somit eine Abbildung auf den nichtnegativenRand desEinheitsball in einem abstrakten L-Raum.

Klassifikation statistischer Modelle

[Bearbeiten |Quelltext bearbeiten]

Parametrische und nichtparametrische Modelle

[Bearbeiten |Quelltext bearbeiten]

Lässt sich die Menge von Wahrscheinlichkeitsmaßen über eine Parametermenge, auch Parameterraum genannt, beschreiben, ist also

P={Pϑ|ϑΘ}{\displaystyle {\mathcal {P}}=\{P_{\vartheta }\,|\,\vartheta \in \Theta \}}

für eine ParametermengeΘRn{\displaystyle \Theta \subset \mathbb {R} ^{n}}, so spricht man von einemparametrischen Modell, ansonsten von einemnichtparametrischen Modell. IstΘR{\displaystyle \Theta \subset \mathbb {R} }, so spricht man von einemeinparametrigen Modell.

Die Parameter des Modells können zum Beispiel mit derMaximum-Likelihood-Methode mithilfe von Stichproben geschätzt werden.

Diskrete Modelle

[Bearbeiten |Quelltext bearbeiten]

IstX{\displaystyle {\mathcal {X}}} endlich oderabzählbar unendlich und istA=2X{\displaystyle {\mathcal {A}}=2^{\mathcal {X}}} diePotenzmenge, so spricht man von einemdiskreten Modell. Die Wahrscheinlichkeitsmaße lassen sich dann durchWahrscheinlichkeitsfunktionen beschreiben.

Stetige Modelle

[Bearbeiten |Quelltext bearbeiten]

IstX{\displaystyle {\mathcal {X}}} eineBorel-Menge desRn{\displaystyle \mathbb {R} ^{n}} und istA{\displaystyle {\mathcal {A}}} die Einschränkung derBorelschen σ-Algebra auf diese Menge, alsoA=B(Rn)|X{\displaystyle {\mathcal {A}}={\mathcal {B}}(\mathbb {R} ^{n})|_{\mathcal {X}}} und besitzt jedes der Wahrscheinlichkeitsmaße inP{\displaystyle {\mathcal {P}}} eineWahrscheinlichkeitsdichte, so spricht man von einemstetigen Modell.

Standardmodelle

[Bearbeiten |Quelltext bearbeiten]

Handelt es sich um ein stetiges Modell oder um ein diskretes Modell, so spricht man von einemStandardmodell[4]. Bei Standardmodellen existiert also insbesondere eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsfunktion. Manche Autoren nennen diese Modelle auch reguläre Modelle[5].

Reguläre Modelle

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Reguläres statistisches Modell

Reguläre statistische Modelle sind einparametrige Standardmodelle, bei denen noch Anforderungen an die Existenz von Ableitungen der Dichtefunktion gestellt werden. Sie werden zur Formulierung derCramér-Rao-Ungleichung benötigt.

Lokations- und Skalenmodelle

[Bearbeiten |Quelltext bearbeiten]

Statistische Modelle, deren Verteilungsklasse eineLokationsklasse ist, also durch Verschiebung einer einzigen Wahrscheinlichkeitsverteilung entstehen, werdenLokationsmodelle genannt, ebenso werden statistische Modelle mitSkalenfamilienSkalenmodell genannt.

Produktmodelle

[Bearbeiten |Quelltext bearbeiten]
Hauptartikel:Produktmodell (Statistik)

Produktmodelle entstehen, wenn man das mehrmalige Produkt eines statistischen Modells mit sich selbst bildet. Sie formalisieren die Vorstellung, dass man einen Versuch mehrmals hintereinander ausführt und die Ergebnisse der Einzelversuche sich nicht gegenseitig beeinflussen. Viele der gängigen Modelle wie dasNormalverteilungsmodell sind Produktmodelle.

Beispiele

[Bearbeiten |Quelltext bearbeiten]

Ein Beispiel für ein statistisches Modell ist der GrundraumX={0,1}100{\displaystyle {\mathcal {X}}=\{0,1\}^{100}} versehen mit der σ-AlgebraA=2X{\displaystyle {\mathcal {A}}=2^{\mathcal {X}}} und als Menge der Wahrscheinlichkeitsmaße die Menge

P={Bin100,ϑ|ϑ[0,1]}{\displaystyle {\mathcal {P}}=\{\operatorname {Bin} _{100,\vartheta }\,|\,\vartheta \in [0,1]\}}

allerBinomialverteilungen mit Parametern 100 undϑ{\displaystyle \vartheta }. Dieses statistische Modell könnte man beispielsweise wählen, wenn man eine Münze 100-mal wirft und die Anzahl der Erfolge zählt. Diese ist binomialverteilt, aber zu einem unbekannten Parameter, da nicht klar ist, ob die Münze gefälscht ist oder nicht. Es handelt sich bei diesem Modell um ein einparametriges Modell, daϑΘ=[0,1]R{\displaystyle \vartheta \in \Theta =[0,1]\subset \mathbb {R} } ist. Außerdem ist es ein diskretes Modell, da die Grundmenge endlich ist und die σ-Algebra durch die Potenzmenge definiert wird. Damit ist es auch automatisch ein Standardmodell. Die Menge von Wahrscheinlichkeitsmaßen

P={P|P ist W-Maß auf (X,A)}{\displaystyle {\mathcal {P}}=\{P\,|\,P{\text{ ist W-Maß auf }}({\mathcal {X}},{\mathcal {A}})\}},

ergibt hingegen ein nichtparametrisches Modell.

Verwendungsarten statischer Modelle

[Bearbeiten |Quelltext bearbeiten]

Prinzipiell lassen sich zwei Ansätze bei der Erstellung statistischer Modelle unterscheiden:[6]

  • bei der ersten Gruppe von Methoden werden zunächst generierende stochastische Modelle angenommen,
  • in der anderen werden die Modelle algorithmisch alsBlack Box erstellt und ihre prädiktive Genauigkeit analysiert.

Literatur

[Bearbeiten |Quelltext bearbeiten]

Einzelnachweise

[Bearbeiten |Quelltext bearbeiten]
  1. Rüschendorf:Mathematische Statistik. 2014, S. 18.
  2. Czado, Schmidt:Mathematische Statistik. 2011, S. 39.
  3. Lucien Le Cam:Asymptotic Methods in Statistical Decision Theory. In: Springer, New York (Hrsg.):Springer Series in Statistics. 1986,S. 5,doi:10.1007/978-1-4612-4946-7. 
  4. Georgii:Stochastik. 2009, S. 197.
  5. Claudia Czado, Thorsten Schmidt:Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011,ISBN 978-3-642-17260-1,S. 41,doi:10.1007/978-3-642-17261-8. 
  6. Breiman, Leo.Statistical modeling: The two cultures (with comments and a rejoinder by the author). Statistical science, 16.3 (2001): 199–231,online
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Statistisches_Modell&oldid=242362479
Kategorie:

[8]ページ先頭

©2009-2026 Movatter.jp