Movatterモバイル変換


[0]ホーム

URL:


Zum Inhalt springen
WikipediaDie freie Enzyklopädie
Suche

Umtauschparadoxon

aus Wikipedia, der freien Enzyklopädie

DasUmtauschparadoxon (oderBriefumschlagparadoxon) beschreibt eine speziellemathematische Situation, bei der das naive Rechnen mitErwartungswerten, insbesondere die Anwendung desIndifferenzprinzips, zu einem Widerspruch zumgesunden Menschenverstand führt. Es hat Ähnlichkeit mit demZwei-Zettel-Spiel und demZiegenproblem, dieses hat jedoch einen anderenwahrscheinlichkeitstheoretischen Hintergrund.

Geschichte

[Bearbeiten |Quelltext bearbeiten]

Das Umtauschparadoxon lässt sich zumindest bis 1953 zurückverfolgen und wurde damals in einem Buch des belgischen MathematikersMaurice Kraitchik sinngemäß folgendermaßen formuliert:

„Zwei gleich wohlhabende Personen treffen einander und wollen die Inhalte ihrer Geldbörsen vergleichen. Keiner weiß, wie viel Geld der andere in der Börse hat. Sie vereinbaren folgendes Spiel: Derjenige, der weniger Geld in der Börse hat, gewinnt den Inhalt der Geldbörse des anderen. Falls beide gleich viel haben sollten, behält jeder sein Geld. Nun könnte einer der beiden folgende Überlegung anstellen: „Angenommen, ich habe den BetragA in meiner Börse. Dann ist das das Maximum, das ich verlieren kann. Mit Wahrscheinlichkeit 0,5 gewinne ich allerdings und habe danach mehr als 2A. Daher ist das Spiel günstig für mich.“ Der andere könnte allerdings genauso argumentieren. Aus Symmetriegründen muss das Spiel aber fair sein. Worin liegt der Trugschluss dieser Argumentation?“[1]

Martin Gardner verbreitete das Rätsel 1982 in seinem BuchAha! Gotcha, ebenfalls in der Gestalt eines Geldbörsenspiels.[2] Die heutige Form mit den beiden Briefumschlägen wurde 1989 vonBarry Nalebuff formuliert.[3]

Die Umtauschsituation

[Bearbeiten |Quelltext bearbeiten]

Herr Lemke möchte Herrn Schmidt beschenken und gibt ihm zwei Briefumschläge mit den Worten „Ich schenke Ihnen einen dieser Umschläge. In beiden befindet sich ein Geldbetrag, im einen doppelt so viel wie im anderen. Sie dürfen einen Umschlag öffnen und dann entscheiden, welchen der beiden Umschläge Sie nehmen.“

Herr Schmidt öffnet einen zufällig ausgewählten der beiden Umschläge, findet zum Beispiel 100 Euro und überlegt: „Ich habe in diesem Umschlag 100 Euro. Wenn ich tausche, habe ich mit einer Wahrscheinlichkeit von 50 % 200 Euro und mit der gleichen Wahrscheinlichkeit 50 Euro. Dies macht einen Erwartungswert von 125 Euro.“

125=0,550+0,5200{\displaystyle 125=0{,}5\cdot 50+0{,}5\cdot 200}

Nach dieser Überlegung würde sich das Tauschen lohnen.

Das Paradoxon

[Bearbeiten |Quelltext bearbeiten]

Die folgende Überlegung führt Herrn Schmidts Rechnung vermeintlichad absurdum: Wenn die Rechnung von Herrn Schmidt für jeden beliebigen Betrag das Ergebnis lieferte, dass sich Tauschen lohne, so bräuchte er den Umschlag gar nicht zu öffnen, sondern könnte gleich den anderen Umschlag nehmen. Es kann aber nicht sein, dass der andere Umschlag immer besser ist, da ja beide Umschläge vor dem Öffnen offensichtlich gleichwertig sind.

Die Denkfalle

[Bearbeiten |Quelltext bearbeiten]

Eine mögliche Denkfalle besteht darin, dass Herr Schmidt entweder dasIndifferenzprinzip oder diebedingte Wahrscheinlichkeit falsch anwendet, also davon ausgeht, dass die 100 Euro mit einer 50-50-Wahrscheinlichkeit den halben oder den doppelten Betrag darstellen. Abhängig von Herrn Lemkes Auswahlverfahren kann das für diesen Betrag richtig sein, jedoch nicht für alle Beträge. Zunächst wird tatsächlich mit einer 50-%-Wahrscheinlichkeit der Umschlag mit dem kleineren oder größeren Betrag geöffnet. Es handelt sich daher entweder um die 50/100- oder um die 100/200-Euro-Kombination. Daraus kann aber nicht geschlossen werden, dass unter der Bedingung, dass 100 Euro gefunden wurden, die Wahrscheinlichkeiten für die beiden Kombinationen gleich sind. Über die Wahrscheinlichkeiten dieser Fälle ist nichts bekannt, und das Indifferenzprinzip ist ausgehend von einem aufgedeckten Betrag x{\displaystyle x} auf die Ereignisse „doppelter Betrag“ (2x{\displaystyle 2x}) und „halber Betrag“ (12x{\displaystyle {\tfrac {1}{2}}x}) aus grundsätzlichen Erwägungen heraus nicht anwendbar. In der Denkfallen-Sammlung[4] wird das an einigen Rechenbeispielen weiter verdeutlicht.[5][6]

Hingegen ist es durchaus möglich, dass, ausgehend vom Wert des geöffneten Umschlags, derbedingte Erwartungswert des ungeöffneten Umschlags immer höher ist; dies aber nur, wenn der Erwartungswert des ungeöffneten Umschlags größer als der Erwartungswert des geöffneten Umschlags ist oder wenn beide Erwartungswerte unendlich sind.

Analyse mit bedingten Wahrscheinlichkeiten

[Bearbeiten |Quelltext bearbeiten]

Die Rechnung mit einer 50-50-Wahrscheinlichkeit entspringt also einer unzulässigen Anwendung des Indifferenzprinzips. Die Berechnung des Erwartungswertes kann aber auch bei anderen Wahrscheinlichkeiten zu dem scheinbaren Widerspruch führen, dass ein Tausch immer angezeigt wäre. Um allgemein eine sinnvolle Tauschentscheidung zu treffen, muss sich Herr Schmidt vor Augen halten, dass erbedingte Wahrscheinlichkeiten verwenden muss, wenn er den Betrag im geöffneten Umschlag in seine Rechnung einbezieht. Der folgende Abschnitt enthält eine formale Analyse, ob bei einer gegebenen Wahrscheinlichkeitsverteilung ein Tausch für gewisse Beträge sinnvoll sein kann und ob es überhaupt eine Wahrscheinlichkeitsverteilung geben kann, bei der ein Tausch immer angezeigt ist. Ob diese Wahrscheinlichkeitsverteilung eine subjektive Einschätzung von Herrn Schmidt ist oder ob eine Wahrscheinlichkeitsverteilung der Beträge tatsächlich bekannt ist, ist für die Analyse unwesentlich.[7]Dazu kann beispielsweise folgende Notation verwendet werden:

Da beide Umschläge mit gleicher Wahrscheinlichkeit gewählt werden, habenX{\displaystyle X} undY{\displaystyle Y} die gleicheVerteilung, sind aber wegenX+Y=3Z{\displaystyle X+Y=3Z} voneinanderstochastisch abhängig. Für die Erwartungswerte giltEX=EY=32EZ{\displaystyle EX=EY={\tfrac {3}{2}}EZ}. Herr Schmidt will offensichtlich die Erwartung vonY{\displaystyle Y} berechnen, wenn erX{\displaystyle X} kennt, also diebedingte ErwartungE(YX){\displaystyle E(Y\mid X)}.

Diskrete Verteilungen

[Bearbeiten |Quelltext bearbeiten]

Zunächst soll der Fall behandelt werden, dassZ{\displaystyle Z} (und damit auchX{\displaystyle X} undY{\displaystyle Y}) einediskrete Verteilung besitzt. In diesem Fall bezeichnepn=P(Z=n){\displaystyle p_{n}=P(Z=n)} die Wahrscheinlichkeit, dass der kleinere Betrag in den Umschlägen gleichn{\displaystyle n} ist. Für die Verteilung vonX{\displaystyle X} undY{\displaystyle Y} folgt dann

P(X=n)=P(Y=n)=pn2+pn/22.{\displaystyle P(X=n)=P(Y=n)={\frac {p_{n}}{2}}+{\frac {p_{n/2}}{2}}\,.}

Im diskreten Fall gilt für die gesuchte bedingte Erwartung[8]

E(YX=n)=jyjP(Y=yjX=n).{\displaystyle E(Y\mid X=n)=\sum _{j}y_{j}P(Y=y_{j}\mid X=n)\,.}

Diebedingte WahrscheinlichkeitP(Y=yjX=n){\displaystyle P(Y=y_{j}\mid X=n)} ist laut Problemstellung nur dann von Null verschieden, wenn entwederyj=2n{\displaystyle y_{j}=2n} oderyj=n/2{\displaystyle y_{j}=n/2}. In diesen Fällen gilt für die Wahrscheinlichkeit, dass Herr Schmidt den doppelten Betrag im anderen Briefumschlag findet,

P(Y=2nX=n)=P(Z=nX=n)=P(Z=n und X=n)P(X=n)=12P(Z=n)P(Z=n)2+P(Z=n/2)2=pnpn+pn/2.{\displaystyle {\begin{aligned}P\left(Y=2n\mid X=n\right)&=P\left(Z=n\mid X=n\right)\\&={\frac {P\left(Z=n{\text{ und }}X=n\right)}{P\left(X=n\right)}}\\&={\frac {{\frac {1}{2}}P\left(Z=n\right)}{{\frac {P\left(Z=n\right)}{2}}+{\frac {P\left(Z=n/2\right)}{2}}}}\\&={\frac {p_{n}}{p_{n}+p_{n/2}}}.\end{aligned}}}

Die bedingte Wahrscheinlichkeit, dass Herr Schmidt den halben Betrag im anderen Briefumschlag findet, ist gerade komplementär hierzu, also gilt:

P(Y=n/2X=n)=1pnpn+pn/2=pn/2pn+pn/2.{\displaystyle P\left(Y=n/2\mid X=n\right)=1-{\frac {p_{n}}{p_{n}+p_{n/2}}}={\frac {p_{n/2}}{p_{n}+p_{n/2}}}.}

Sofern der Erwartungswert der Verteilung mit den korrekten Wahrscheinlichkeiten existiert, erhielte man

E:=E(YX=n)=2npnpn+pn/2+n2pn/2pn+pn/2=4pn+pn/22(pn+pn/2)n.{\displaystyle E:=E(Y\mid X=n)=2n{\frac {p_{n}}{p_{n}+p_{n/2}}}+{\frac {n}{2}}{\frac {p_{n/2}}{p_{n}+p_{n/2}}}={\frac {4p_{n}+p_{n/2}}{2\left(p_{n}+p_{n/2}\right)}}n.}

Zu tauschen würde sich demnach genau dann auszahlen, wennE>n{\displaystyle E>n} gilt; dies ist genau dann der Fall, wennpn>pn/22{\displaystyle p_{n}>{\tfrac {p_{n/2}}{2}}} gilt. Verteilungen, die diese Bedingung für alle möglichenn{\displaystyle n} erfüllen, lassen sich konstruieren,Z{\displaystyle Z} hat dann aber keinen endlichen Erwartungswert. Für so einea-priori-Verteilung ist der gegebene Vorteil der Tauschentscheidung für jeden vorgefundenen Wert im geöffneten Umschlag zwar nichtintuitiv, aber nicht paradox.[7]

Natürlich widerspricht die Annahme, dass beliebig hohe Beträge im Umschlag sein können, der praktischen Einschränkung, dass niemand, also auch nicht Herr Lemke, beliebig viel Geld zur Verfügung hat.

Wenn der durchschnittlicheErwartungswert für einen Umschlag endlich ist, kann das obige Ergebnis leicht erweitert werden. Man kann beweisen, dass der durchschnittliche erwartete Gewinn 0 sein muss. Da es sich nun um Summen unendlicher Reihen handelt, kann es hilfreich sein, sich an Zenos Paradoxon der Rennbahn zu erinnern. Um eine bestimmte Distanz zurückzulegen, muss Achilles zuerst die Hälfte dieser Distanz laufen, dann die Hälfte der verbleibenden Distanz, dann die Hälfte davon und so weiter bis ins Unendliche. Dieunendliche Folge dieser Intervalle,12,14,18,,(12)n,{\displaystyle {\tfrac {1}{2}},{\tfrac {1}{4}},{\tfrac {1}{8}},\ldots ,\left({\tfrac {1}{2}}\right)^{n},\ldots }, nimmt stetig in Richtung 0 als Grenzwert ab. Eine gegen 0 konvergierende Folge heißtNullfolge. Per Definition ist die Summe einerunendlichen Reihe derGrenzwert der Folge ihrerPartialsummen, sofern dieser Grenzwert existiert. Mit anderen Worten, die Summe ist die ZahlL{\displaystyle L}, so dass für jedes Intervallε{\displaystyle \varepsilon }, wie klein es auch sein mag, nach einem bestimmten Punkt in der Folge von Partialsummen alle nachfolgenden Umschläge innerhalb vonε{\displaystyle \varepsilon } vonL{\displaystyle L} liegen. Die unendliche Reihe12+14+18++(12)n+{\displaystyle {\tfrac {1}{2}}+{\tfrac {1}{4}}+{\tfrac {1}{8}}+\ldots +\left({\tfrac {1}{2}}\right)^{n}+\ldots } konvergiert gegen 1. Im Allgemeinen hat eineunendliche Reihe genau dann eine Summe, wenn die Folge ihrer Partialsummenkonvergiert.

DerErwartungswert für den Umschlag istE(X)=20p0+n=1(2npn1+2npn){\displaystyle E(X)=2^{0}p_{0}+\sum _{n=1}^{\infty }(2^{n}p_{n-1}+2^{n}p_{n})}. Unter der Annahme, dass sie einen endlichen Wert hat, muss es sich also um einekonvergenteunendliche Reihe handeln. DiePartialsumme vonE(E(YX)X){\displaystyle E(E(Y\mid X)-X)}, dem durchschnittlichen erwarteten Gewinn bei gegebenemX{\displaystyle X}, ist

 20p0+n=1k(2npn12n1pn)= 20p0+n=1k(2n1pn+2npn1)= 20p020p0+21p121p1++2k1pk12k1pk1+2kpk= 2kpk{\displaystyle {\begin{aligned}&\ 2^{0}p_{0}+\sum _{n=1}^{k}(2^{n}p_{n-1}-2^{n-1}p_{n})\\=&\ 2^{0}p_{0}+\sum _{n=1}^{k}(-2^{n-1}p_{n}+2^{n}p_{n-1})\\=&\ 2^{0}p_{0}-2^{0}p_{0}+2^{1}p_{1}-2^{1}p_{1}+\ldots +2^{k-1}p_{k-1}-2^{k-1}p_{k-1}+2^{k}p_{k}\\=&\ 2^{k}p_{k}\\\end{aligned}}}

Da die Folge derPartialsummen vonE(E(YX)X){\displaystyle E(E(Y\mid X)-X)} ist die Folge(2kpk){\displaystyle (2^{k}p_{k})}, und es ergibt sichE(E(YX)X)=limk2kpk{\displaystyle E(E(Y\mid X)-X)=\lim _{k\to \infty }2^{k}p_{k}}.

Aus der Tatsache, dassE(X)=20p0+n=1(2npn1+2npn){\displaystyle E(X)=2^{0}p_{0}+\sum _{n=1}^{\infty }(2^{n}p_{n-1}+2^{n}p_{n})}konvergiert, folgt, dass auch20p0+n=12npn{\displaystyle 2^{0}p_{0}+\sum _{n=1}^{\infty }2^{n}p_{n}} konvergiert. Daher konvergiert dieFolge(2kpk){\displaystyle (2^{k}p_{k})} fürk{\displaystyle k\to \infty } gegen 0. Der durchschnittliche erwartete GewinnE(E(YX)X){\displaystyle E(E(Y\mid X)-X)} beträgt 0, weil es sich um denGrenzwert dieser Folge handelt.[9]

Beispiel

[Bearbeiten |Quelltext bearbeiten]

Wenn man eine Wahrscheinlichkeitsverteilung annimmt, mit der Herr Lemke das Geld in die Briefumschläge verteilt, lässt sich die Situation sehr gut simulieren. Beispielsweise sei angenommen, er bestimmt den Betrag, indem er einen fairen Würfel wirft. Zeigt der Würfelk{\displaystyle k} Augen, so steckt er2k125{\displaystyle 2^{k-1}\cdot 25} Euro in den einen und2k25{\displaystyle 2^{k}\cdot 25} Euro in den anderen Umschlag. Herr Schmidt findet dann mit Wahrscheinlichkeit112{\displaystyle {\tfrac {1}{12}}} den Betrag 25 Euro im Umschlag, mit Wahrscheinlichkeit je212{\displaystyle {\tfrac {2}{12}}} einen der Beträge 50, 100, 200, 400 oder 800 Euro und wieder mit Wahrscheinlichkeit112{\displaystyle {\tfrac {1}{12}}} den Betrag 1600 Euro. Tauscht er nicht, so beträgt der Erwartungswert des Geldgeschenkes also

112(25+250+2100+2200+2400+2800+1600)=393,75 Euro.{\displaystyle {\tfrac {1}{12}}\left(25+2\cdot 50+2\cdot 100+2\cdot 200+2\cdot 400+2\cdot 800+1600\right)=393{,}75{\text{ Euro.}}}

Tauscht Herr Schmidt in jedem Fall, so ändert sich sein Erwartungswert nicht, da er insbesondere auch den Betrag von 1600 Euro tauscht, obwohl er in diesem Fall nichts gewinnen kann. Vermutet Herr Schmidt aber, dass wohl kaum mehr als 1000 Euro im Umschlag sind, und entscheidet sich daher, dann und nur dann zu tauschen, wenn höchstens 500 Euro im Umschlag sind, so ändern sich die Wahrscheinlichkeiten: Nach dem Tausch hat Herr Schmidt dann weiterhin mit Wahrscheinlichkeit112{\displaystyle {\tfrac {1}{12}}} den Betrag 25 Euro im Umschlag, ebenso mit Wahrscheinlichkeit je212{\displaystyle {\tfrac {2}{12}}} einen der Beträge 50, 100 oder 200 Euro, den Betrag von 400 Euro allerdings nur noch mit Wahrscheinlichkeit112{\displaystyle {\tfrac {1}{12}}} (da Herr Schmidt bei 800 Euro nicht mehr tauscht), dafür aber mit Wahrscheinlichkeit312{\displaystyle {\tfrac {3}{12}}} den Betrag von 800 Euro und wieder mit Wahrscheinlichkeit112{\displaystyle {\tfrac {1}{12}}} den Betrag 1600 Euro. Der Erwartungswert des Geldgeschenkes ist nun also

112(25+250+2100+2200+1400+3800+1600)=427,08 Euro.{\displaystyle {\frac {1}{12}}\left(25+2\cdot 50+2\cdot 100+2\cdot 200+1\cdot 400+3\cdot 800+1600\right)=427{,}08{\text{ Euro.}}}

Schätzt Herr Schmidt die Situation besser ein und beschließt, erst ab 1000 Euro aufs Tauschen zu verzichten, kann er den Erwartungswert sogar auf 460,62 Euro erhöhen; wird er aber zu gierig und tauscht beispielsweise bis zu 2000 Euro, so fällt er wieder auf den Ausgangswert 393,75 Euro zurück.

Für Herrn Schmidt ist es natürlich schwierig, Herrn Lemke richtig einzuschätzen; wesentlich ist aber, dass das Paradoxon verschwindet, sobald man irgendeine konkrete Wahrscheinlichkeitsverteilung annimmt. Je nach Tauschstrategie von Herrn Schmidt ändert sich der Erwartungswert des Geldgeschenks; die Strategie „Tausche immer“ ist aber gleich gut (oder schlecht) wie die Strategie „Tausche nie“.

Stetige Verteilungen

[Bearbeiten |Quelltext bearbeiten]

Im Falle, dass der kleinere GeldbetragZ{\displaystyle Z} (und damit auchX{\displaystyle X} undY{\displaystyle Y}) einestetige Verteilung besitzt, ergeben sich im Wesentlichen qualitativ die gleichen Ergebnisse, allerdings können die obigen Formeln für den diskreten Fall nicht einfach analog übernommen werden.[7]

Außerdem muss beachtet werden, dass im stetigen Fall das bedingende Ereignis{X=x}{\displaystyle \{X=x\}} für allex{\displaystyle x} die Wahrscheinlichkeit null hat, so dass nicht mehr die elementaren Definitionen für die bedingte Wahrscheinlichkeit und den bedingten Erwartungswert verwendet werden können, sondern abstraktere Versionen benutzt werden müssen.

Es bezeichnef{\displaystyle f} dieDichtefunktion vonZ{\displaystyle Z}. Die VariablenX{\displaystyle X} undY{\displaystyle Y} haben dann beide die gleiche Dichteg{\displaystyle g} und es gilt

g(x)=12f(x)+14f(x2).{\displaystyle g(x)={\frac {1}{2}}f(x)+{\frac {1}{4}}f\left({\frac {x}{2}}\right)\,.}

Im Vergleich zum diskreten Fall erscheint vielleicht der Faktor14{\displaystyle {\tfrac {1}{4}}} zunächst überraschend. Allerdings wäre die durch den „analog“ gebildeten Ausdruckg~(x):=12f(x)+12f(x/2){\displaystyle {\tilde {g}}(x):={\tfrac {1}{2}}f(x)+{\tfrac {1}{2}}f(x/2)} definierte Funktion nicht einmal eine Wahrscheinlichkeitsdichte. Die korrekte Formel erhält man beispielsweise durch Betrachten derVerteilungsfunktionenF(x)=P(Zx){\displaystyle F(x)=P(Z\leq x)} undG(x)=P(Xx){\displaystyle G(x)=P(X\leq x)}. Da die Auswahl der Umschläge mit gleicher Wahrscheinlichkeit und unabhängig vonZ{\displaystyle Z} erfolgt, gilt

P(Xx)=12P(Zx)+12P(2Zx),{\displaystyle P(X\leq x)={\frac {1}{2}}P(Z\leq x)+{\frac {1}{2}}P(2Z\leq x)\,,}

also

G(x)=12F(x)+12F(x/2).{\displaystyle G(x)={\frac {1}{2}}F(x)+{\frac {1}{2}}F(x/2)\,.}

Differenzieren nachx{\displaystyle x} ergibt wegenG(x)=g(x){\displaystyle G'(x)=g(x)} undF(x)=f(x){\displaystyle F'(x)=f(x)} obige Formel fürg{\displaystyle g}.

Als bedingte Wahrscheinlichkeit, dass Herr Schmidt im anderen Umschlag den doppelten Betrag findet, kann nun

P(Y=2xX=x)=2f(x)2f(x)+f(x/2){\displaystyle P(Y=2x\mid X=x)={\frac {2f(x)}{2f(x)+f(x/2)}}}

und entsprechend für den anderen Fall

P(Y=x/2X=x)=12f(x)2f(x)+f(x/2)=f(x/2)2f(x)+f(x/2){\displaystyle P(Y=x/2\mid X=x)=1-{\frac {2f(x)}{2f(x)+f(x/2)}}={\frac {f(x/2)}{2f(x)+f(x/2)}}}

gesetzt werden.[7]

Damit erhält man

E(YX=x)=2x2f(x)2f(x)+f(x/2)+x2f(x/2)2f(x)+f(x/2)=8f(x)+f(x/2)4f(x)+2f(x/2)x.{\displaystyle E(Y\mid X=x)=2x{\frac {2f(x)}{2f(x)+f(x/2)}}+{\frac {x}{2}}\cdot {\frac {f(x/2)}{2f(x)+f(x/2)}}={\frac {8f(x)+f(x/2)}{4f(x)+2f(x/2)}}\cdot x\,.}

als mögliche Version des bedingten Erwartungswerts.Somit giltE(YX=x)>x{\displaystyle E(Y\mid X=x)>x} genau dann, wennf(x)>14f(x/2){\displaystyle f(x)>{\tfrac {1}{4}}f(x/2)} ist.

Wird beispielsweise fürZ{\displaystyle Z} einestetige Gleichverteilung auf dem Intervall[25,800]{\displaystyle [25,800]} angenommen, so ergibt sich

E(YX=x)={2xfür25x<50,32xfür50x800,x2für800<x1600.{\displaystyle E(Y\mid X=x)={\begin{cases}2x&{\mbox{für}}\quad 25\leq x<50,\\{\frac {3}{2}}x&{\mbox{für}}\quad 50\leq x\leq 800,\\{\frac {x}{2}}&{\mbox{für}}\quad 800<x\leq 1600.\end{cases}}}

Der erste und der dritte Fall sind anschaulich klar: Wenn im geöffneten Umschlag weniger als 50 Euro sind, muss es sich um den kleineren der beiden Beträge handeln, bei mehr als 800 Euro um den größeren. Im mittleren Fall ist hingegen ein Vergleich mit dem diskreten Fall interessant, denn einediskrete Gleichverteilung vonZ{\displaystyle Z} auf der Menge{25,26,27,,800}{\displaystyle \{25,26,27,\ldots ,800\}} ergibt in diesem Bereich nur54x{\displaystyle {\tfrac {5}{4}}x} für geradesx{\displaystyle x}, aber2x{\displaystyle 2x} für ungeradesx{\displaystyle x} als bedingten Erwartungswert.

Es existieren auch stetige Verteilungen, so dass formalE(YX=x)>x{\displaystyle E(Y\mid X=x)>x} für allex{\displaystyle x} gilt. Wie im diskreten Fall hat dannZ{\displaystyle Z} jedoch keinen endlichen Erwartungswert. Ein Beispiel ist die Verteilung vonZ{\displaystyle Z} mit der Dichtef(z)=12z3/2{\displaystyle f(z)={\tfrac {1}{2z^{3/2}}}} fürz1{\displaystyle z\geq 1} (undf(z)=0{\displaystyle f(z)=0} sonst). Hier gilt formal für allex2{\displaystyle x\geq 2}

E(YX=x)=(3221)x1,121x.{\displaystyle E(Y\mid X=x)=\left({\frac {3}{2}}{\sqrt {2}}-1\right)\cdot x\approx 1{,}121x\,.}

Die Formel vom totalen Erwartungswert

[Bearbeiten |Quelltext bearbeiten]

Der diskrete Fall kann durch die Formel vom totalen Erwartungswert anschaulich erklärt werden.[10] Hierzu wird die Ausgangssituation leicht verallgemeinert. Es wird vorab nur angenommen, dass die beiden Umschläge über einen Zufallsprozess simultan mit Geld gefüllt werden und dass einer der beiden Umschläge danach ausgewählt und geöffnet wird. Dazu wird die Notation leicht verändert:

Es sollZ1>0{\displaystyle Z_{1}>0} undZ2>0{\displaystyle Z_{2}>0} sein und die ErwartungswerteE(Z1){\displaystyle \operatorname {E} (Z_{1})} undE(Z2){\displaystyle \operatorname {E} (Z_{2})} sollen existieren.Dann berechnen sich die Erwartungswerte vonX{\displaystyle X} undY{\displaystyle Y} zu:

E(X)=E(Z1)p1+E(Z2)p2undE(Y)=E(Z1)p2+E(Z2)p1{\displaystyle \operatorname {E} (X)=\operatorname {E} (Z_{1})\cdot p_{1}+\operatorname {E} (Z_{2})\cdot p_{2}\quad {\text{und}}\quad \operatorname {E} (Y)=\operatorname {E} (Z_{1})\cdot p_{2}+\operatorname {E} (Z_{2})\cdot p_{1}}

Zuerst wird angenommen, dass der geöffnete Umschlag zufällig auswählt wird. Dann giltp1=p2=12{\displaystyle p_{1}=p_{2}={\tfrac {1}{2}}} und beide Erwartungswerte sind gleich:

E(X)=E(Z1)+E(Z2)2=E(Y){\displaystyle \operatorname {E} (X)={\frac {\operatorname {E} (Z_{1})+\operatorname {E} (Z_{2})}{2}}=\operatorname {E} (Y)}

Die sich durch die zufällige Auswahl der Umschläge ergebenden Wahrscheinlichkeitsverteilungen vonX{\displaystyle X} undY{\displaystyle Y} können immer durch eine Änderung der Verteilung vonZ=(Z1,Z2){\displaystyle Z=(Z_{1},Z_{2})} erreicht werden.Deshalb kann für die folgenden Überlegungeno. B. d. A.p1=1{\displaystyle p_{1}=1} undp2=0{\displaystyle p_{2}=0} angenommen werden. Es wird also immer der erste Umschlag geöffnet und es istX=Z1{\displaystyle X=Z_{1}},Y=Z2{\displaystyle Y=Z_{2}} und somitZ=(X,Y){\displaystyle Z=(X,Y)}.

Nun wird angenommen, dass für jeden möglichen Geldbetrag im geöffneten Umschlag der bedingte Erwartungswert des anderen Umschlags immer größer ist:

E(YX=xi)>xifallsP(X=xi)>0{\displaystyle \operatorname {E} (Y\mid X=x_{i})>x_{i}\quad {\text{falls}}\quad \operatorname {P} (X=x_{i})>0}

Dieses ergibt sich automatisch, wenn man annimmt, dass der andere Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:

P(Y=12xiX=xi)=12undP(Y=2xiX=xi)=12{\displaystyle \operatorname {P} (Y={\tfrac {1}{2}}x_{i}\mid X=x_{i})={\tfrac {1}{2}}\quad {\text{und}}\quad \operatorname {P} (Y=2x_{i}\mid X=x_{i})={\tfrac {1}{2}}}

Denn dann berechnet sich der bedingte Erwartungswert des anderen Umschlags zu:

E(YX=xi)=12xi12+2xi12=54xi>xi{\displaystyle \operatorname {E} (Y\mid X=x_{i})={\tfrac {1}{2}}x_{i}\cdot {\tfrac {1}{2}}+2x_{i}\cdot {\tfrac {1}{2}}={\tfrac {5}{4}}x_{i}>x_{i}}

Aus der Formel vom totalen Erwartungswert folgt nun:

E(Y)=xiE(YX=xi)P(X=xi)>xixiP(X=xi)=E(X){\displaystyle \operatorname {E} (Y)=\sum _{x_{i}}{\operatorname {E} (Y\mid X=x_{i})\operatorname {P} (X=x_{i})}>\sum _{x_{i}}{x_{i}\operatorname {P} (X=x_{i})}=\operatorname {E} (X)}

Zuletzt wird angenommen, dass für jeden möglichen Geldbetrag im anderen Umschlag der bedingte Erwartungswert des geöffneten Umschlags immer größer ist:

E(XY=yj)>yjfallsP(Y=yj)>0{\displaystyle \operatorname {E} (X\mid Y=y_{j})>y_{j}\quad {\text{falls}}\quad \operatorname {P} (Y=y_{j})>0}

Dieses ergibt sich automatisch, wenn man annimmt, dass der geöffnete Umschlag stets den halben oder den doppelten Betrag enthält und dass die bedingten Wahrscheinlichkeiten für beide Ereignismöglichkeiten immer gleichverteilt sind:

P(X=12yjY=yj)=12undP(X=2yjY=yj)=12{\displaystyle \operatorname {P} (X={\tfrac {1}{2}}y_{j}\mid Y=y_{j})={\tfrac {1}{2}}\quad {\text{und}}\quad \operatorname {P} (X=2y_{j}\mid Y=y_{j})={\tfrac {1}{2}}}

Denn dann berechnet sich der bedingte Erwartungswert des geöffneten Umschlags zu:

E(XY=yj)=12yj12+2yj12=54yj>yj{\displaystyle \operatorname {E} (X\mid Y=y_{j})={\tfrac {1}{2}}y_{j}\cdot {\tfrac {1}{2}}+2y_{j}\cdot {\tfrac {1}{2}}={\tfrac {5}{4}}y_{j}>y_{j}}

Aus der Formel vom totalen Erwartungswert folgt nun völlig analog:

E(X)=yjE(XY=yj)P(Y=yj)>yjyjP(Y=yj)=E(Y){\displaystyle \operatorname {E} (X)=\sum _{y_{j}}{\operatorname {E} (X\mid Y=y_{j})\operatorname {P} (Y=y_{j})}>\sum _{y_{j}}{y_{j}\operatorname {P} (Y=y_{j})}=\operatorname {E} (Y)}

Das Umtauschparadoxon lebt einzig und allein von der Tatsache, dass diese drei Annahmen nicht miteinander verträglich sind:

DasPrinzip vom unzureichenden Grund bietet jedoch eine Lösung für dieses Problem an.Es besagt ja nur, dassohne Vorliegen weiterer Informationen eine diskrete Gleichverteilung für die unbekannten Eintrittswahrscheinlichkeiten anzusetzen sei.Es gibt jedoch einen Grund, nicht die Gleichverteilung anzusetzen, wenn man schon die Information hat, dass der geöffnete Umschlag zufällig auswählt wird und dass somitE(X)=E(Y){\displaystyle \operatorname {E} (X)=\operatorname {E} (Y)} ist:Um nicht in den Widerspruch zu geraten, dass auchE(Y)>E(X){\displaystyle \operatorname {E} (Y)>\operatorname {E} (X)} oderE(X)>E(Y){\displaystyle \operatorname {E} (X)>\operatorname {E} (Y)} ist.Nimmt man anstelle der Gleichverteilung an, dass die bedingte Wahrscheinlichkeit für den kleineren Geldbetrag immer doppelt so groß wie für den größeren Geldbetrag ist, ergibt sich dieser Widerspruch nicht, denn aus

P(Y=12xiX=xi)=23undP(Y=2xiX=xi)=13{\displaystyle \operatorname {P} (Y={\tfrac {1}{2}}x_{i}\mid X=x_{i})={\tfrac {2}{3}}\quad {\text{und}}\quad \operatorname {P} (Y=2x_{i}\mid X=x_{i})={\tfrac {1}{3}}}

folgt stets

E(YX=xi)=12xi23+2xi13=xi{\displaystyle \operatorname {E} (Y\mid X=x_{i})={\tfrac {1}{2}}x_{i}\cdot {\tfrac {2}{3}}+2x_{i}\cdot {\tfrac {1}{3}}=x_{i}}

und somit auch

E(Y)=E(X){\displaystyle \operatorname {E} (Y)=\operatorname {E} (X)}.

Genauso ergibt sich aus

P(X=12yjY=yj)=23undP(X=2yjY=yj)=13{\displaystyle \operatorname {P} (X={\tfrac {1}{2}}y_{j}\mid Y=y_{j})={\tfrac {2}{3}}\quad {\text{und}}\quad \operatorname {P} (X=2y_{j}\mid Y=y_{j})={\tfrac {1}{3}}}

stets

E(XY=yj)=12yj23+2yj13=yj{\displaystyle \operatorname {E} (X\mid Y=y_{j})={\tfrac {1}{2}}y_{j}\cdot {\tfrac {2}{3}}+2y_{j}\cdot {\tfrac {1}{3}}=y_{j}}

und ebenfalls

E(X)=E(Y){\displaystyle \operatorname {E} (X)=\operatorname {E} (Y)}.

Ein einfaches Beispiel illustriert, wie sehr man mit der scheinbar plausiblen Annahme einer Gleichverteilung bei den bedingten Wahrscheinlichkeiten danebenliegen kann.Dazu werden die Umschläge immer mit 100 und 200 Euro befüllt.Es wird also einebivariateZweipunktverteilung vonZ=(X,Y){\displaystyle Z=(X,Y)} angenommen:

P(Z=(100,200))=P(X=100,Y=200)=12{\displaystyle \operatorname {P} (Z=(100,200))=\operatorname {P} (X=100,Y=200)={\tfrac {1}{2}}}
P(Z=(200,100))=P(X=200,Y=100)=12{\displaystyle \operatorname {P} (Z=(200,100))=\operatorname {P} (X=200,Y=100)={\tfrac {1}{2}}}

Dann ergeben sich die folgenden bedingten Wahrscheinlichkeiten:

P(Y=50X=100)=0undP(X=50Y=100)=0{\displaystyle \operatorname {P} (Y=50\mid X=100)=0\quad {\text{und}}\quad \operatorname {P} (X=50\mid Y=100)=0}
P(Y=200X=100)=1undP(X=200Y=100)=1{\displaystyle \operatorname {P} (Y=200\mid X=100)=1\quad {\text{und}}\quad \operatorname {P} (X=200\mid Y=100)=1}
P(Y=100X=200)=1undP(X=100Y=200)=1{\displaystyle \operatorname {P} (Y=100\mid X=200)=1\quad {\text{und}}\quad \operatorname {P} (X=100\mid Y=200)=1}
P(Y=400X=200)=0undP(X=400Y=200)=0{\displaystyle \operatorname {P} (Y=400\mid X=200)=0\quad {\text{und}}\quad \operatorname {P} (X=400\mid Y=200)=0}

Von der angenommenen Gleichverteilung sind diese bedingten Wahrscheinlichkeiten meilenweit entfernt.

Anwendung des Zwei-Zettel-Spiels

[Bearbeiten |Quelltext bearbeiten]

In den obigen Beispielen wurde angenommen, dass bekannt ist, nach welchem Prinzip die Geldbeträge verteilt sind. Unter dieser Annahme lassen sich leicht Gewinnstrategien angeben. Die Problemformulierung enthält aber keine Information über die Verteilung. Es gibt allerdings auch eine allgemeine Gewinnstrategie für Herrn Schmidt, die diese Annahme nicht benötigt. Diese Strategie besteht darin, dass Herr Schmidt, bevor er den Umschlag öffnet, eineZufallszahl S wählt. Die Wahrscheinlichkeitsverteilung von S muss dabei eine Dichte haben, die zwischen 0 und unendlich echt größer 0 ist, ist ansonsten aber beliebig. Dann öffnet er den Umschlag und findet den Betrag n. Ist der gefundene Betrag n kleiner gleich S, so tauscht er den Umschlag; ist der Betrag n größer als S, so behält er den Umschlag. Diese Strategie geht aufThomas M. Cover zurück.[11] Wie im ArtikelZwei-Zettel-Spiel erklärt, erhöht er so theoretisch seine Chancen, den größeren Betrag zu erhalten.[12][13]

Angenommen, Herr Schmidt entschließt sich, das Zwei-Zettel-Spiel anzuwenden. Enthalten die Briefumschläge die BeträgeZ{\displaystyle Z} und2Z{\displaystyle 2Z} und öffnet Herr Schmidt zuerst den Umschlag mit InhaltZ{\displaystyle Z}, so wechselt er, fallsSZ{\displaystyle S\geq Z}. Die bedingte Erwartung seines Gewinns beträgt dann

EZ;Z=P(SZ)2Z+P(S<Z)Z=P(SZ)2Z+(1P(SZ))Z=Z(1+P(SZ)).{\displaystyle {\begin{aligned}E_{Z;Z}&=P(S\geq Z)\cdot 2Z+P(S<Z)\cdot Z\\&=P(S\geq Z)\cdot 2Z+\left(1-P(S\geq Z)\right)\cdot Z\\&=Z\left(1+P(S\geq Z)\right).\end{aligned}}}

Öffnet er zuerst den Umschlag mit Inhalt2Z{\displaystyle 2Z}, so wechselt er, fallsS2Z{\displaystyle S\geq 2Z}. Die bedingte Erwartung seines Gewinns beträgt dann

E2Z;Z=P(S2Z)Z+P(S<2Z)2Z=P(S2Z)Z+(1P(S2Z))2Z=Z(2P(S2Z)).{\displaystyle {\begin{aligned}E_{2Z;Z}&=P(S\geq 2Z)\cdot Z+P(S<2Z)\cdot 2Z\\&=P(S\geq 2Z)\cdot Z+\left(1-P(S\geq 2Z)\right)\cdot 2Z\\&=Z\left(2-P(S\geq 2Z)\right).\end{aligned}}}

Insgesamt beträgt die bedingte Erwartung bei fixen Inhalten, aber vor der Wahl des ersten Umschlags

EZ=EZ;Z+E2Z;Z2=32Z+Z2(P(SZ)P(S2Z))=32Z+Z2P(ZS<2Z).{\displaystyle {\begin{aligned}E_{Z}&={\frac {E_{Z;Z}+E_{2Z;Z}}{2}}\\&={\frac {3}{2}}Z+{\frac {Z}{2}}{\Big (}P(S\geq Z)-P(S\geq 2Z){\Big )}\\&={\frac {3}{2}}Z+{\frac {Z}{2}}P(Z\leq S<2Z).\end{aligned}}}

Tauscht er immer oder tauscht er nie, beträgt sein Erwartungswert

Z+2Z2=32Z.{\displaystyle {\frac {Z+2Z}{2}}={\frac {3}{2}}Z.}

Bei Anwendung des Zwei-Zettel-Spieles ist der Erwartungswert also um

Z2P(ZS<2Z){\displaystyle {\frac {Z}{2}}P(Z\leq S<2Z)}

höher als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.

Beispiel

[Bearbeiten |Quelltext bearbeiten]

FürS{\displaystyle S} wählt Herr Schmidt beispielsweise eine Zufallsvariable S, dieexponentialverteilt mit Erwartungswert 1000 ist, alsoP(Ss)=exp(s/1000){\displaystyle P(S\geq s)=\exp(-s/1000)}. Falls die Geldbeträge wie im oben angegebenen Beispiel auf der Menge{25,50,100,200,400,800}{\displaystyle \{25,50,100,200,400,800\}} gleichverteilt sind, ergibt sich insgesamt folgender Erwartungswert des Geldgeschenkes:

Z{\displaystyle Z}2Z{\displaystyle 2Z}pZ{\displaystyle p_{Z}}P(SZ){\displaystyle P(S\geq Z)}EZ;Z{\displaystyle E_{Z;Z}}P(S2Z){\displaystyle P(S\geq 2Z)}E2Z;Z{\displaystyle E_{2Z;Z}}EZ{\displaystyle E_{Z}}3Z/2{\displaystyle 3Z/2}pZEZ{\displaystyle p_{Z}\cdot E_{Z}}
25501/60,97549,3820,95126,21937,80137,56,300
501001/60,95197,5610,90454,75876,16075,012,693
1002001/60,904190,4840,819118,127154,305150,025,718
2004001/60,819363,7460,670265,936314,841300,052,473
4008001/60,670688,1280,449620,268644,198600,0107,366
80016001/60,4491159,4630,2021438,4831298,9731200,0216,496
Summe1421,046

Der Erwartungswert des Geldgeschenkes beträgt bei dieser Vorgangsweise also 421,046 Euro. Das ist zwar weniger als bei der optimalen Strategie (tausche bei weniger als 1000 Euro), bei der der Erwartungswert 460,62 Euro beträgt; aber jedenfalls mehr als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise, bei der der Erwartungswert 393,75 Euro beträgt. Wie aus der Tabelle ersichtlich, ist in jeder ZeileEZ{\displaystyle E_{Z}} größer als32Z{\displaystyle \textstyle {\frac {3}{2}}Z}. Der genaue Erwartungswert hängt natürlich stark von der Wahl der Verteilung vonS{\displaystyle S} ab, ist aber immer größer als bei der „Tausche-nie“ oder „Tausche-immer“-Vorgangsweise.

Siehe auch

[Bearbeiten |Quelltext bearbeiten]

Verwandte Themen, bei denen man aus Teilinformationen die optimaleEntscheidung des Restproblems treffen kann:

Weblinks

[Bearbeiten |Quelltext bearbeiten]

Einzelnachweise

[Bearbeiten |Quelltext bearbeiten]
  1. Maurice Kraitchik:La mathématique des jeux ou récréations mathématiques. 1953
  2. Martin Gardner:Aha! Gotcha. 1982
  3. Barry Nalebuff:Puzzles: the other person’s envelope is always greener. In:Journal of Economic Perspectives. Band 3, 1989,yale.edu (PDF; 205 kB)
  4. Denkfallen und Paradoxa
  5. Denkfallen und Paradoxa:Umtauschparadoxon (Briefumschlag-Paradoxon)
  6. Denkfallen: Umtauschparadoxon. (PDF) hs-fulda.de
  7. abcdDavid J. Chalmers:The Two-Envelope Paradox: A Complete Analysis?
  8. Robert B. Ash:Real Analysis and Probability. Academic Press, New York 1972,ISBN 0-12-065201-3, S. 246, 6.3.5 (2)
  9. Michael Clark, Nicholas Shackel, PhilArchive:The Two-envelope Paradox
  10. Christoph Luchsinger:Einführung in die Statistik. Lemma 3.12, S. 70
  11. Franz Thomas Bruss:Der Ungewissheit ein Schnippchen schlagen. In:Spektrum der Wissenschaft. Band 6/2000, S. 106–107.
  12. R. Christensen, J. Utts:Bayesian Resolution of the Exchange Paradox. In:The American Statistician. 1992
  13. Dov Samet, Iddo Samet, David Schmeidler:One Observation behind Two-Envelope Puzzles. (PDF; 89 kB)
Abgerufen von „https://de.wikipedia.org/w/index.php?title=Umtauschparadoxon&oldid=260651275
Kategorien:

[8]ページ先頭

©2009-2025 Movatter.jp