Expected Value beim Wüfeln

Bei der Einstellung von Datenwissenschaftlern ist es durchaus üblich, einige Interviewfragen über Wahrscheinlichkeiten zu stellen. Bei dieser Stelle geht es um ein Wahrscheinlichkeitsquiz. Betrachten wir die folgende Frage:

” Sie haben die Möglichkeit, bis zu dreimal zu würfeln. Sie erhalten den Nennwert des Würfels. Sie haben die Möglichkeit, nach jedem Wurf anzuhalten und mit dem verdienten Geld zu gehen. Der Verdienst ist nicht additiv.

Wie hoch ist der erwartete Gewinn beim Würfeln?

Dies ist eine knifflige Frage, da die zu erwartende Auszahlung von der Strategie des Spielers abhängt. Wir werden eine Lösung anbieten, die davon ausgeht, dass wir es mit einem „rationalen“ Spieler zu tun haben, der versucht, die erwartete Auszahlung zu maximieren.

Ein Würfel

Nehmen wir an, dass der Spieler nur einen Wurf hat. Dann wäre die erwartete Rendite:

Wurf1=(1+2+3+4+5+6)/6=3,5

Die erwartete Auszahlung für einen Wurf beträgt also 3,5

Zwei Würfel

Nehmen wir nun an, dass der Spieler die Möglichkeit hat, bis zu 2 Würfe zu machen. Die beste Strategie für ihn wäre es, erneut zu würfeln, wenn sein Ergebnis geringer ist als der erwartete Wert des „Einen Wurfes“, der 3,5 beträgt. Mit anderen Worten, wenn er 4, 5 oder 6 hat, sollte er sie behalten und wenn er 1, 2 oder 3 hat, sollte er es noch einmal versuchen. In diesem Fall ist also die erwartete Auszahlung:

Wurf2=(Wurf1+Wurf1+Wurf1+4+5+6)/6=(3.5+3.5+3.5+4+5+6)/6=4.25

Die erwartete Auszahlung von zwei Rollen beträgt also 4,25

Drei-Würfel

Nehmen wir nun an, dass der Spieler die Möglichkeit hat, bis zu 3 Würfe zu machen. Die beste Strategie für ihn wäre es, erneut zu würfeln, wenn sein Ergebnis geringer ist als der erwartete Wert des „Zwei-Wurfes“, der 4,25 beträgt. Mit anderen Worten, wenn er 5 oder 6 hat, sollte er sie behalten und wenn er 1, 2, 3 oder 4 hat, sollte er es noch einmal versuchen. In diesem Fall ist also die erwartete Auszahlung:

Rolle3=(Rolle2+Rolle2+Rolle2+Rolle2+5+6)/6=(4.25+4.25+4.25+4.25+4.25+5+6)/6≅4.67

Die erwartete Auszahlung von drei Rollen beträgt also 4,67, was die Antwort auf unser Problem ist! Rekursiv können wir diese Frage für n>3 beantworten. Da n immer größer wird, wird sich Expected Value oder die Rendite eindeutig dem Maximalwert annähern, der 6 beträgt.