Wenn man einen Blog schreibt, gibt es hin und wieder wahre Glücksmomente. Neben normalen Kommentaren kommen nämlich manchmal auch Rückmeldungen, die man so nicht erwartet hat. Anfang April bekam ich eine lange E-Mail zu meinem Artikel „Berlin-Marathon – Wie viel Glück braucht man, um einen Startplatz zu bekommen?“ aus dem Jahr 2014. Damals hatte ich mich darüber ausgelassen, wie unwahrscheinlich es durch das eingeführte Losverfahren sei, jemals in den Jubilee-Club (für 10 erfolgreiche Teilnahmen) zu kommen. Meine im Artikel angestellten rudimentären Wahrscheinlichkeitsrechnungen hat Marcel nun in seiner E-Mail an mich so ausführlich und präzise korrigiert und ergänzt, dass ich völlig geflasht war und sie nun unbedingt an dieser Stelle wiedergeben muss…
Er schrieb:
Du hast zwar recht, dass die Wahrscheinlichkeit p, bei einem Versuch ausgelost zu werden, 32.000/75.000 und somit ca. 42,7 % sind. Auch stimmt der Ansatz, dass unabhängie Wiederholungen Multiplikationen bedeuten. Mit zwei Versuchen zwei mal ausgelost zu werden, bedeutet also p*p, also rund 18,2 %.
Allerdings hast du danach meiner Meinung nach einen Denkfehler: Ja, um 5 mal in Folge ausgelost zu werden, ist die Wahrscheinlichkeit p5, und somit nur noch um 1,4%. Allerdings gibt es ja nicht nur die Option 5 mal in Folge ausgelost zu werden oder gar nicht: Die Wahrscheinlichkeit 4 von 5 mal ausgelost zu werden ist immerhin auch noch ca. 9,5%. Genauer gesagt p4*(1-p)*5.
Das kann man sich gut herleiten, wenn man den Fall mit zwei Versuchen komplett durchrechnet: Es gibt insgesamt 4 Ausgänge:
- beide Male ausgelost,
- nur beim ersten Mal ausgelost,
- nur beim zweiten Mal ausgelost,
- beide Male nicht ausgelost.
Fall 1 hast du mit p2=p*p schon ausgerechnet. Das waren die 18,2%.
Für Fall 2 rechnen wir genauso, aber mit der Wahrscheinlichkeit, dass man nicht ausgelost wird, also der Gegenwahrscheinlichkeit von p, 1-p: (1-p)2 ist ca. 32,9%. Zusammengerechnet machen diese beiden Fälle aber „nur“ ca. 51,1% der Gesamtwahrscheinlichkeit aus. Die verbliebenen 48,9% gehen also für Fall 2 und 3 drauf. Da beide Versuche unabhängig sind (eine Auslosung im Vorjahr hat keinen Einfluss auf die Verlosung im Folgejahr) sind diese beiden Fälle gleich wahrscheinlich. Wir können also in diesem Fall „einfach“ (1 – (p2 + (1-p)2)) / 2 rechnen und kommen auf jeweils ca. 24,5%. Das ist eine gute Probe für folgende Herleitung: Für „genau 1 von 2 mal“ brauchen wir „1 mal ja“ und „1 mal nein“, also erst einmal p * (1-p). Das ergibt genau die ca. 24,5% für jeweils Fall 3 oder Fall 4. Für die Gesamtwahrscheinlichkeit müssen wir diese aufaddieren, also p * (1-p) + p * (1-p) bzw. p * (1-p) * 2.
Jetzt können wir das ganze nochmal für drei Versuche anschauen: Alle drei zu gewinnen ist wieder p3, alle drei zu verlieren (1-p)3. Genau einmal von drei Versuchen ausgelost zu werden ist dann p * (1-p)2 multipliziert mit der Anzahl der Fälle. Umgekehrt dann eben p2 * (1-p). Die Anzahl der Fälle ist bei drei Versuchen dann 3: Wir haben drei Versuche und je einer davon ist „anders“ als die anderen. Entweder hat es genau einmal geklappt oder genau einmal nicht.
Wir können uns also fragen, wie viele Optionen es gibt, zwei X und ein O aufzuschreiben:
- XXO
- XOX
- OXX
Es ergeben sich also folgende Wahrscheinlichkeiten bei 3 Versuchen:
– gar nicht ausgelost: (1-p)3 = ~18,8%,
– einmal ausgelost: p * (1-p)2 * 3 = ~ 42,1%,
– zweimal ausgelost: p2 * (1-p) * 3 = ~31,3%,
– und alle drei mal ausgelost: p3 = ~7,8%,
macht insgesamt genau 100%.
Allgemein gilt die Formel pk * (1-p)(n-k) * X, wobei n die Anzahl der Versuche, k die Anzahl der Erfolge, und X die Anzahl der Möglichkeiten, k Positionen aus n Plätzen zu ziehen. Diese Anzahl nennt man den Binomialkoeffizienten und man kann sich vom sog. Pascalschen Dreieck herleiten, dass X = n! / (k! * (n – k)!) ist, wobei x! die sog. Fakultätsfunktion ist, die alle ganzen Zahlen von 1 bis x aufmultipliziert. Am Ende ergibt sich also für (genau) k Erfolge aus n Versuchen eine Wahrscheinlichkeitsformel von pk * (1-p)(n-k) * (n! / (k! * (n – k)!)), der sog. Binomialverteilung.
Was uns aber wirklich interessiert, ist nicht, wie hoch die Wahrscheinlichkeit ist, ein bestimmtes Ergebnis zu beobachten, sondern wie lange wir warten müssen, um eine bestimmte Anzahl an Erfolgen zu haben. Das regelt der sog. Erwartungswert und der ist trotz der komplizierten Formel der Binomialverteilung überraschend einfach und intuitiv: E = n * p.
Das heißt im Durchschnitt erwarten wir nach n Versuchen, n * p Erfolge. Bei 5 Versuchen 5 mal ausgelost zu werden ist also zwar mit ca. 1,4% sehr unwahrscheinlich, allerdings können wir nach 5 Versuchen mit durchschnittlich p * 5 = ~2,1 Teilnahmen rechnen. Dividieren wir beide Seiten dieser Gleichung mit p (was wir können, solange die Erfolgswahrscheinlichkeit nicht Null ist), erhalten wir E / p = n.
Das heißt für einen Erwartungswert von E = 10 erfolgreichen Auslosungen müssen wir im Durchschnitt an 10 / p = ~ 23,4 Verlosungen teilnehmen.
Bei einem Mindestteilnahmealter von 18 Jahren, kann es der durchschnittlich (un-)glückliche Athlet also vor seinem 42. Geburtstag in den Jubilee-Club schaffen, vorausgesetzt, er schafft es bei jeder Teilnahme ins Ziel. Man kann auch noch ein paar Jahre dazu rechnen, um verletzungsbedingte Verschiebungen einzuplanen, aber da wird ja jeweils nur ein Jahr übersprungen, da der Startplatz im Folgejahr ohne Losverfahren sicher ist. Man muss also auf keinen Fall eine überdurchschnittliche Lebenserwartung haben.
Das geht jetzt alles von durchschnittlichem Losglück aus. Man kann natürlich auch Fragen stellen wie „Wie wahrscheinlich ist es, nach n versuchen mindestens k mal ausgelost zu werden?“ Oder „Wie oft muss ich an der Verlosung teilnehmen, um mit einer Wahrscheinlichkeit von 90% oder höher mindestens 10 mal ausgelost zu werden“. Dafür braucht man dann jedoch die sog. kumulative Dichtefunktion, für die es bei der Binomialverteilung keine geschlossene Formel gibt. Es gibt Abschätzungen nach oben und unten, wie z.B. die Chenoff-Ungleichung, aber da wird es dann echt kompliziert.
Ich hoffe, das war informativ und nicht zu verwirrend. Vielen Dank für die interessanten Artikel und eine gute Laufsaison 2022!
Und so endete die Mail von Marcel. Beeindruckend. Jetzt ist alles klar, oder? Ihr müsst euch nur 24 Jahre lang beim Berlin-Marathon anmelden, um mit durchschnittlichem Losglück – und der richtigen Marathon-Form – in den Jubilee-Club zu kommen!
PS: Der Text wurde von mir durch Absätze, Hervorhebungen und Links strukturiert/ergänzt. Nochmals vielen Dank an dich, Marcel!
@Marcel: dröge Statistik anschaulich erklärt – SUPER!