...Bitte nur mathematisch betrachten und erklären.
Einmal habe ich 1000 Fälle bei denen Ereignis x mit 20% Wahrscheinlichkeit Eintritt.
Beim zweiten Fall habe ich 5 Fälle bei denen Ereignis x mit 20% Wahrscheinlichkeit Eintritt.
Ist die Chance eine Abweichung zu der 20% Wahrscheinlichkeit bei 5 Fällen zu haben nicht deutlich höher?
Die Menge der Fälle ist doch bei Wahrscheinlichkeitsrechnung und derer Verlässlichkeit im Ergebnis ziemlich wichtig?
Vorab: Ihr bezieht Euch anscheinend auf einen anderen Post - den habe ich nicht gelesen, ich habe keine Ahnung, worüber Ihr Euch streitet. Das will ich auch gar nicht wissen. Und Carstens Auffassung, Mathe und Stochastik seien uninteressant, teile ich überhaupt nicht- im Gegenteil, das ist total spannend und, richtig angewandt, ein sehr hilfreiches Mittel (Hunde sind aber auch schön). Zur Mathematik kann ich etwas sagen:
In der oben von Ben geschilderten Konstellation kann man die Anzahl der Fälle, in denen das Ereignis eintritt, als Zufallsvariable auffassen. Die folgt dann (freilich nur, wenn man unterstellt, dass die Ereignisse stochastisch unabhängig sind) einer
Binomialverteilung. Bei einer Stichprobe vom Umfang 5 betragen die Wahrscheinlichkeiten, dass das Ereignis
gar nicht eintritt: 32,77 %,
genau einmal eintritt: 40,96 %,
genau zweimal eintritt: 20,48 %,
genau dreimal eintritt: 5,12 %,
genau viermal eintritt: 0,64 % und
sogar fünfmal eintritt: 0,03 %.
Hat man eine Stichprobe vom Umfang 1000, so kann man die einzelnen Wahrscheinlichkeiten genauso ausrechnen (nämlich, wenn man die genaue Anzahl von Treffern k nennt, als (1000 über k) x 0,2 hoch k x 0,8 hoch (1000-k), wobei k jeweils für die Werte von 0 bis 1000 steht. Die Gleichungen, die fragnix oben angegeben hat, sind richtig, bei der zweiten hat er sich allerdings gehörig verrechnet). Die Liste wird entsprechend länger und die einzelnen Wahrscheinlichkeiten viel viel viel kleiner. Gut handhabbar ist das nicht mehr.
Je größer die Stichprobe wird, desto mehr ähnelt die Binomialverteilung einer
Normalverteilung, hier mit einem Mittelwert von Stichprobengröße * 0,2 und einer Standardabweichung von Wurzel aus (Stichprobengröße * 0,2 * 0,8). Bei der Normalverteilung ist es nun so, dass fast alle Zufallswerte in dem Intervall Mittelwert plus/minus 3 x Standardabweichung liegen. Um bei Bens Zahlen zu bleiben: In der Konstellation sind Werte zwischen 162 und 238 (200 +/- 3x Wurzel aus 160) zu erwarten - obgleich theoretisch Werte zwischen 0 und 1000 möglich sind. Der theoretisch mögliche Bereich wird also nur zu einem recht kleinen Teil abgedeckt. Anders als bei einer Stichprobe vom Umfang 5, da kommen die Werte 0, 1 und 2 ganz schön häufig vor, selbst die drei tritt noch mit einer gewissen Wahrscheinlichkeit ein, nur die 4 und die 5 kann man als eher unwahrscheinlich ausschließen.
Bens Vermutung, dass die Menge der Fälle (der Stichprobenumfang) für das Ergebnis ziemlich wichtig ist, trifft zu.
Viele Grüße
Heike