6  Grundlagen der Wahrscheinlichkeitsrechnung

6.1  Einführung

Am Ende des 5. Kapitels lesen wir: „Im Bereich ± 1 * liegt mit 68,28%iger Wahrscheinlichkeit der Mittelwert µ der Grundgesamtheit“. Wir sind an der Stelle nicht näher auf die Bedeutung des Begriffs Wahrscheinlichkeit eingegangen. Wir wollen das nun nachholen und uns soweit mit dem Thema beschäftigen, dass wir dabei zu einem Grundverständnis des Begriffs Wahrscheinlichkeit gelangen. Das Wort wird in der Umgangssprache häufig verwendet um anzudeuten, wie die Chancen dafür stehen, dass ein Ereignis eintreten könnte. In Redewendungen sagen wir ein zukünftiges Ereignis träte wahrscheinlich ein, sehr wahrscheinlich ein, mit an Sicherheit grenzender Wahrscheinlichkeit ein oder es wäre eher unwahrscheinlich, dass es einträte. Ein paar Situationen zeigen dies:
  1. Um meine Kopfschmerzen zu unterdrücken nehme ich Medikament X und sage, dass dann die Symptome wahrscheinlich zurückgehen.
  2. Bei dieser Wettersituation wage ich die Vorhersage, dass es in etwa einer halben Stunde sehr wahrscheinlich ein Gewitter geben wird.
  3. Wenn ich einen sechsseitigen Würfel werfe, kann ich intuitiv voraussagen, dass mit einer Wahrscheinlichkeit von 16,7 % die Ziffer 5 oben liegen wird.
  4. Wenn ich beim Roulette meinen Einsatz auf noir plaziere, dann weiß ich, dass die Wahrscheinlichkeit zu gewinnen gleich 48,65 % ist.
  5. Ich lese in einem Protokoll: "Der Unterschied in der Wirkung der beiden Medikamente ist mit 99%iger Wahrscheinlichkeit signifikant."
  6. Oder ich lese: "Mit 5%iger Irrtumswahrscheinlichkeit liegt der Erwartungs-wert µ zwischen 13,6 mm und 14,2 mm."
Bei A und B kann ich mich auf Empirie stützen. Meine Erfahrungen reichen aber nicht aus, um die Wahrscheinlichkeitsaussagen zu quantifizieren. Zahlen sind aber notwendig, wenn ich mit Wahrscheinlichkeiten rechnen muss.

Anders ist die Situation in den Fällen C und D. Hier kann ich ohne jede eigene Erfahrung auf dem Gebiet, also ohne die Experimente je selber durchgeführt zu haben, intuitiv einen Zahlenwert für die Wahrscheinlichkeit nennen.

Und bei E und F konnten wir, wie auch bei den Aussagen zum Standardfehler des Mittelwertes in Kapitel 5 – nach vorangegangenen Berechnungen -, präzise Wahrscheinlichkeitsangaben machen. Offensichtlich gibt es Situationen, in denen wir quantitative Wahrscheinlichkeiten angeben können und solche, in denen das zunächst einmal nicht geht.


6.2  Wozu benötigen wir Wahrscheinlichkeitsangaben in der Statistik

In der deskriptiven Statistik benötigen wir quantitative Wahrscheinlich-keitsangaben um z. B. den Konfidenzbereich zu berechnen. Das ist der Bereich um den Mittelwert herum, in dem der Erwartungswert µ mit einer bestimmten, z. B. 99%iger Wahrscheinlichkeit liegt. Oder um festzustellen, mit welcher Wahrscheinlichkeit eine beliebige Walnuss (Kapitel 3) weniger als 55,0 g wiegt. Dabei werden wir uns z. B. näher damit beschäftigen, wie man die Form der idealen Normalverteilungskurve berechnen kann. Auch zum Verständnis anderer Verteilungen (Binominalverteilung, Poissonverteilung, t-Verteilung, Chi2-Verteilung) benötigen wir ein Grundverständnis des Begriffs Wahrscheinlichkeit.

In der Inferenzstatistik spielt die Wahrscheinlichkeit z. B. eine Rolle bei Hypothesenprüfungen wie in der folgenden Situation: 12 Mäuse erhielten das Narkotikum A und blieben im Mittel 75 min lang narkotisiert. 12 weitere Mäuse erhielten Narkotikum B und blieben 65 min in Narkose. Auf den ersten Blick wirkt A länger narkotisierend als B. Dieser Unterschied könnte aber zufallsbedingt sein (siehe Zufallsfehler). Zufällig könnten in die A-Gruppe vermehrt solche Tiere gelangt sein, die etwas empfindlicher auf das Narkotikum reagierten und daher im Mittel etwas länger in Narkose geblieben sind. Den Einfluss des Zufalls könnten wir mit einem statistischen Testverfahren prüfen. Obwohl die Messwerte sagen, dass A länger wirkt als B, stellen wir für einen solchen Test die negierende Hypothese auf, dass Präparat A nicht zu einer überzufälligen (statistisch gesicherten = signifikanten) längeren Narkosezeit führt als Präparat B. Wir widersprechen mit der Hypothese also den empirisch erhaltenen Daten. Dann berechnen wir in dem Test mit den Werten der Urliste, mit welcher quantitativen Wahrscheinlichkeits-angabe diese Hypothese abgelehnt werden muss. Das Ergebnis der Berechnung hängt von den Daten der Urliste ab. Es könnte sein, dass wir dann sagen müssen: "Die Hypothese ist falsch, sie wird abgelehnt. Präparat A führt mit 95%iger Wahrscheinlichkeit zu einer längeren Narkose als Präparat B." (Warum die Hypothese negierend aufgestellt wird, das können wir hier in Kürze nicht erklären und verweisen auf ein späteres Kapitel, in dem wir ausführlich darauf eingehen werden.) Ob eine 95%ige Wahrscheinlichkeit ausreicht oder ob wir die Entscheidung mit 99,9%iger Wahrscheinlichkeit absichern wollen, auch darüber reden wir in einem späteren Kapitel. Bei der Prüfung von Medikamenten genügt es eben nicht zu sagen, Präparat A wirkt sehr wahrscheinlich besser als Präparat B. Wir benötigen zur Beurteilung der Wirkung Zahlen und es ist eine Aufgabe der Mathematik, die Wahrscheinlichkeitsangaben zu quantifizieren.


6.3  Der Ursprung der Wahrscheinlichkeitsrechnung

Bevor wir uns näher mit der Frage beschäftigen, was der Begriff Wahrscheinlichkeit bedeutet und wie wir damit rechnen können, wollen wir einen kurzen Blick in die Geschichte der Wahrscheinlichkeitsrechnung werfen und, ohne näher darauf einzugehen, hier einige Namen anführen, die mit diesem Gebiet der Mathematik eng verbunden sind.

Entstanden ist die Wahrscheinlichkeitsrechnung durch die Beschäftigung mit Glücksspielen. Auch wenn es solche schon in frühen Kulturen, etwa bei den Römern, gab, werden die Anfänge der Wahrscheinlichkeitsrechnung von vielen Autoren in das 16. Jahrhundert gelegt, als der italienische Arzt und Mathematiker Gerolamo Cardano 1524 seine Erkenntnisse über Gewinnchancen beim Glücksspiel in „Das Buch vom Würfelspiel“ niederschrieb. Der Überlieferung nach behielt er sein Wissen vor der Veröffentlichung relativ lange für sich und war damit seinen Glücksspielkameraden gegenüber beim Spiel im Vorteil. Es wird berichtet, dass er mit den auf dieser Grundlage erzielten Gewinnen Teile seines Studiums finanziert haben soll. Er kannte die Tücken des Glücksspiels, und ihm wird die Erkenntnis nachgesagt, der größte Vorteil ergebe sich aus dem Spiel, das man gar nicht spielt. Als Geburtsstunde der Wahrscheinlichkeitsrechnung wird aber meist das Jahr 1654 genannt, als die französischen Mathematiker Blaise Pascal und Pierre de Fermat sich auf Fragen eines Glücksspielers, des Chevalier de Méré Antoine Gombaud, zu Gewinnchancen bei Würfelspiel ebenfalls mit diesem Thema beschäftigten. Sie entwickelten die Grundlagen der klassischen Wahrscheinlichkeitsrechnung ohne den Begriff der Wahrscheinlichkeit selber nutzen zu können, sie sprachen von der "Anzahl der Gelegenheiten" bei einem Spiel. Den Begriff der Wahrscheinlichkeit gab es zu diesem Zeitpunkt noch gar nicht, sie legten ja gerade den Grundstein dafür. In der Folgezeit leisteten viele Mathematiker wie Jakob Bernoulli (1713, "Die Kunst des Vermutens"), Bayes, Euler, Poisson, de Moivre, Gauß (1795, "Methode der kleinsten Quadrate") und Laplace (1812, „Mathematische Wahrscheinlichkeitstheorie“), im Zusammenhang mit Glücksspielen, astronomischen und anderen Messungen wichtige Beiträge zum Thema. Die heute wohl als etabliert geltenden axiomatischen Grundlagen der Wahrscheinlichkeitsrechnung entwickelte 1933 der russische Mathematiker Andrei N. Kolmogoroff.


6.4  Begriffserklärungen und Notationen

In diesem Kapitel werden wir nicht viel rechnen, aber wir müssen ein paar Dinge formalistisch darstellen. Da es in der Literatur zur Wahrscheinlichkeitsrechnung leider unterschiedliche Notationen gibt, stellen wir hier einige Begriffserklärungen und die in diesem Kapitel benutzten Notationen vor. Der Zusammenhang der einzelnen Notationen kann an dieser Stelle u. U. noch nicht gesehen werden, er wird aber im Laufe des Textes klar.

Zufallsexperimente
Dies sind z. B. Glücksspiele mit Würfeln, Karten oder Münzen, die wir auch zur Erklärung der Eigenschaften heranziehen, die für Zufallsexperimente gelten.

Notwendige Eigenschaften von Zufallsexperimenten

1. Zufallsexperimente finden unter festgelegten Bedingungen statt.
Der Würfel muss fair sein, das bedeutet, jede Seite muss die gleiche Chance haben, nach einem Wurf oben zu liegen. Genau genommen gibt es das nicht, da jeder technische Herstellungsgang des Würfels prinzipiell fehlerbehaftet ist. Die Regeln des Experimentes müssen immer die gleichen bleiben.

2. Bei einem Zufallsexperiment müssen mindestens zwei unterschiedliche Ergebnisse realisierbar sein.
Bei einem Münzwurf sind es 2, beim sechsseitigen Würfel 6.

3. Alle realisierbaren Ereignisse des Experiments stellen den Ergebnisraum W dar und müssen bekannt sein.
Beim sechsseitigen Würfel enthält W die Ergebnisse 1, 2, 3, 4, 5, 6.

4. Der Ergebnisraum W ist endlich.
Beim sechsseitigen Würfel haben wir nur 6 mögliche Ergebnisse.

5. Jedes Ergebnis muss die gleichen Chancen haben, realisiert werden zu können (Gleichmöglichkeit).
Siehe Punkt 1.
Intuitiv können wir sagen, dass bei einem fairen Würfel keine der Zahlen einen Vorteil hat, oben zu liegen.

6. Es ist prinzipiell nicht vorhersagbar, welches Ereignis bei einem konkreten Wurf realisiert wird.
Diese Forderung ist unmittelbar einsichtig.

7. Das Experiment muss beliebig oft wiederholbar sein.
Wir können, wenn wir genügend Zeit haben, „beliebig“ oft würfeln. Wir müssen es nicht, aber es muss prinzipiell möglich sein und das ist es auch.

Nur wenn diese Eigenschaften gegeben sind, sprechen wir von einem Zufallsexperiment. Zufallsexperimente unterscheiden sich z. B. von physikalischen Experimenten dadurch, dass der Ausgang letzterer aufgrund von Gesetzen kausal determiniert, also exakt vorhersagbar ist. Wenn ich einen Stein aus einem Meter Höhe fallen lasse, dann kann ich – nach vorhergehender Berechnung über das Gravitationsgesetz – mit 100%iger Wahrscheinlichkeit voraussagen, wann er auf dem Boden aufschlägt, nämlich nach 0,452 s. Wenn ich einen Würfel werfe, kann ich dagegen grundsätzlich nicht voraussagen, welche Zahl oben liegen wird, weil hier der Zufall eine Rolle spielt.

Wenn wir den Ausgang des Wurfes eines sechseitigen Würfels (4 liegt oben) in einem Venn-Diagramm (Abb. 1) darstellen, dann sind folgende Begriffe gegeneinander abzugrenzen.
  1. Das Liegenbleiben des Würfels nennen wir ein Ereignis (E oder F).
  2. Das Ereignis E enthält das Ergebnis (4).
  3. Da das Ereignis nur ein Ergebnis enthält, nennen wir es ein elementares Ereignis.
  4. Es gibt sechs verschiedene Möglichkeiten für das „Obenliegen“ einer Ziffer. Die Gesamtheit aller realisierbaren Ergebnisse eines Experiments nennen wir den Ergebnisraum W. Er enthält alle möglichen Ergebnisse des Experiments (1, 2, 3, 4, 5, 6).
  5. Wenn wir mit einem Wurf zwei Würfel werfen, dann hat das folgende Ereignis F die zwei Ergebnisse (5 und 6). Dieses Ereignis F nennen wir ein zusamengesetztes Ereignis.

Abb. 1

P
p
W
Wahrscheinlichkeit (lat. probabilitas)
q
IW
Irrtumswahrscheinlichkeit, Gegenwahrscheinlichkeit
E Eintritt eines Ereignisses. Es können auch andere lateinische Großbuchstaben verwendet werden. Ereignis E ist eine Teilmenge des Ergebnisraumes W.   E Teil W
P(E) Wahrscheinlichkeit für den Eintritt des Ereignisses E
W Omega. Ergebnisraum, der alle möglichen Ereignisse enthält. Er muss für jedes Experiment definiert werden.
|W| Anzahl aller möglichen Ergebnisse in W = n
n Umfang der untersuchten Stichprobe. Anzahl der möglichen Ergebnisse, die in einem Experiment realisiert werden können.
n das kleine griechische n, gesprochen nü, Umfang der Stichprobe
H(E) absolute Häufigkeit von E
h(E) relative Häufigkeit von E
Teil Teilmenge von, wenn A = {gerade Zahlen <10} und B = {6}, dann gilt B Teil A
Negation Negationszeichen, NegationE wird gelesen: nicht E, NegationE ist das Komplement von E.
und „und“ im Sinne von „sowohl als auch“, Schnittmenge EundF (gesprochen E geschnitten F) = Ergebnisse, die sowohl zu E wie auch zu F gehören. Wenn E = {Zahlen <7} und F = {Zahlen <3}, dann gilt EundF = 1 und 2
oder „oder“ im Sinne von „oder/und“ (nicht als „entweder oder“), es ist das nicht ausschließende „oder“ Vereinigungsmenge EoderF (gesprochen E vereinigt F) = Ergebnisse, die in E oder F oder beiden vorkommen. Wenn E = {Zahlen <7} und F = {Zahlen 10 bis 15}, dann gilt EoderF = 1, 2, 3, 4, 5, 6, 10, 11, 12, 13, 14, 15
unmöglich unmögliches Ereignis, leere Menge. Wenn A = Fallen einer 7 bei einem sechsseitigen Würfel sein soll, dann ist das ein unmögliches Ereignis und es gilt P(A) = unmöglich
[1;6] geschlossenes Intervall von 1 bis 6 [einschließlich der beiden Grenzwerte]
]1;6[ offenes Intervall von 1 bis 6 [ausschließlich der beiden Grenzwerte]



6.5  Wahrscheinlichkeit

Der Brockhaus schreibt: "Wahrscheinlichkeit ist ein Maß für den Grad der Möglichkeit noch nicht eingetretener Ereignisse", und bei Jacob Bernoulli können wir lesen: "Die Wahrscheinlichkeit ist nämlich ein Grad der Gewißheit ..." Wie wir sehen werden, beschäftigt sich die Wahrscheinlichkeitsrechnung mit den Gesetzmäßigkeiten des Auftretens von Ereignissen, bei denen der Zufall eine Rolle spielt.

Im Laufe der Zeit haben sich unter verschiedenen Perspektiven diverse Theorien zur Wahrscheinlichkeitsrechnung entwickelt, von denen wir hier drei gegeneinander abgrenzen wollen.
  1. Die empirische Wahrscheinlichkeit
  2. Die klassische Wahrscheinlichkeit
  3. Die axiombasierte Wahrscheinlichkeit
Auf andere "Formen" der Wahrscheinlichkeit gehen wir hier nicht ein.


6.5.1  Die empirische Wahrscheinlichkeit

Es werden auch folgende Begriffe verwendet:
Statistische Wahrscheinlichkeit
a-posteriori-Wahrscheinlichkeit (a-posteriori bedeutet: im Nachhinein, nach einem Experiment berechenbar)

Führen wir uns noch einmal die beiden Sätze A und B aus dem Text weiter oben vor Augen, die Sache mit den Kopfschmerzen und die mit dem Wetter. Je öfter ich solche Situationen erlebt habe, um so größer wird die Sicherheit (Wahrscheinlichkeit), mit der ich Aussagen über das zukünftige Eintreffen von Ereignissen machen kann. Um mit solchen qualitativen Wahrscheinlichkeits-angaben ("Symptome gehen wahrscheinlich zurück" und "sehr wahrscheinlich ein Gewitter") rechnen zu können, müssen wir sie quantifizieren, ihnen also Zahlen zuweisen. Wie wir das machen können, zeigt das folgende Gedankenexperiment in Beispiel 1.

Beispiel 1
Wir wollen wissen, wie groß die Wahrscheinlichkeit dafür ist, dass eine beliebige Person aus der Population X die Blutgruppe A hat. Dazu untersuchen wir eine Zufallsstichprobe von 10 Personen der Population und finden bei zwei Personen die Gruppe A. Da wir den wahren Wert (Erwartungswert für den Prozentsatz von Blutgruppe A in der Population) nicht kennen, zweifeln wir das Ergebnis (2 von 10 = 20 %) nicht an. Aber wir fragen uns, ob der Stichprobenumfang groß genug war, um eine "sichere" Antwort zu erhalten. In unserem Gedankenexperiment verfahren wir nun im Hinblick auf die Erklärung des Begriffs Wahrscheinlichkeit wie folgt. Wir untersuchen neun weitere Zufallsstichproben mit je n = 10. Zusammen haben wir damit 100 Personen untersucht. Die Zählergebnisse H(E) für jede einzelne Stichprobe finden wir in Tabelle 1.

Tabelle 1
Stichprobe12345678910
n10101010101010101010
H(E)21043781044
n = Stichprobenumfang, H(E) = absolute Häufigkeit für Blutgruppe A

Wie wir sehen, schwanken die absoluten Häufigkeiten von Stichprobe zu Stichprobe sehr. Nun werden wir die aufeinanderfolgenden Stichproben der Reihe nach zu Gruppen von 20, 30, 40, . . . 100 zusammenfassen (kumulieren) und erhalten die Tabelle 2, in der die relative Häufigkeit h(E) für das Auftreten von Blutgruppe A nach folgender Formel berechnet ist.

TB S 5o

Tabelle 2
absolute Häufigkeit
H(E)
Stichproben-
umfang
relative Häufigkeit
h(E)
nBlutgruppe An kumulierth(E) = H(E)/n
Stichprobe 12100,200
kumuliert bis St.pr. 212200,600
kumuliert bis St.pr. 316300,533
kumuliert bis St.pr. 419400,475
kumuliert bis St.pr. 526500,520
kumuliert bis St.pr. 634600,567
kumuliert bis St.pr. 735700,500
kumuliert bis St.pr. 835800,438
kumuliert bis St.pr. 939900,433
kumuliert bis St.pr. 10431000,430

Die Abb.2 zeigt die Entwicklung der relativen Häufigkeit bei zunehmendem n. Wir folgern daraus, dass die relativen Häufigkeiten sich mit größer werdendem n einem unbekannten Endwert, dem Erwartungswert, nähern. Dies wird durch die folgende Gleichung ausgedrückt, die folgendermaßen gelesen wird: "Wenn n gegen unendlich strebt, dann nähert sich der Quotient H(E)/n-kumuliert einem Grenzwert P(E)." Hier ist P(E) = 0,43.

TB S 5u

Abb. 2

Die Wahrscheinlichkeit dafür, dass eine beliebige Person aus der Population X die Blutgruppe A hat, wird umso größer, je größer die Zahl der untersuchten Probanden ist. Das führt uns direkt zur empirischen Wahrscheinlichkeit.

  • Die Wahrscheinlichkeit für das Auftreten des Ereignisses Blutgruppe A ist gleich der relativen Häufigkeit für das Auftreten des Ereignisses A bei hinreichend großem n.
  • Die empirische Wahrscheinlichkeit entspricht also der relativen Häufigkeit.
Diese Darstellung der Wahrscheinlichkeit eignet sich gut für Schätzungen von Erwartungswerten empirischer Daten. Eine wesentliche Erkenntnis ist, dass ein Zusammenhang besteht zwischen Stichprobenumfang und der Sicherheit einer Aussage (siehe Kapitel 2). Diesen Zusammenhang hat der Schweizer Mathematiker Jacob Bernoulli mit dem "Gesetz der großen Zahlen" formuliert, welches 1713 posthum veröffentlicht wurde. Es entspricht in etwa der Aussage:

Je mehr empirische Daten vorliegen, desto deutlicher tritt das Typische, welches der untersuchten Erscheinung in der Grundge-samtheit zugrunde liegt, hervor.

Nach der empirischen Untersuchung können wir jetzt zwei Aussagen machen:
  1. Eine beliebige Person der Population hat mit 43%iger Wahrscheinlichkeit die Blutgruppe A.
  2. 43 % der Population haben die Blutgruppe A.
Da wir ja immer von der Stichprobe auf die Population schließen, ist der gefundene Wahrscheinlichkeitswert natürlich nur eine Schätzung für den Erwartungswert – eine Schätzung, die mit steigendem n besser wird. Zu bedenken ist, dass der Schluss als Induktionsschluss immer mit einer Unsicherheit behaftet ist.

Die empirische Wahrscheinlichkeit P(E) für den Eintritt eines Ereignisses E ist
  • der Quotient aus der absoluten Häufigkeit von E dividiert durch den Stichprobenumfang n.

  • die relative Häufigkeit des Ereignisses E bei hinreichend großem n.

    P(E) = H(E)/n = h(E)

Nach der Herleitung der empirischen Wahrscheinlichkeit als relative Häufigkeit nun zur formellen Darstellung der Berechnung der Wahrscheinlichkeit.

In Beispiel 1 ist das die Häufigkeit von Blutgruppe A bezogen auf die Gesamtzahl der untersuchten Personen, also

TB S 6

Im normalen Sprachgebrauch wird die so ermittelte, im Intervall [0;1] liegende Wahrscheinlichkeit oft mit 100 multipliziert damit man eine Prozentangabe erhält.


6.5.2  Die klassische Wahrscheinlichkeit

Es werden auch folgende Begriffe verwendet:
frequentistische Wahrscheinlichkeit
a-priori-Wahrscheinlichkeit (a-priori bedeutet, sie kann vor dem Experiment berechnet werden)

Die klassische Wahrscheinlichkeit entwickelte sich vor einem anderen theoretischen Hintergrund als die empirische Wahrscheinlichkeit und bedarf im Gegensatz zu dieser keiner Empirie. Klassische Wahrscheinlichkeitsaussagen können intuitiv gemacht werden.

Typische Beispiele sind die beschriebenen Zufallsexperimente.
  1. Wenn ich einen sechsseitigen Würfel werfe, dann kann ich intuitiv voraussagen, dass mit einer Wahrscheinlichkeit von 1/6 = 16,7 % die Ziffer 4 oben liegen wird.
  2. Wenn ich eine beliebige Karte aus einem Skatkartenspiel entnehme, dann ist es sofort einleuchtend, dass es sich mit der Wahrscheinlichkeit 4/32 = 12,5% um ein Ass handelt.
  3. Wenn ich beim Roulette meinen Einsatz auf noir plaziere, dann weiß ich, dass meine Chance zu gewinnen gleich 18/37 = 48,65 % ist.
Die klassische Wahrscheinlichkeit wurde, wie wir schon wissen, als ursprüngliches Wahrscheinlichkeitskonzept im Zusammenhang mit Glücksspielen entwickelt. Sie ist eng mit dem Namen Laplace verbunden, der 1812 seine Erkenntnisse in „Mathematische Wahrscheinlichkeitstheorie“ veröffentlichte. Danach sprechen wir von
  1. Laplace-Wahrscheinlichkeiten,
  2. Laplace-Experimenten (Zufallsexperimenten) und
  3. Laplace-Würfeln (faire Würfel).

    Wir wollen an Beispiel 2 in die formelle Berechnung von Laplace-Wahr-scheinlichkeiten einführen.

    Beispiel 2
    Beim einmaligen Wurf eines fairen zehn-seitigen Würfels ist für den Spielausgang eine „2“ günstig. Da der Würfel die Ziffern 0, 1, 2, 3, 4, 5, 6, 7, 8 und 9 trägt, wird eines dieser zehn Ereignisse eintreten. Die Wahrscheinlichkeit, dass es eine 2 ist, beträgt, a priori 1/10 der Gesamtmöglichkeiten, also 1:10 = 0,1. Rechnerisch finden wir den a priori gefundenen Wert wie folgt:

    W = {0,1,2,3,4,5,6,7,8,9} = mögliche Ereignisse
    |W| = 10
    E = {2} = Ereignis Fallen einer „2“, für den Spielausgang günstiges Ergebnis.
    |E| = Anzahl der günstigen Ereignisse = H
    H(E) = 1, denn es gibt nur auf einer Würfelseite eine „2“.

    Nun gilt:

    TB S 7o

    Welche Formel wir anwenden ist unerheblich. Mit der Wahrscheinlichkeit 0,1 = 10 % wird beim nächsten Wurf eine 2 realisiert. Ob der konkrete Wurf dann wirklich eine 2 bringt, das wissen wir nicht, das hängt vom Zufall ab. Auf lange Sicht (Gesetz der großen Zahlen) wird es aber so sein, dass von 100000 Würfen ca. 10000 mal die 2 gewürfelt wird und natürlich auch jede der anderen Ziffern: 0, 1, 3, 4, 5, 6, 7, 8, 9 des Würfels ebenso oft. Sie erinnern sich in diesem Zusammenhang sicher an die Gleichverteilung und daran, dass auch bei den a-posteriori-Wahrscheinlichkeiten das Gesetzt der großen Zahlen eine Rolle spielte. Die Berechnung der klassichen Wahrscheinlichkeit führt zum gleichen Ergebnis wie die der empirischen Wahrscheinlichkeit.

    Wir müssen aber beachten: Voraussagen im Sinne der Laplace-Wahrscheinlichkeit können nur gemacht werden, wenn die folgende beiden Voraussetzungen gegeben sind:
    1. Jedes mögliche Ereignis muß a-priori die gleiche Chance haben.
    2. Der Ergebnisraum, d. h. die Anzahl der möglichen Ereignisse muss endlich sein.
    Und damit kommt für die Praxis ein Problem. Diese beiden Voraussetzungen bzw. Einschränkungen führen dazu, dass die Berechnung von Laplace-Wahr-scheinlichkeiten nur bedingt anwendbar ist, da die Praxis diese beiden Voraussetzungen, abgesehen von Glücksspielen, nirgendwo bietet. Wenn wir 10 Mäuse mit einem Medikament behandeln welches die Entwicklung der Blutzellen beeinflußt, dann haben nicht alle 10 Tiere die gleichen Chancen identisch darauf zu reagieren. Der Stoffwechsel der einzelnen Tiere unterliegt der interindividuellen biologischen Variation. Wir wählen die Tiere zwar at random, aber das führt nicht in diesem Sinne zu gleichen Chancen. Und wir können den Versuch nicht beliebig oft wiederholen (Ethik, Zeit, Geld). Zuletzt ist es auch so, dass der Ergebnisraum nicht begrenzt ist. Bedingt durch die biologische Variabilität können unendlich viele Ergebnisse (reelle Zahlen) bei der Messung des Durchmessers von Lymphozyten auftreten.

    Klassische Wahrscheinlichkeit

    Die Wahrscheinlichkeit für das Eintreten des Ereignisses E ist gleich dem Quotienten aus der Zahl der günstigen Ereignisse und der Zahl der möglichen, gleichwahr-scheinlichen Ereignisse.

    TB S 8o

    Bei dieser Definition der Wahrscheinlichkeit ist kritisch zu bemerken, dass der Wahrscheinlichkeitsbegriff durch eine Formulierung definiert wird, die den Begriff Wahrscheinlichkeit enthält. Eine solche Zirkeldefinition ist an sich so unbefriedigend wie die Definitionn des Begriffes Intelligenz durch den nicht ernst gemeinten Satz "Intelligenz ist das, was ein Intelligenztest mißt".


    6.5.3  Axiombasierte Wahrscheinlichkeit

    Da die Definitionen der empirischen und klassischen Wahrscheinlichkeit keine wie in der Mathematik übliche axiomatische Grundlage hatten, wollte in den 30er Jahren des 20 Jh. der russische Mathematiker A. Kolmogoroff die bekannten Wahrscheinlichkeitstheorien in die „allgemeine Begriffsbildung der Mathematik“ einbinden. Dazu formulierte er auf der Basis der Mengenlehre ein Axiomsystem, dessen erste 5 Axiome wir aus seiner Schrift "Grundbegriffe der Wahr-scheinlichkeitsrechnung" zitieren.

    1. Axiom: F ist ein Mengenkörper.
    2. Axiom: F enthält die Menge E.
    3. Axiom: Jeder Menge A in F ist eine nicht negative reelle Zahl P(A) zugeordnet. Diese Zahl P(A) nennt man die Wahrscheinlichkeit des Ereignisses A.
    4. Axiom. P(E) = 1.
    5. Axiom: Wenn A und B disjunkt sind, so gilt: P(A+B) = P(A) + P(B).

    Heute schreiben wir beim 5. Axiom: P(AB) = P(A) + P(B).

    Das 6. Axiom, auf welches wir hier nicht eingehen, bezieht sich auf nichtendliche Ereignisse. Dadurch ist sichergestellt, dass die folgenden Berechnungen auch auf nicht endliche Ereignisse anwendbar sind. Bei den folgenden Erklärungen werden wir wieder auf sechseitige Würfel, Münzen und ein 32er Kartenspiel zurückgreifen.

    Aus den Axiomen lassen sich eine Vielzahl von Regeln zum Rechnen mit Wahrscheinlichkeiten ableiten. Auf einige der Grundregeln werden wir hier eingehen. Sie entsprechen in der rechnerischen Anwendung dem, was wir von der empirischen und klassischen Wahrscheinlichkeit her schon kennen, nur sind sie nun auf eine axiomatische Basis gestellt und damit mathematisch abgesichert.

    Regeln zum Rechnen mit Wahrscheinlichkeiten

    A:    Die Wahrscheinlichkeit für das Auftreten von E ist eine nicht negative reelle Zahl.   P(E) = 0

    B:    Das sichere Ereignis   P(W) = 1

    Würfel (vgl. Abb. 3): Wie groß ist die Wahrscheinlichkeit, mit einem Würfel eine beliebige Zahl zu würfeln?
    • W = {1,2,3,4,5,6}
    • E = W
    • |W| = |E| = 6
    • P(E) = |E| / |W| = 6 / 6 = 1
    • Mit der Wahrscheinlichkeit 1 werden wir eine beliebige der Zahlen aus dem Intervall [1;6] erwürfeln. Siehe Punkt E.

    Abb. 3


    C:    Das unmögliche Ereignis   P(E) =

    Würfel (vgl. Abb. 4): Wie groß ist die Wahrscheinlichkeit, mit einem sechsseitigen Würfel eine 7 zu werfen?

    • W = {1,2,3,4,5,6}
    • E = {7}
    • |W| = 6
    • |E| = 0
    • P(E) = |E| / |W|= 0 / 6 = 0

    Abb. 4


    D:     Die Wahscheinlichkeit ist ein Wert zwischen 0 und 1   0 P(E) 1

    Würfel (vgl. Abb. 5): Wie groß ist die Wahrscheinlichkeit mit einem Würfel eine 2 zu würfeln?

    • W ={1,2,3,4,5,6}
    • |W| = 6
    • E = {2}
    • |E| = 1
    • P(E) = |E| / |W|= 1 / 6 = 0,167

    Abb. 5


    E:    Spezieller Additionsatz für Wahrscheinlichkeiten   P(EF) = P(E) + P(F)

    Oder-Verknüpfung, disjunkte Ereignisse

    Würfel (vgl. Abb. 6): Wie groß ist die Wahrscheinlichkeit dafür, dass bei einem Wurf mit einem Würfel eine 2 oder eine 3 realisiert wird? Beide Ereignisse können nicht gleichzeitig eintreten, sie sind disjunkt.
    • P(EF) = P(E) + P(F)

    • W = {1,2,3,4,5,6}
    • |W| = 6
    • E = {2}
    • |E| = 1
    • F = {3}
    • |F| = 1
    • P(E) = |E|/|W| = 1/6
    • P(F) = |F|/|W| = 1/6

    • P(EF) = P(E) + P(F) = 1/6 + 1/6 = 2/6 = 0,333

    Abb. 6

    Wir können mit der Wahrscheinlichkeit 0,333 vorhersagen, dass beim Wurf entweder eine 2 oder eine 3 realisiert wird.

    Das bedeutet, die Wahrscheinlichkeit für das alternative Auftreten zweier disjunkter (sich gegenseitig ausschließender) Ereignisse E und F ist gleich der Summe der beiden Einzelwahrscheinlichkeiten.

    Für beliebig viele Ereignisse gilt

    Hieraus folgt:
    P(123456) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 6/6 = 1,
    also ein sicheres Ereignis. Siehe Punkt B

    Zweites Beispiel hierzu:
    Eine Münze wird geworfen. Wie groß ist die Wahrscheinlichkeit dafür, dass A (Adler) oder Z (Zahl) oben liegt?
    P(AZ) = P(A) + P(Z) = ½ + ½ = 1
    Eines der beiden Ereignisse wird mit P=1, also mit Sicherheit, eintreten.


    F:    Allg. Additionsatz für Wahrscheinlichkeiten   P(EF) = P(E) + P(F) – P(EF)

    Oder-Verknüpfung, nicht disjunkte Ereignisse

    Würfel (vgl. Abb. 7): Wie groß ist die Wahrscheinlichkeit dafür, dass bei einem Wurf mit einem Würfel eine der Zahlen x < 3 oder eine der Zahlen 4 > x > 1 realisiert wird?

    • W = {1,2,3,4,5,6}
    • |W| = 6
    • E ={x < 3 = 1, 2}
    • |E| = 2
    • F = {4 > x > 1 = 2, 3}
    • |F| = 2
    • P(E) = |E|/|W| = 2/6
    • P(F) = |F|/|W| = 2/6
    (EF) = G = 2, das ist die Schnittmenge von E und F, also das Ergebnis, welches sowohl in E als auch in F vorkommt.

    Würden wir P(E) und P(F) addieren, so würden wir die 2 doppelt zählen. Daher muss die Wahrscheinlichkeit für das beiden Ereignissen gemeinsame Ergebnis (2), P(EF) subtrahiert werden. Also folgt:

    • P(EF) = P(E) + P(F) - P(EF)
    • P(23) = P(1, 2) + P(2, 3) = 2/6 + 2/6 - P(EF)
    • P(EF) = 1/6 (Die 2 ist eine der 6 Zahlen)
    • P(23) = P(1, 2) + P(2, 3) = 2/6 + 2/6 - 1/6 = 3/6 = 1/2
    • P(23) = 0,5
    Es ist intuitiv einsichtig, das die drei günstigen Ziffern (1, 2, 3) 50% der möglichen Ziffern ausmachen.

    Das bedeutet, die Wahrscheinlichkeit für das alternative Auftreten zweier Ereignisse E und F, die beide gemeinsame Ergebnisse enthalten, die sich gegenseitig also nicht ausschließen, ist gleich der Summe der beiden Einzel-wahrscheinlichkeiten vermindert um die Wahrscheinlichkeit für die Schnittmenge von E und F, also für die in beiden Ereignissen vorkommenden Ergebnisse.

    Abb. 7


    G:     Multiplikation von Wahrscheinlichkeiten    P(E(F) = P(E) * P(F)

    Und-Verknüpfung, disjunkte Ereignisse

    Würfel (vgl. Abb. 8): Wie groß ist die Wahrscheinlichkeit, dass wir bei zwei nacheinander auszuführenden Würfen mit einem Würfel eine 2 und eine 3 in beliebiger Reihenfolge erhalten? Die beiden Ereignisse sind voneinander unabhängig, da das Ereigniss des 1. Wurfes keinen Einfluss darauf hat, welche Ziffer beim 2. Wurf fällt. (Der Würfel hat kein Gedächtnis!)

    • W = {1,2,3,4,5,6}
    • |W| = 6
    • E = {2}
    • |E| = 1
    • F = {3}
    • |F| = 1
    • P(EF) = P(E) * P(F)
    • P(E) = |E|/|W| = 1/6
    • P(F) = |F|/|W| = 1/6
    • P(EF) = 1/6 * 1/6 = 1/36 = 0,0277
    Wir können also mit der Wahrscheinlichkeit 0,0277 vorhersagen, dass bei den folgenden 2 Würfen eine 2 und eine 3 realisiert wird.

    Das bedeutet, die Wahrscheinlichkeit für das gleichzeitige Auftreten diskunkter Ereignisse ist gleich dem Produkt der Einzelwahrscheinlichkeiten.

    Abb. 8


    H:     Komplementäres Ereigniss, Komplement, Negation    P(¬E) + P(E) = 1

    Würfel (vgl. Abb. 9):
    • erwürfelt = E = {2}
    • nicht erwürfelt = ¬E = {1,3,4,5,6}
    • 1, 3, 4, 5, 6 sind die zu 2 komplementären Ereignisse.
    • W = {1,2,3,4,5,6}
    • |W| = 6
    • |E| = 1
    • P(E) = |E|/|W| = 1/6 = 0,167
    Wenn E bedeutet                   "2 liegt oben",
    dann bedeutet ¬E                  "2 liegt nicht oben"
    oder, was dem entspricht     "¬2 liegt oben"
    und das entspricht E = „1 oder 3 oder 4 oder 5 oder 6" liegen oben.

    Die Summe der Wahrscheinlichkeiten komplementärer Ereignisse ist immer 1.
    Nach P(¬E) + P(E) = 1
    ist die Wahrscheinlichkeit für die 2:                 P(2) = 1/6 = 0,167
    und die Wahrscheinlichkeit für 1,3,4,5,6:   P(¬2) =5/6 = 0,833

    Abb. 9

    Das bedeutet, zu dem eingetretenen Würfelereignis E gibt es |W|-|E| nicht eingetretene Ereignisse. Die Gesamtheit der Ereignisse in W, die nicht eingetreten sind, aber hätten eintreten können, nennen wir die komplementären Ereignisse zu dem eingetretenen Ereignis oder dessen Komplement oder seine Negation.

    Neben diesen elementaren Regeln zur Wahrscheinlichkeitsrechnung gibt es viele weitere Regeln für z. T. recht komplexe Fragestellungen. Deren Behandlung entfällt hier, da sie für unser Ziel nicht von Bedeutung sind. Wir wollen uns mit den besprochenen Regeln begnügen und uns einem Begriff zuwenden, der in der Statistik eine bedeutende Rolle spielt, der Irrtumswahrscheinlichkeit.


    6.6  Irrtumswahrscheinlichkeit

    In der Statistik nennen wir die Wahrscheinlichkeit P(E), mit der wir eine Aussage machen wollen, auch Aussagewahrscheinlichkeit [W] und deren Negation P(¬E) Irrtumswahrscheinlichkeit [IW]. Diese spielt, wie wir später sehen werden, u. a. eine Rolle bei Hypothesenprüfungen.

    Wir ziehen aus einem 32-Blatt-Kartenspiel eine Karte. Die Wahrscheinlichkeit für "Karo-Dame" ist
           W(Karo-Dame) = 1/32 = 0,03125
    Die Wahrscheinlichkeit dafür, dass diese Karte nicht Karo-Dame ist, ist
           W(¬Karo-Dame) = 31/32 = 0,96875

    Das können wir auch so ausdrücken:
    Die Irrtumswahrscheinlichkeit dafür eine Karo-Dame gezogen zu haben, ist 0,96875
           IW(Karo-Dame) = 0,96875

    Es gilt also:

     S 11u


    Umrechnung der Wahrscheinlichkeit in Irrtumswahrscheinlichkeit

    In der Inferenzstatistik wollen wir z. B. berechnen, ob eine Substanz eine Heilwirkung hat. Die Wahrscheinlichkeit, mit der wir sagen wollen: "Die Substanz hat eine Heilwirkung", legen wir auf z. B. W = 0,95 fest. Damit wir den Wert W = 0,95, den wir hier willkürlich gewählt haben, in die Rechnung einbeziehen können, benötigen wir eine Tabelle, die sogenannte t-Tabelle, in der Rechenfaktoren für bestimmte Wahrscheinlichkeiten stehen. Dieser t-Tabelle – auf die wir in einem späteren Kapitel ausführlich eingehen – müssen wir für die Berechnung den Faktor für W = 0,95 entnehmen. In der t-Tabelle stehen die Wahrscheinlichkeitsangaben aber in Form der Irrtumswahrscheinlichkeit IW. Dort steht also in der ersten Zeile hinter 2P statt 0,95 (Wahrscheinlichkeit) der Wert 0,05 (Irrtumswahrschein-lichkeit).

    Ausschnitt aus der t-Tabelle (F.Keller, Statistik für naturwissenschaftliche Berufe, pmi-Verlag). Auf die Frage, warum oben links „2P“ steht, gehen wir später ein.

    2P 0,40 0,20 0,10 0,05 0,025 0,02 0,01 0,005 0,001
    n
    1 1,376 3,078 6,3138 12,706 25,452 31,821 63,657 127,32 636,598
    2 1,061 1,886 2,9200 4,3027 6,2153 6,965 9,9248 14,089 31,600
    3 0,978 1,638 2,3534 3,1825 4,1765 4,541 5,8409 7,4533 12,924

    Wir müssen also zur Benutzung der Tabelle gedanklich umformen:
           W      IW
           0,95  0,05.

    Zu diesem Wert finden wir für n = 3 (Stichprobenumfang, hier frei gewählt) den t-Wert 3,1825. Welche Bedeutung dieser Wert hat, werden wir auch später kennenlernen. An dieser Stelle geht es nur darum, den Begriff Irrtumswahr-scheinlichkeit einzuführen.

    Wir suchen in der t-Tabelle den Faktor für IW = 0,05 und haben damit den Faktor für die Wahrscheinlichkeit 0,95.

           W + IW = 1
           IW         = 1 - W
           IW         = 1 - 0,95
           IW         = 0,05

    Solche Umrechnungen werden bei der Auswertung von statistischen Tests auftreten.

    Dieser Abstecher in einige Aspekte der Wahrscheinlichkeitsrechnung war kein Selbstzweck. Er sollte uns lediglich ein Grundverständnis des Begriffes Wahr-scheinlichkeit ermöglichen.



    Übungen

    Übung 1
    Wie groß ist die Wahrscheinlichkeit, dass beim Wurf eines sechsseitigen Würfels keine der sechs Zahlen 1, 2, 3, 4, 5, 6 oben liegt ?

    Lösung zur Übung 1   Das Fenster bitte anschließend schließen!


    Übung 2
    Wie groß ist die Wahrscheinlichkeit, daß beim Wurf eines sechsseitigen Würfels eine Primzahl oben liegt ?

    Lösung zur Übung 2   Das Fenster bitte anschließend schließen!


    Übung 3
    Sie haben ein Kartenspiel mit 32 Karten, aus dem nacheinander einzelne Karten gezogen werden. Die gezogenen Karten werden nicht zurückgelegt. Berechnen Sie die Wahrscheinlichkeit für das Ziehen folgender Karten:
    • 1. Zug: Herz 10
    • 2. Zug: Eine beliebige Karte aber nicht Herz-König
    • 3. Zug: Herz-König
    • 4. Zug: Karo 10 oder Pik 9 oder Herz Ass oder eine beliebige Kreuzkarte
    Lösung zur Übung 3   Das Fenster bitte anschließend schließen!


    Übung 4
    Eine Urne enthält 40 rote und 60 grüne Kugeln.
    1. Wie groß ist die Wahrscheinlichkeit, bei einem Zug eine rote Kugel zu ziehen? Die Kugel wird zurückgelegt.
    2. Wie groß ist die Wahrscheinlichkeit, beim 1. Zug eine grüne Kugel und beim 2. Zug wieder eine grüne Kugel zu ziehen? Die 1. Kugel wird vor dem 2. Zug zurückgelegt.
    3. Im folgendem Experiment werden gezogene Kugeln nicht zurückgelegt. Wie groß ist die Wahrscheinlichkeit, im 1. Zug eine grüne, im 2. Zug eine grüne und im 3. Zug eine rote Kugel zu ziehen ?
    Lösung zur Übung 4   Das Fenster bitte anschließend schließen!


    Übung 5
    In einem menschlichen Bevölkerungsteil sind die 4 Blutgruppen des AB0-Systems wie folgt vertreten: Gruppe A = 42 %; B = 13 %; AB = 7 % und 0 = 38 %
    1. Wie groß ist die Wahrscheinlichkeit, daß eine zufällig herausgegriffene Person die Gruppe A oder 0 hat ?
    2. Wie groß ist die Wahrscheinlichkeit, daß bei zwei zufällig herausgegriffenen Personen die Gruppen AB und 0 auftreten ?
    Lösung zur Übung 5   Das Fenster bitte anschließend schließen!


    Übung 6
    Wir werfen gleichzeitig einen weißen und einen schwarzen sechsseitigen Würfel. Wie groß ist die Wahrscheinlichkeit, dass die Augensumme 9 ist?

    Lösung zur Übung 6   Das Fenster bitte anschließend schließen!