einer Stichprobe ist ein Schätzer für den Erwartungswert
µ der Grundgesamtheit. Als sogenannte Punktschätzung enthält
keine Angaben darüber, wie genau diese Schätzung ist. Wir können also z. B.
nicht sagen, dass
mit 90%iger Wahrscheinlichkeit in der Nähe von µ liegt. Berechnen wir aus
und sx die Standardabweichung, so erhalten wir das Toleranzintervall
± sx,
für µ ergibt sich aber auch aus dieser Spanne nicht. Zur Präzisierung der Schätzung
können wir folgende Überlegungen anstellen:
einer Stichprobe ist in der Regel nicht numerisch gleich µ (Kapitel 2 Stichprobenfehler
e =
- µ). Wir gehen aber davon aus, dass der Erwartungswert µ in der „näheren“
Umgebung von
liegt. Um diese „nähere Umgebung“ einzugrenzen, hat es sich
als zweckmäßig erwiesen, ein Intervall, das sogenannte Konfidenzintervall um
,
zu berechnen, in dem µ mit einer vorgegebenen, frei wählbaren Wahrscheinlichkeit
liegt. Der Gedanke dazu wurde von dem polnischen Mathematiker
Jerzy Neyman entwickelt.
| Ein Konfidenzintervall (KI) ist ein Bereich um einen Schätzwert, in dem der Erwartungswert mit einer bestimmten Wahrscheinlichkeit, der Konfidenzwahrscheinlichkeit (KW), liegt. (KI = Konfidenzbereich = Vertrauensbereich) |
± sx
und erhalten
± s
St1 bis
Stn
± 1 * s
liegen 68,28 % aller Mittelwerte,
± 2 * s
liegen 95,5 % aller Mittelwerte,
± 3 * s
liegen 99,8 % aller Mittelwerte.
steht hier für das arithmetische Mittel der
St1
bis
Stn.)
± 1 * s
liegt µ mit 68,28 %iger Wahrscheinlichkeit.
± 2 * s
liegt µ mit 95,5 %iger Wahrscheinlichkeit.
± 3 * s
liegt µ mit 99,8 %iger Wahrscheinlichkeit.
± z * s
Beispiel 1
Uns liegt im Gedankenexperiment eine normalverteilte Grundgesamtheit mit der Varianz s2 = 25 vor. Wir entnehmen dieser Grundgesamtheit 70 Stichproben gleichen Umfangs. Die 70 arithmetischen Mittel (
St1 bis
St70)
der Stichproben mitteln wir wiederum arithmetisch, erhalten den Wert
ges = 45 und stellen die Frage:
Welches sind die Grenzen des Intervalls um den gemeinsamen Mittelwert
(
ges = 45), in denen mit der
Konfidenzwahrscheinlichkeit 95,5 % (= 0,955) der Erwartungswert µ
(der Mittelwert der Mittelwerte aller denkbaren Stichproben aus der
Grundgesamtheit) liegt? Die Begründung für die Wahl des unüblichen
Wertes 95,5 % folgt gleich.
± z * s
± 2 * s
= sx/
(s2/n) =
(25/70) = 0,6
P=0,5)
nach rechts bis z = 4,09
P = 0,9998.
± z1 - a * s
± z1 - a * s
Beispiel 2
Nehmen wir an, wir würden für eine bestimmte Personengruppe die Varianz s2 = 0,5 des Durchmessers der Erythrozyten kennen. Wir messen die Durchmesser von insgesamt 150 Erythrozyten einer Person dieser Gruppe. Wir setzen normalverteilte Daten voraus. Das arithmetische Mittel beträgt 7,82 µm. Wie groß ist das Konfidenzintervall für die KW = 99 %?
± z1 - a * s
=
(s2/n) = 0,058| Das bedeutet: | Wir können mit 99%iger Sicherheit davon ausgehen, dass der Erwartungswert µ in dem Intervall 7,67 µm bis 7,97 µm liegt. |
| Anders formuliert: | Mit 99%iger Wahrscheinlichkeit können wir davon ausgehen, dass das berechnete Konfidenzintervall richtig ist, d. h. dass in ihm der Erwartungswert liegt. |
± t * s
30.Beispiel 3
Die Celluloseacetat-Folienelektrophorese von n = 21 Rattenseren ergab folgende Werte für die Fraktion der a2-Globuline:
= 6,79 %; sx2 = 9.
Zu berechnen ist das Konfidenzintervall für die KW 95 %. Wir gehen
davon aus, dass die Daten zumindest approximiert normalverteilt sind.
± t * s
± t *
(sx2/n)
± t *
(9/21)
IW
IWZweiseitige und einseitige Fragestellung
In der ersten Zeile der ersten Spalte steht 2P, in der zweiten P. Die rechts von 2P stehenden Irrtumswahrscheinlichkeiten gelten für zweiseitige Fragestellung. Die rechts von P stehenden für einseitige.
± tn;a * s
(bei 10.1 stand statt a der Term n;1-a)
Also
± tn;a * s
± t20;0,05 * s
| Ergebnis | Der Erwartungswert µ für die a2-Globuline liegt mit der Konfidenzwahrscheinlichkeit 95 % im Konfidenzintervall 5,43 % bis 8,15 %. |
| Oder | Die Wahrscheinlichkeit, dass das Konfidenzintervall in dem Sinne richtig ist, als dass es den Erwartungswert enthält, ist 95 %. |
| sind für KW 99 % | KI = 4,94 bis 8,64 |
| und für KW 99,9 % | KI = 4,29 bis 9,29 |
-tn;a/2 * s
µ
+tn;a/2 * s
] = 1-a
- tn;a/2 * s
µ
+ tn;a/2 * s
] = 1- a
- tn;a/2 * s
) des Intervalls und kleiner oder
gleich dessen oberem Grenzwert (
+ tn;a/2 * s
).
Wie bei Abb. 1 erklärt, müssen wir tn für a/2 statt für a aufsuchen.
- tn;a * s
µ
- tn;a * s
µ
- tn;a * s
µ
- tn;a * s
1,
- tn;a * s
µ
- t20;0,05 * s
µ
µ
µ
µ
= 6,79 %
± t * s
(die 2 resultiert aus dem ±)
n
21
nach sx/Dn.
n = 2 * t * sx
n = (2 * t * sx)/ D
= 0,48, dieser Wert musste neu berechnet werden,
da sich n von 21 auf 39 verändert hat.
± t38;0,05 * s
= 4,51; s
= 0,18.
und sx2
= 0,389 mg, sx2 = 0,014.
Wie groß müsste n sein, damit das Konfidenzintervall = 0,339 bis 0,439 resultiert.