Bei einer Primärerhebung (prospektive Erhebung) sammeln wir Daten während diese
beobachtbar sind. Dabei können wir die Faktoren, die eine Wirkung auf die Daten haben,
nicht beeinflussen.
Beispiel 1
Ein Zoologe beschäftigt sich mit einer Untersuchung zur Individualentwicklung von
Zebras in der Gefangenschaft. Er reist zu den Zebrageburten in die Zoos und mißt
die Geburtsgewichte um letztlich das mittlere Geburtsgewicht bei Zebras kennenzulernen.
Dabei hat er keinen Einfluss auf Bedingungen, die das Geburtsgewicht beeinflussen könnten,
wie z. B. Alter und Gesundheitszustand der Mutter, Jahreszeit der Geburt. Dieses sind
Bedingungen, die er nur zur Kenntnis nimmt und protokolliert.
Beispiel 2
Ich interessiere mich für den Temperaturverlauf über einen bestimmten Zeitraum und
messe dazu täglich zu einer bestimmten Uhrzeit die Temperatur an einem bestimmten
Ort. Auf die Entstehung der Daten habe ich keinen Einfluß, aber ich protokolliere
sie nach Ablesen des Thermometers.
Tag
3.1.09
4.1.09
5.1.09
6.1.09
7.1.09
8.1.09
9.1.09
10.1.09
11.1.09
oC
-7
-3
-2
-9
-13
-9
-7
-6
-6
Zu solchen Primärerhebungen zählen z. B. Biotopuntersuchungen zur Populations-dichte
von Tieren und Pflanzen, deren Ergebnisse oft zu den Grundlagen für Bebauungspläne
gehören.
Beispiel 3
Ein Biologe hat die Aufgabe in einem Hochmoor die Häufigkeit der typischen
Heidekrautpflanzen Moosbeere, Rosmarinheide, Besenheide und Glockenheide
sowie der fleischfressenden Pflanze rundblättriger Sonnentau zu ermitteln.
Er wird durch Begehung der zu unteruchenden Fläche des Moores das Vorkommen der
Pflanzen protokollieren und so die gewünschte Biotopübersicht erstellen. Auf die
Wachstumbedingungen der Pflanzen hat er dabei keinen Einfluss.
Mit diesem Aufruf können Sie eins- bis dreiziffrige Zufallszahlen erzeugen, die in einem
gesonderten Fenster angezeigt werden. Wenn Sie diese Zahlen gegebenenfalls nach
mehrfachem Aufruf des Fensters hintereinanderschreiben, dann erhalten Sie eine
Zufallszahlentabelle wie wir sie hier wiedergeben.
91139
63020
73791
68182
79359
60969
52975
64621
51922
38498
85406
37139
73282
74464
74084
06126
16899
06861
82095
30583
17258
42167
10998
37231
Beim Randomisieren mit Zufallszahlen müssen wir alle Elemente der Menge, aus der wir die
Stichprobe ziehen wollen, nummerieren. Das Verfahren ist nur durchführbar, wenn diese
Menge (Grundgesamtheit) überschaubar klein genug ist, um den Aufwand der Kennzeichnung
ökonomisch vertretbar zu halten. In vielen Fällen ist die Größe der Grundgesamtheit
unbekannt, weswegen eine Durchnummerierung dann gar nicht möglich ist.
Beispiel 19
Wir wollen wissen, ob Wirkstoff A bei Mäusen eine bessere Wirkung gegen eine
Trypanosomen-Infektion hat als Wirkstoff B. Die in diesem Fall vom Tierlieferanten
vorausgewählte "Grundgesamtheit" bestehe aus 100 Mäusen mit den gewünschten Eigenschaften
bezüglich Stamm, Geschlecht und Gewicht. Für den Versuch wird eine Stichprobe von 20
Tieren benötigt. Wir kennzeichnen alle 100 Tiere in fortlaufender Folge mit den Zahlen
00, 01, 02 bis 99. Jedes Tier bekommt also eine zweiziffrige Codezahl. Währen 300 Tiere
zu kennzeichnen, so bekäme jedes Tier eine dreiziffrige Codezahl von 000 bis 299. Nun
suchen wir mit Hilfe von Zufallszahlen 20 Tiere für die Stichprobe aus. In der Tabelle
sind aus Gründen der Übersichtlichkeit jeweils fünf Ziffern zu einem Block zusammen
gefasst. Wo immer wir beginnen diese Tabelle zu lesen und ob wir nach rechts, links,
oben oder unten lesen, immer bekommen wir eine Folge zufällig angeordneter Zahlen.
Es ist auch unerheblich, ob wir einziffrige Zahlen, zweiziffrige Zahlen usw. entnehmen.
Bei der Suche nach 20 Tieren aus den 100 Tieren verfahren wir wie folgt: Wir legen
willkürlich fest, dass wir in der 2. Zeile von oben und in der 6. Spalte von links
beginnen wollen und nach rechts lesen (siehe Tabelle). Ist die Zeile zu Ende, fahren
wir mit der nächsten Zeile darunter, links beginnend, fort. Jede andere Vereinbarung
wäre auch möglich. Sie muss aber vorher festgelegt werden, um zu verhindern, dass wir
mit einer willkürlich ausgesuchten Startzahl beginnen. Wir fangen mit der zweiziffrigen
Zahl 74 an und teilen Maus 74 dem Käfig A zu. Dann Maus 46 zu Käfig B, Maus 47 zu Käfig
A usw. Die Zahlen schreiben wir auf. Nach Maus 99 (Käfig B) finden wir die Zahl 06.
Diese Zahl, wie auch nach Maus 72 die Zahl 58, überschlagen wir, da die Zahlen 06 und 58
bereits vergeben sind.
Beispiel 20
Wir wollen aus einer Gruppe von 60 Kanarienvögeln, deren Ringe gekennzeichnet sind,
einen bestimmten Prozentsatz für eine Stichprobe auswählen. Alle Tiere der Gruppe
sind fortlaufend nummeriert. Sollen 20 % der Gruppe ausgewählt werden, so legen wir in
freier Wahl zwei Ziffern fest, z. B. 4 und 9. Alle Tiere mit den Endziffern 4 und 9
kommen nun in die Stichprobe. Bei einer Gruppe von 60 Tieren wären das die Tiere
4, 9, 14, 19, 24, 29, 34, 39, 44, 49, 54, 59. Das sind 12 Tiere und somit 20 % der Gruppe.
Benötigen wir 30 % der Gruppe, so werden drei Endziffern festgelegt.
Die Ringe der Tiere sind üblicherweise nicht von 00 bis 59 nummeriert, sie tragen
wahrscheinlich beliebige Zahlen- oder Buchstabenkombinationen der Züchter,
denen wir aber eine von 00 bis 59 fortlaufende Codierung zuordnen können. Etwa so:
Beispiel 21
Wir interessieren uns für die Wirkung des Herbizids Glyphosate auf die Anthocyanbiosynthese
bei Buchweizensämlingen. Zur Untersuchung sollen 15 Töpfe mit 7 Tage alten vorkultivierten
Pflanzen zufällig auf 3 Gruppen verteilt werden, die mit unterschiedlichen Dosen des Wirkstoffs
zu behandeln sind. Die Töpfe werden von 1 - 15 nummeriert. Damit die Zuteilung zu den Gruppen
A, B und C zufällig geschieht, arbeiten wir hier mit Loskarten, die mit den Zahlen 1 bis 15
gekennzeichnet sind. Die Karten werden gemischt und alternierend den drei Gruppen zugeordnet
wie die folgende Darstellung zeigt.
Gruppe A
Gruppe B
Gruppe C
Losnummer 12, 3, 8, 10, 9
Losnummer 4,6,11,1,7
Losnummer 2, 5,13,14,15
Nun gelangt Topf 1 in Gruppe B, Topf 2 in Gruppe C, Topf 3 in Gruppe A usw. Dieses Verfahren
ist sehr einfach, wir benötigen keine Zufallszahlentabelle und die Loskarten kann man rasch
selber erstellen.
Ein typisches Beispiel dieses Verfahrens ist demographischer Art.
Beispiel 23
In einer Kleinstadt soll das Kaufverhalten der über 18 jährigen Bewohner untersucht
werden, die regelmäßig beim Discounter einkaufen. Da keine Informationen vorliegen,
die diese Gruppe kennzeichnen, können wir aus ihr auch keine Stichprobe entnehmen.
In einem solchen Fall teilen wir die bewohnte Fläche der Stadt in Raster, z. B. in
Planquadrate geeigneter Größe ein. Wir bilden auf diesem Wege Klumpen (Cluster)
von Bewohnern, in denen sich wahrscheinlich auch Mitglieder der gesuchten Gruppe
befinden. Die Cluster werden durchnummeriert und es wird eine Stichprobe je Cluster
gewählt. In den Stichprobenclustern werden alle Bewohner nach ihrem Kaufverhalten
befragt. Durch dieses Verfahren hatten nicht alle Bewohner der Stadt die gleichen
Chancen in die Stichprobe zu gelangen, sie wurden der Stichprobe indirekt durch
Clusterauswahl zugeführt.
Hierunter verstehen wir eine Stichprobenauswahl aus einem schon selektierten Teil
der Grundgesamtheit.
Beispiel 24
Wir bestellen beim Züchter 200 Goldhamster, männlich, Stamm Hoe:SYHK, 150 g ± 10 g.
Der Züchter hat zum Zeitpunkt, an dem er den Versandkarton für uns fertig macht,
2000 solcher Tiere vorrätig. Er teilt sie für uns und andere Kunden in einer ersten
Selektierungsstufe in Käfige zu je 50 auf. Wir erhalten vier Käfige. In der zweiten
Selektierungsstufe wählen wir aus den vier Käfigen einen aus und in einer dritten
Stufe aus diesem eine Stichprobe von n = 20. Diese 20 Tiere sind aus der Grundgesamtheit
mit N = 2000 über ein mehrstufiges Verfahren ausgewählt worden. Dieses Vorgehen ist
in der Praxis sehr häufig.
Stichprobenergebnisse repräsentieren immer nur mehr oder weniger gut die Merkmalsausprägungen
in der Grundgesamtheit. Bei einer Untersuchung variieren üblicherweise die Messwerte. Daher geben wir
häufig als Ergebnis der Unter-suchung stellvertretend an Stelle aller Messwerte
das
arithmetische Mittel
(gesprochen x quer)
der Messungen an und nennen es Stichprobenmittelwert. Wir sehen diesen Stichprobenmittelwert
als Schätzwert für µ, den Mittelwert der Grundgesamtheit,
den sogenannten "Erwartungswert" an. Der Idealfall
= µ
wird wegen des begrenzten
Stichprobenumfanges in der Regel nicht erreicht und wir formulieren die Abweichung
- µ = e
als Stichprobenfehler e. Je größer der Stichprobenumfang n, umso besser repräsentiert die
Stichprobe die Grundgesamtheit, umso kleiner wird e. In der Regel ist e nicht bekannt.
Wir können e aber aus Kenntnissen über die Variation der Mittelwerte vieler vergleichbarer
Stichproben aus einer Grundgesamtheit schätzen. Auf das Verfahren können wir hier nicht
eingehen. Die Schätzung von µ durch den Stichprobenmitelwert
wird mit zunehmendem n so gut, dass eine Vergrößerung
des Stichprobenumfangs dann oft nicht mehr sinnvoll ist.
Bei der Gewinnung von Daten und deren Aufbereitung zur späteren Analyse können
Fehler auftreten. Diese Fehler können das Ergebnis einer Untersuchung im günstigsten
Falle fragwürdig erscheinen lassen, etwa wenn uns die Werte unwahrscheinlich vorkommen.
Dann können wir nach eventuellen Fehlern suchen und diese gegebenenfalls eliminieren.
Im schlimmsten Fall können wir an den Daten nicht erkennen, dass sie fehlerhaft sind
und wir ziehen dann Schlüsse aus falschen Ergebnissen. Wir wollen uns hier mit den
drei wesentlichen Fehlertypen beschäftigen.
Beispiel 25
Bei einer Gesundheitskontrolle soll die K+-Konzentration im Blut festgestellt werden.
Ein Laborant analysiert die Blutprobe. Er führt fünf Parallelbestimmungen der gleichen
Blutprobe durch und erhält folgende Ergebnisse der Stoffmengen-konzentration c(K+)
in mmol/L:
Der Mittelwert der fünf Messungen beträgt 4,3 mmol/L. Der "richtige" von einem
Analysenautomaten gefundene Wert, der Sollwert, ist 4,2 mmol/L. Wir ziehen daraus
folgende Schlüsse:
1. Die fünf Einzelwerte streuen um ihren Mittelwert herum.
2. Der Mittelwert liegt nahe beim Sollwert.
Dieses Bild ist typisch für den Zufallsfehler.
Für ihn ist nämlich charakteristisch, dass die Messwerte mal zu hoch und mal zu niedrig
liegen. Die Gründe für diese Streuung liegen in der Arbeitsweise des Analysierenden
(daher persönlicher Fehler).
Gründe für Zufallsfehler:
Unaufmerksamkeit, Ablenkung
Ermüdung
Empfindlichkeit der Augen lässt nach (Analogskala falsch ablesen)
Pipettierfehler (mal zu viel, mal zu wenig abgemessen)
Allgemeine Arbeitsweise
Zufallsfehler können wir nicht vermeiden, wir streben aber an, sie zu minimieren.
Der Zufallsfehler ist ein Maß dafür, wie weit die Werte um ihren Mittelwert
streuen. Er ist ein Maß für die Präzision der Arbeit.
Beispiel 27
Im physikalischen Praktikum wird ein Experimental-Flüssigkeitsthermometer benutzt,
bei dem wir die Skala längs der Kapillare verschieben können. Bei der richtigen
Vorgehensweise wird vor einer Messung die Lage der Skala mit einer geeichten Thermometer
abgeglichen, so dass bei beiden Thermometern der gleiche Wert, z. B. 0 °C angezeigt wird.
Hierbei trat ein Einstellfehler auf, in dessen Folge jeder Messwert um 2 °C zu hoch liegt.
Die folgenden Zahlen zeigen, wie sich dieser Fehler im Vergleich mit richtigen Messwerten
bei verschieden hohen Messwerten auswirkt.
Thermometer richtig kalibriert zeigt bei 0 °C 0 °C an
Thermometerf alsch kalibriert zeigt bei 0 °C 2 °C an
absolute Abweichung
relative prozentuale Abweichung
A
B
C
D
|A-B|
100 * |A-B|/A
10 20 30 40
12 22 32 42
2 2 2 2
20 % 10 % 7 % 5 %
Beispielrechnung für A = 20 °C
Absolute Abweichung |20 - 22| = |2|
Relative Abweichung: Bei 20 °C ist die abolute Abweichung 2 °C,
bei 100 °C sind dies 10 °C, das entspricht 10 %
Typische Eigenschaft des konstanten systematischen Fehlers:
Der absolute Fehler ist bei allen Messwerten gleich hoch.
Der relative Fehler (prozentuale Fehler) sinkt mit zunehmender Messwerthöhe.
Beispiel 28
Hier geht es um einen Fehler bei einer massanalytischen Titration. Bei der Faktorisierung
der Masslösung ist ein Fehler aufgetreten. Während der richtige Faktor 1,02 ist, wurde
der Faktor auf der Flasche mit 1,04 angegeben. Das Zahlenbeispiel zeigt, wie sich dieser
Fehler auf die Titrationsergebnisse auswirkt.
Verbrauch
falscher Titer
falsches Ergebnis
richtiger Titer
richtiges Ergebnis
absolute Abweichung
relative prozentuale Abweichung
A
B
C
D
E
F
G
|E-C|
100 *|(E-C)|/E
10,00 mL
1,04
10,40 mL
1,02
10,20 mL
0,20 mL
1,96%
12,00 mL
1,04
12,48 mL
1,02
12,24 mL
0,24 mL
1,96%
14,00 mL
1,04
14,56 mL
1,02
14,28 mL
0,28 mL
1,96%
16,00 mL
1,04
16,64 mL
1,02
16,32 mL
0,32 mL
1,96%
Wie wir sehen, hängt die absolute Abweichung von der Höhe des Messwertes ab, da der
falsche Titer ja multiplikativ (wahrer Verbrauch = praktischer Verbrauch * Faktor)
in das Ergebnis eingeht. Der prozentuale Fehler dagegen ist unabhängig von der Höhe
des Verbrauchs immer gleich.
Wer Daten durch ein Verfahren gewinnt, muss sich überlegen, wo bei seinen Arbeiten
systematische Fehler auftreten können und diese Störquellen dann möglichst ausschalten.
Grobe Fehler sind von systematischen Fehlern u. U. schwer abzugrenzen. Sie entstehen
durch grundsätzlich fehlerhaftes Arbeiten.
Beispiel 29
Bei der Untersuchung des Einflusses von Erythropoetin auf die Erythrozytenzahl/L Blut
wurden Probanden mit unterschiedlichen Mengen Erythropoetin behandelt. Vor der Blutanalyse
wurden die Proben von Proband C und Proband D verwechselt. Dies führte, bevor wir den
Fehler später nachweisen konnten, zunächst zu fragwürdig scheinenden Ergebnissen.
Gründe für grobe Fehler
Fehler in der Zuordnung von Proben
Benutzen falscher Auswertetabellen
Benutzen einer falschen Analysenmethode
Abschreibfehler (Originaldaten ??? Sekundärlisten)
Grobe Fehler sind ein Hinweis auf schlechte handwerkliche Arbeit.
Das Erkennen von Fehlern ist von großer Bedeutung. Erkennt man sie, so können u. U. teure
Untersuchungen, bei denen gleich zu Beginn Fehler gemacht wurden, rechtzeitig abgebrochen
werden. Eine Langzeittoxizitätsstudie zu einem medizinisch interessanten Wirkstoff an Ratten
dauert ca. zwei Jahre. Fehler bei der Stichprobenauswahl, die nicht erkannt werden, binden
über zwei Jahre Arbeitskräfte und das Ergebnis ist wertlos. Fehler bei klinisch chemischen
Analysen können zu gravierenden gesundheitlichen Problemen führen.
Grobe Fehler und systematische Fehler
Prüfung auf Plausibilität (plausibilis - beifallwürdig)
Jeder, der sich mit der Datengewinnung beschäftigt, sollte genügend Fachkennt-nisse
auf dem Gebiet, zu dem die Daten gehören, haben, um erkennen zu können, ob die gewonnenen
Daten aus sachlicher Sicht als überhaupt möglich, einleuchtend, annehmbar, vernünftig d.
h. plausibel erscheinen.
Beispiel 30
Bei der Suche nach einem Wirkstoff, der bei Mäusen eine Infektion mit Trypanosoma brucei
erfolgreich therapieren kann, wurde eine Kontrollgruppe infizierter Tiere mit einem
Placebo behandelt. Bei dieser Kontrollgruppe überlebten alle Tiere die nächsten sieben
Tage. Das war nicht zu erwarten, da die Infektion erfahrungsgemäß nach vier Tagen tödlich
verläuft. Dieses unerwartete Überleben der Tiere war uns aufgefallen. Eine Recherche ergab,
dass die Tiere dieser Gruppe versehentlich gar nicht infiziert worden waren. So wurde durch
eine Plausibilitätsprüfung der Ergebnisse ein grober Fehler aufgedeckt. Hätte der Mitarbeiter,
der die Daten zu beurteilen hatte, keine Kenntnis über den Infektionsverlauf gehabt, dann
wäre der Fehler wahrscheinlich nicht aufgefallen.
Er kommt u. U. vor, dass in einer Messwertreihe ein einziger Wert weit weg vom Feld der
anderen liegt. Wenn wir sicher sind, dass dieser Wert durch einen offensichtlichen Fehler
entstanden ist, dann können wir ihn als "Ausreißer" von der weiteren Bearbeitung
ausschließen. Dies muss dann aber protokolliert werden. Aus der Urliste dürfen wir
den Ausreißer nicht entfernen. Wenn nur der Verdacht auf einen Fehler vorliegt,
dann können wir mit einem Ausreissertest (z. B. dem Nalimov-Test, mit dem wir uns
später beschäftigen werden) prüfen, ob es sich wirklich um einen Ausreißer handelt
oder nicht. Kann der Test die Ausreisservermutung nicht bestätigen, dann muss der Wert
bei den folgenden Berechnungen mit einbezogen werden.
Zufallsfehler und systematische Fehler überlagern sich oft
Die Größe zufälliger Fehler kann durch Berechnung der Streuung (wird später behandelt)
mit anderen Datenreihen verglichen werden. Ist das Streuungsmaß größer als "üblich"
(das kann man mit einem Test feststellen, siehe später), dann sollten wir aufhorchen.
Systematische Fehler sind nicht so leicht aufzudecken, da ja der Sollwert in der Regel
nicht bekannt ist. Werden systematische Fehler vermutet, so können wir das u. U. prüfen,
indem wir die Analyse mit einem anderen Verfahren wiederholen.
Ziel:
Grobe und systematische Fehler ausschalten!
Zufallsfehler minimieren!
Beispiel 31
Ich habe bei einer Kaliumhydroxidlösung mit w(KOH) = 7,00 g/100 g an fünf
aufeinanderfolgenden Tagen titrimetrisch w bestimmt und erhielt folgende Werte in g/100g:
6,90; 6,99; 7,05; 7,01, 7,06. Die Streuung um den Mittelwert 7,00 (genau 7,002)
betrachte ich als auf dem Zufallsfehler beruhend. Einen systematischen Fehler schließe
ich aus, da mein Mittelwert ja dem Sollwert entspricht.
Dann habe ich an fünf aufeinanderfolgenden Tagen bei einem Kaninchen Blut entnommen
und jeweils die Leucozytenzahl bestimmt. Dabei erhielt ich die folgenden Werte:
6,8; 7,0; 7,1; 7,3; 7,6 * 109 Leucos/L. Für die Streuung mache ich auch hier
den Zufallsfehler verantwortlich. Da mein Mittelwert mit 7,16 * 109 Leucos/L
den Erwartungen bei einem gesunden Kaninchens entspricht, schließe ich auch hier einen
systematischen Fehler aus.
Nun eine dritte Messgruppe. Ich untersuche bei fünf Kaninchen an einem Tage die Zahl der
Leucozyten/L und erhalte folgende Ergebnisse in Leucos/L: 5,6; 6,4; 7,3; 8,0; 8,3 *
109. Der Mittelwert beträgt 7,12 * 109 Leucos/L und repräsentiert
den Erwartungswert gut. Also liegt auch hier ein Zufallsfehler aber kein systematischer
Fehler vor.
Die Unterschiede in den Streuungen bei den drei Versuchen mögen zunächst nicht
auffallen, sie erscheinen aber deutlich, wenn die Daten an einer Skala dargestellt werden:
Da wir systematische Fehler (und auch grobe Fehler) ausgeschlossen haben, stellt sich
die Frage nach der Ursache für die unterschiedlich starken Streuungen.
Die verschlossene KOH-Lösung hat sicher an allen fünf Tagen den gleichen Wert für w.
Bei einem Tier ist das anders. Bei unserem Kaninchen variieren die Zahlen der
Leucocyten/L physiologisch von Tag zu Tag. Das ist normal. Untersuchen wir mehrere
Kaninchen, so sind die Schwankungen von Tier zu Tier noch größer als bei einem
Kaninchen von Tag zu Tag. Das ist auch normal. Im Gegensatz zur KOH-Lösung haben
wir es bei den Kaninchen mit Lebewesen zu tun. Und hier ist es physiologsch, d. h.
natürlich, dass die Blutwerte wie viele andere Werte zu verschiedenen Zeiten mehr oder
weniger großen Schwankungen unterliegen. Diese Erscheinung, die auf der Individualität
von Lebewesen beruht, nennnen wir Biologische Variabilität.
Diese Eigenschaft, die zu den üblichen, die Messwerte/ Zählwerte beeinflussenden Fehlern
hinzukommt, macht die Interpretation biologischer Versuchsergebnisse problematischer als
die Ergebnisse chemischer und physikalischer Versuche.
Wie aus dem Beispiel hervorging müssen wir unterscheiden zwischen:
intraindividueller Variabiität, die zu
unterschiedlichen Werten eines Individuums in Abhängigkeit von z. B. der Tageszeit
führt,
und
interindividueller Variabilität, die zu
unterschiedlichen Werten bei verschieden Individuen führt.
Wir könnten nun denken, dass wir die Stärke der interindividuellen Variabilität durch
Vergrößern der Stichprobe minimieren können. Das ist aber nicht der Fall. Wenn
zusätzliche Elemente der Grundgesamtheit in die Stichprobe aufgenommen werden,
so haben diese Elemente die übliche Bandbreite an Ausprägungen wie in der Grundgesamtheit.
Eine Minimierung der interindividuellen Variabilität erreichen wir dadurch, dass wir
durch Wahl der Grundgesamtheit dafür sorgen, dass diese in Bezug auf das zu untersuchende
Merkmal eine geringe Streuung hat. Das bedeutet bei Tieren etwa, dass man sich auf ein
Geschlecht beschränkt, auf eine bestimmte Alters- und Gewichtsklasse oder auf die Wahl
eines Stammes, der genetisch bedingt eine geringe Streuung der Merkmalsausprägung hat.
Übung 1
Von welchem Fehler wird die Richtigkeit der Daten beeinflußt und was ist das Typische für
diese Fehlerart?
Von welchem Fehler wird die Präzision der Daten beeinflußt und was ist das Typische für
diese Fehlerart?
Welchen Fehler kann man besser erkennen und warum, den systematischen Fehler oder den
Zufallsfehler?
Erklären Sie den Begriff Plausibilität.
Welche Auswirkung hat die biologische Variabilität auf die Auswertung von Versuchen?
Anworten zur Übung 1
Systematischer Fehler, die Werte liegen, bezogen auf den Sollwert, immer zu hoch oder zu
niedrig.
Zufallsfehler, die Werte streuen mehr oder weniger stark in der Nähe des Sollwertes, wenn
kein systematischer oder grober Fehler vorliegt.
Den systematischen Fehler, da die Werte vom Erwartungswert deutlich abweichen.
Das bedeutet soviel wie Stimmigkeit eines Wertes. Der Wert erscheint uns einleuchtend.
Durch die Biologische Variabilität werden die Streuungen, die Meßwerten an sich schon
anhaften, noch vergrößert. Das macht die Auswertung von Versuchen oft schwieriger.
Übung 2
Erstellen Sie in Excel eine Zufallszahlentabelle mit mindestens 300 Ziffern (0 bis 9)
und suchen Sie aus 100 Tieren 25 für eine Stichprobe aus.
Erstellen Sie eine ebenso große Tabelle mit Zahlen, die Ihnen gerade einfallen. Prüfen
Sie in beiden Tabellen durch Abzählen, wie häufig die Ziffern 0 bis 9 vorkommen.
Lösung zur Übung 2
Wir geben keine Lösungen an.
Übung 3
Erklären Sie an Beispielen was eine retrospektive Erhebung von einem Experiment unterscheidet.
Antwort zur Übung 3
Eine retrospektive Erhebung ist ein Verfahren
zur Datengewinnung bei der auf Daten zugegriffen wird, deren Entstehung und Aufzeichnung
in der Vergangenheit liegt.
Beispiel: Ein Meteorologe muss eine Zusammenstellung
über den Temperatur-verlauf auf dem Feldberg/Schwarzwald schreiben. Ihn interessieren die
täglichen Temperaturwerte von 12:00 bis 15:00 in den Jahren 1962 bis 1965.
Ein Experiment ist ein Verfahren zur Datengewinnung,
bei dem die Bedingungen im Umfeld vom Experimentator mehr oder weniger frei gewählt werden
können.
Beispiel: Ich möchte den Sauerstoffverbrauch von
Fischen (Goldorfen) in Abhängigkeit von der Flußgeschwindigkeit des Wassers (v), der
Temperatur des Wassers (T) und vom Gewicht (m) der Tiere ermitteln. Dazu bilde ich mehrere
Gruppen von Fischen und variiere die Bedingungen wie in der folgenden Tabelle angegeben.
Gruppe
v in mL / min
T in °C
m in g
A
50
18
20
B
50
18
25
C
50
24
20
D
50
24
25
E
30
18
20
F
30
18
25
G
30
24
20
H
30
24
25
Die beiden Verfahren zur Datengewinnung unterscheiden sich darin, dass ich bei den
Erhebungen darauf angewiesen bin, dass die Aufzeichnungen von vor ca. 40 Jahren
ordentlich zu den gewünschten Zeitpunkten durchgeführt wurden. Über Sorgfalt und Richtigkeit
der Daten liegen keine weiteren Angaben vor. Insofern sind diese Daten mit einer Unsicherheit
belastet. Im Experiment kann ich die gewünschten Bedingungen wie ich möchte einstellen und
auf die korrekte Protokollierung der Daten habe ich Einfluss, da ich sie selber vornehme.
Die Daten des Experiments sind also sicherer und somit aussagekräftiger als die der Erhebung.
Übung 4: Fehler bei der Datengewinnung
Es wurde die Hydrolyse des Fettes in der Milch durch das Enzym Lipase untersucht.
Gemessen wurden über 6 h die Veränderungen der pH-Werte der Proben. Kolben 1 und 2
enthielten Milch und das aktive Enzym, Kolben 3 enthielt Milch und inaktiviertes Enzym.
Die Tabelle zeigt die Messwerte (pH-Werte).
0-Wert
1 h
2 h
3 h
4 h
5 h
6 h
Kolben 1
6,45
6,35
6,23
6,34
6,29
6,25
6,25
Kolben 2
6,62
6,62
6,52
6,68
6,65
6,64
6,64
Kolben 3
6,63
6,63
6,54
6,70
6,67
6,65
6,65
Frage zur Übung 4
Welcher Versuchsfehler ist zu erkennen?
Lösung zur Frage der Übung 4
An einer Graphik erkennt man schnell, dass Kolben 2 inaktives Enzym enthielt.
Es liegt ein grober Fehler vor.
Übung 5: Fehler bei der Datengewinnung
Untersucht wurden die Erythrozyten-Zahlen und die Leukozyten-Verteilung bei Mäusen,
die alle gleich stark mit Trypanosoma brucei infiziert waren. Jeder Untersucher untersuchte
2 Mäuse. Die Tiere wurden den Untersuchern durch Randomisieren zugeteilt.
Methode: Zählkammer, Blutausstrich, Mikroskop
Die Ergebnisse waren:
Untersucher Nr.
Maus Nr.
Erys / µL * 109
Neutr. %
Eos. %
Lymph. %
Mono. %
1
1
8,56
9,0
0
89,5
1,5
1
2
8,52
9,0
0,5
89,5
1,0
2
1
8,24
23,0
0,5
71,5
5,0
2
2
9,04
18,5
1,5
79,5
4,5
3
1
10,90
22,5
11,0
55,5
11,0
3
2
10,20
23,0
11,0
60,5
5,5
4
1
3,89
64,0
1,0
21,0
14,0
4
2
4,60
62,0
3,0
29,0
6,0
5
1
9,68
60,0
5,0
24,0
11,0
5
2
6,29
58,0
6,0
27,0
9,0
6
1
8,44
29,0
2,0
65,0
4,0
6
2
7,52
35,0
0
59,0
6,0
7
1
1,54
6,4
7,9
78,8
6,9
7
2
1,31
5,0
9,0
81,0
5,5
8
1
8,92
34,0
2,0
58,5
5,5
8
2
6,91
30,5
2,0
61,0
6,5
9
1
10,24
35,0
1,0
60,0
4,0
9
2
9,01
34,0
1,5
9,5
5,0
10
1
10,60
21,0
6,0
70,0
3,0
10
2
10,51
18,0
4,0
74,0
4,0
Fragen zur Übung 5
Was ist an den Ergebnissen auffällig?
Wo vermuten Sie welche Fehler?
Wo vermuten Sie welche Fehler?
Lösungen zu den Fragen der Übung 5
Untersucher 1
Neutrophile und Monozyten beide zu niedrig und damit nicht plausibel,
systematischer Fehler.
Untersucher 3
Eosinophile beide zu hoch, nicht plausibel,
systematischer Fehler. Monocyten 1 zu hoch, vermutlich grober Fehler,
bei systematischem Fehler wären eher beide Werte zu hoch.
Untersucher 4
Monocyten 1 zu hoch, vermutlich grober Fehler, bei systematischem
Fehler wären eher beide Werte zu hoch.
Untersucher 7
Erys beide zu tief, systematischer Fehler
Untersucher 9
Lymphocyten 2 zu tief, vermutlich grober Fehler, bei systematischem Fehler
wären eher beide Werte zu tief.