In den meisten Forschungs- und Entwicklungsprojekten fallen Daten an, welche ausgewertet werden wollen. Diese Daten können dabei aus Experimenten, Umfragen oder anderen Datenquellen stammen. Daten fehlerfrei zu erfassen, ist grundsätzlich nicht möglich. Die Fehler stören die Auswertung einfach etwas mehr oder weniger. Besonders gefährlich sind dabei diejenigen, welche der auswertenden Person nicht direkt ins Auge springen.
Um Daten auswerten zu können, müssen diese vorerst mit einem Messinstrument erfasst werden. Das Messinstrument kann dabei ein technisches Gerät sein oder auch aus einem auszufüllenden Fragebogen bestehen. Unabhängig von der Art des Messinstruments können die Fehler in drei Kategorien eingeteilt werden:
- Zufällige Fehler sind von den drei Fehlertypen die gutartigsten und sind bei jeder noch so guten Messung zu finden. Sie zeichnen sich dadurch aus, dass sie sich bei wiederholten Messungen „ausmitteln“. Wenn dem Forscher oder der Experimentatorin der zufällige Fehler zu gross ist, so muss er oder sie im Prinzip die Messung einfach genügend oft wiederholen, um das Resultat mit der gewünschten Präzision zu erhalten. Allerdings haben die zufälligen Fehler je nach Messinstrument besondere Eigenschaften, welche korrekt berücksichtigt werden müssen. Sonst fängt man sich ungewollt einen systematischen Fehler ein. Dabei müssen Fragen beantwortet werden wie: Sind die Fehler voneinander unabhängig und, wenn nein, wovon wird denn die Höhe des Fehlers beeinflusst? Welche Verteilung haben die Fehler? – Häufig sind diese nicht normal verteilt, sodass der Output der statistischen Standardverfahren nicht einfach wie in einführenden Lehrbüchern dargestellt interpretiert werden darf.
- Grobe Fehler, Fälschungen und Ausreisser werden häufig nicht auf den ersten Blick erkannt. Auch zweidimensionale Darstellungen reichen dafür bei vielen komplexeren Zusammenhängen nicht. Mittels robuster statistischer Methoden können die aussergewöhnlichen Datenpunkte aber oft trotzdem aufgedeckt und bei Bedarf automatisch eliminiert werden. Aber Vorsicht: Häufig sind gerade die im ersten Moment störenden Ausreisser die wirklich interessanten Beobachtungen, aus denen man neue, noch nicht bekannte Erkenntnisse gewinnen kann.
- Systematische Fehler sind am schwierigsten zu entdecken und bedürfen deshalb besonderer Aufmerksamkeit. Erfahrung und genaue Kenntnisse des Datenerhebungsprozesses in Bezug auf das konkrete Fachgebiet kombiniert mit fundiertem statistischem Wissen sind hier entscheidend. Bei technischen Messinstrumenten muss man dazu die chemisch-physikalischen Zusammenhänge des Messprozesses kennen, bei Fragebögen die psychologischen Prozesse. Zusätzlich hilft der Vergleich mit Daten aus weiteren möglichst unabhängigen Messverfahren, sofern solche zugänglich sind. Eine grössere Stichprobe oder wiederholte Messungen mittels identischem Verfahren können jedoch systematische Fehler nicht zum Verschwinden bringen, da man schlicht und einfach nicht das misst, was man zu messen glaubt!
Manchmal hilft bereits ein kurzes Gespräch mit einer statistisch ausgebildeten Person, den Erfolg oder die Arbeitseffizienz in einem Projekt deutlich zu steigern. In diesem Sinne freuen sich die Statistiker bzw. Statistikerinnen an der ZHAW, mit Ihnen zusammenarbeiten zu dürfen:
Statistikberatung am IDP in Winterthur (www.idp.zhaw.ch/statistikberatung)
Statistikberatung am IAS in Wädenswil (www.ias.zhaw.ch/statistikberatung).
Die ersten zwei Kontaktstunden werden dabei unbürokratisch von der ZHAW finanziert.
Dieser Beitrag wurde von Martin Frey und René Locher verfasst. Weitere Beiträge in der Serie zu Statistik-Themen finden Sie hier:
Falls auch Sie Ideen zu Forschungsthemen haben, die WissenschaftlerInnen der ZHAW und anderer Hochschulen interessieren könnten, melden Sie sich bitte unten mit einem Kommentar oder direkt an Astrid Messerli.