Oh nein – nicht schon wieder ein KI-Blog… Keine Angst, das wird weder ein euphorischer noch ein kulturpessimistischer Beitrag zu den Umwälzungen durch Künstliche Intelligenz (KI) – aber ein durchaus optimistischer. Ich werde nur ein paar nützliche Anwendungen zeigen, wie KI bei der statistischen Datenanalyse helfen kann – vielleicht auch Ihnen!
Einstieg in die Datenanalyse mit KI
Ob Studierende der Sozial- und Naturwissenschaften, Fachkräfte im Gesundheitswesen, der öffentlichen Verwaltung oder sonstwo – Grundkenntnisse in Datenanalyse sind heute für viele sehr wichtig. Aber der Einstieg in ein Statistikprogramm ist oft steinig und frustrierend. Dieser Beitrag zeigt vier Strategien, wie KI den Start mit eigener Datenanalyse stark erleichtert.
Selbst komplexere Analysen sind damit für Einsteiger:innen in kurzer Zeit möglich. Welche Strategie passt zu Ihnen? Für schnelle Analysen eignen sich KI-Tools wie ChatGPT. Wer sich ein professionelles Statistikprogramm wie R aneignen möchte, kann spezialisierte Datenanalyse-Tools wie R-Tutor nutzen. Für maximale Kontrolle ist die Generierung von lokal ausführbarem Code mit einem LLM (Large Language Model) empfehlenswert. Und für Fortgeschrittenere bieten KI-unterstützte Editoren wie VS Code mit Copilot einen optimalen Arbeitsfluss.
Strategie 1: Datenanalyse direkt in KI-Tools (z.B. ChatGPT)
Bei dieser Methode laden Sie Ihre Daten direkt in ein KI-Tool. Dieses versteht Ihre Anweisungen in natürlicher Sprache und führt die Analyse durch.
- Daten hochladen (z.B. Excel-Datei)
- Analyse in natürlicher Sprache anstossen
- KI generiert und führt Code aus (z.B. Python in ChatGPT)
- Ergebnisse und Grafiken werden unmittelbar angezeigt
- Optional: Analyse-Code anzeigen lassen
Beispiel-Prompt:
„Bitte vergleiche die Variable ’subjektive Gesundheit‘ nach dem Raucherstatus und führe einen t-Test durch.“
Das KI-Tool führt die Analyse in wenigen Sekunden durch. Beachten Sie jedoch: Sensible Daten sollten nicht in der Cloud verarbeitet werden. Für solche Daten empfiehlt es sich, auf Alternativen zurückzugreifen, bei denen die Daten lokal verarbeitet werden. Kontrollieren Sie stets, ob die KI Ihre Anweisungen korrekt verstanden hat und ob es nicht Probleme mit den Daten gab.

Strategie 2: Datenanalyse mit spezialisierten KITools (z.B. R-Tutor)
R-Tutor ist ein KI-Tool, das Aufforderungen direkt in der weit verbreiteten Statistiksoftware R umsetzt. Daten können direkt im KI-Tool analysiert werden.
- Daten hochladen (z.B. Excel-Datei)
- Analyse in natürlicher Sprache anstossen
- KI generiert R-Code und führt ihn aus
- Ergebnisse werden angezeigt, interaktive Grafiken sind möglich
- Code bei Bedarf manuell anpassen
Beispiel-Prompt:
„Mach einen t-Test mit Outcome ‘subjektive Gesundheit’ nach dem Raucherstatus. Produziere dazu eine interaktive Grafik (Balkendiagramm) mit Konfidenzintervallen.“
R-Tutor erleichtert den Einstieg in die professionelle Datenanalyse und ist ideal für Anwender:innen, die sich mit R vertraut machen möchten.

Strategie 3: Code-Generierung für Statistiksoftware wie R oder Stata mit LLMs (Large Language Models)
Lassen Sie Code für R und andere Statistikprogramme durch ein LLM (wie ChatGPT) generieren und führen Sie diesen dann in einem Statistikprogramm wie RStudio oder Posit.cloud aus.
- LLM in natürlicher Sprache auffordern, Code für eine bestimmte Analyse zu generieren. Idealerweise gleich die korrekten Variablennamen angeben.
- LLM generiert Code (z.B. in R)
- Code in Statistikumgebung (z.B. RStudio) einfügen und ausführen
- Bei Bedarf: Output in LLM einfügen und um Interpretation fragen
- Bei Fehlern: Code und Fehlermeldung wieder in LLM einfügen und um Korrektur des Analyse-Codes bitten
Anstatt selbst Code für ein Statistikprogramm zu schreiben, formulieren Sie Ihre Anforderung in natürlicher Sprache: Beispiel-Prompt:
„Generiere mir R-Code für einen T-Test zwischen ‘Raucherstatus’ (smoker) und ‘subjektive Gesundheit’ (health). Mit einer prägnanten Grafik.“
Die KI generiert den Code, den Sie anschliessend in RStudio einfügen. Vorteil: Ihre Daten bleiben lokal, nur der Code wird im KI-Tool generiert. Ideal für sensible Daten und einen hohen Lerneffekt: Sie schauen sich den generierten Code an und können ihn in groben Zügen nachvollziehen. Bedenken Sie, dass die Qualität des generierten Codes variieren kann. Es klappt besser, wenn Sie die einzelnen Analyse-Schritte genau spezifizieren. Eine gewisse Grundkenntnis in der jeweiligen Statistiksoftware ist hilfreich. Dafür haben Sie die volle Kontrolle über das Vorgehen und Lernen selbst Code zu schreiben.

Strategie 4: Datenanalyse mit KI-unterstützten Code-Editoren (z.B. VS Code mit Copilot)
Die professionelle Variante: Code direkt in einem Editor schreiben und sich dabei von KI unterstützen lassen.
- KI-unterstützten Editor nutzen (z.B. Visual Studio Code mit Copilot)
- Analyse in natürlicher Sprache anstossen
- Editor generiert Code
- Code direkt im Editor anpassen und ausführen
Der Code wird im Editor mit KI-Unterstützung entwickelt und angepasst – und dann direkt im Statistikprogramm ausgeführt. VS Code bietet verschiedene LLMs zur Auswahl (ChatGPT, Gemini, Claude, etc.). Das Copy-Paste zwischen KI-Tool und Statistikprogramm entfällt und ganze Analyse-Projekte mit mehreren tausend Zeilen Code können bearbeitet werden. Diese Methode ist vielseitig und ideal für Anwender:innen, die regelmässig programmieren. Die Nutzung von KI-unterstützten Code-Editoren erfordert eine gewisse Einarbeitungszeit – dafür ist die Arbeit nachher sehr effizient.

KI unterstützt – aber ersetzt nicht kritisches Denken
Dank KI ist statistische Datenanalyse zugänglicher denn je. Was früher grössere Programmierkenntnisse und viel Einarbeitungszeit erforderte, ist nun auch für Einsteiger:innen rasch realisierbar.
Braucht es in Zukunft keine fundierten Statistik- und Datenanalyse-Kompetenzen mehr? Doch, solide Kenntnisse statistischer Konzepte bleiben essentiell: Denn ein T-Test ist nur dann sinnvoll, wenn Sie wissen, wann er angebracht und wie er zu interpretieren ist. KI unterstützt die Datenanalyse und macht sie effizienter, ersetzt aber nicht das eigene kritische Denken.
Neben den hier vorgestellten Strategien für einen raschen Einstieg gibt es noch viele weitere. Die KI-Landschaft ist dynamisch und es tauchen ständig neue Tools und Methoden auf.
Bleiben Sie neugierig und offen für Neues!
Marc Höglinger ist Leiter Versorgungsforschung am Winterthurer Institut für
Gesundheitsökonomie. Er ist Dozent für Datenanalyse und Statistik.