Am 15. Juni 2021 fand das achte Treffen der an Statistik interessierten Personen der ZHAW statt. Aufgrund der speziellen Situation wurde das Treffen auch in diesem Jahr virtuell über MS Teams im ZHAW Statistik-Club durchgeführt. Insgesamt haben 26 Personen aus sechs Departementen und der zentralen Verwaltung daran teilgenommen.
Die Teilnehmenden wurden durch Andreas Fürholz (Ressort F&E/DL / Koordinator ZHAW Services Forschungsdaten) begrüsst und kurz über den aktuellen Stand des Angebots von ZHAW Services Forschungsdaten informiert. Das Team ZHAW Services Forschungsdaten ist nun komplett und der Ausbau des Service-Portfolios auf Kurs. Mit dem Hinweis auf das Open Science Café, ein virtueller Begegnungsort um sich über Open Data Themen an der ZHAW auszutauschen, übergab Fürholz das Wort an Vanessa Klaas (Ressort F&E/DL / ZHAW Services Forschungsdaten), die direkt in R-Studio zeigte, wie einfach Daten aus REDCap, ein Tool zur Erfassung und Verwaltung von Daten, in die Statistiksoftware R importiert werden können.
Im Anschluss präsentierte Matthias Templ (Institut für Datenanalyse und Prozessdesign, School of Engineering) den Kontext und die Idee für das Kompetenzzentrum für Datenanonymisierung, welches in den nächsten Wochen als Lab im ZHAW Netz aufgeschaltet wird. Im ersten Teil des Vortrages wurden die Unterschiede zwischen Anonymisierung und Pseudoanonymisierung anhand eines Beispiels erläutert, wobei letzteres auch heute noch oft verwendet wird, aber kaum Schutz vor einer Re-Identifizierung bietet. Templ machte klar, dass absolute Anonymisierung nicht möglich ist und vom Gesetz auch nicht gefordert wird. Es wird eine sog. De-facto-Anonymität angestrebt, welche dann vorliegt, wenn der Aufwand zur Re-Identifizierung höher ist als der Nutzen, den die Daten liefern. Allerdings ist es kompliziert des Re-Identifizierungsrisiko abzuschätzen, da es stark von der Art und Struktur der erhobenen Daten abhängt sowie der verwendeten Anonymisierungsmethoden, auf die aus zeitlichen Gründen nicht im Detail eingegangen werden konnte. Templ wies am Schluss seines Vortrages darauf hin, dass keine Standardverfahren für Datenanonymisierung existieren, sondern von Fall zu Fall entschieden werden muss und mehrjährige Erfahrung dazu notwendig sei. Mit dem Kompetenzzentrum für Datenanonymisierung wird nun an der ZHAW eine Anlaufstelle geschaffen, an dem dieses Wissen gebündelt ist und internen und externen Partnern zur Verfügung steht.
Matthias Nyfeler (Institut für angewandte Simulation, Life Sciences und Facility Management) präsentierte zwei Softwaretools, die für die Lehre im Bachelorstudiengang Facility Management eingesetzt werden. Zum einen ist dies die freie Statistiksoftware PAST4 für den Einstieg in die Datenanaylse. PAST4 beinhaltet ein einfaches Excel ähnliches GUI, welches den angehenden Facility Manager*innen einen relativ niederschwelligen Zugang für statistische Analysen bietet, da keine Programmierkenntnisse notwendig sind. Durch den Einsatz von PAST4 bleibt für die Studierenden somit mehr Zeit sich mit den statistischen Konzepten auseinanderzusetzen. Beim Einsatz von skriptbasierten Softwaretools kommt dies oft zu kurz, da sehr viel Zeit für das Erlernen der Programmiersprache investiert werden muss. Als zweites Tool stellte Nyfeler das R Paket exams vor. Exams ermöglicht mit wenig Aufwand vollständig randomisierte Prüfungen zu erstellen. Zusammen mit R Markdown können so einfach Prüfungsaufgaben sowohl für Tests in Moodle als auch klassische Prüfungen auf Papier erstellt werden.
Samuel Wehrli (Direktionsstab Soziale Arbeit) konnte seinen geplanten Beitrag über Methoden zur besseren Abschätzung der Erfolgschancen von Interventionen im Kindesschutz nicht präsentieren, da der Projektpartner noch keine Daten geliefert hat. Als Alternative stellte Wehrli zusammen mit Norman Juchler (Institut für angewandte Simulation, Life Sciences und Facility Management) Grafana vor, ein Softwaretool zur Visualisierung von Zeitreihen und Metriken. Grafana beinhaltet ein automatisiertes downsampling Verfahren und ermöglicht damit ein interaktives Erkunden sehr grosser Datenmengen. Die Daten werden dabei in Echtzeit via Requests von einer Datenbank geholt. Wehrli verwendet dazu das freie Datenbankmanagementsystem InfluxDB und demonstrierte die Software am Beispiel von Bewegungsdaten, welche durch sog. Wearables mit Beschleunigungssensoren erfasst wurden – einmal von Kindern mit und ohne ADHS sowie von Patienten eines Spitals.
René Locher (Institut für Datenanalyse und Prozessdesign, School of Engineering) berichtete von seinen Erfahrungen beim Wechsel von Windows auf das Linux Betriebssystem Kubuntu. Auf einem privaten Laptop ist Linux genau so schnell und reibungslos installiert wie Windows10. Es existieren für Linux auch alle für die Arbeiten an der ZHAW notwendigen Softwareapplikationen bzw. freie Versionen davon. Damit unterliegt man praktisch keinen Einschränkungen in der täglichen Arbeit, profitiert aber gleichzeitig von den Vorteilen, welche Linux bietet wie z.B. paralleles Ausführen von Code in R. Da die ZHAW momentan noch keinen offiziellen Linux Support anbietet, war die Integration von Linux in die ZHAW-Umgebung relativ aufwändig. Neue Linux-Interessenten werden es nun aber deutlich einfacher haben, da es mittlerweile für ZHAW-spezifische Probleme das Linux Wiki https://lug.wiki.zhaw.ch/ und den Linux User Club (LUG) als Mailingliste lug@lists.zhaw.ch gibt. Beide Anlaufstellen werden tatkräftig von 6 Linux-Spezialisten in der ICT unterstützt.
Der MS Teams Kanal ZHAW Statistik-Club bleibt weiterhin als niederschwellige Austauschplattform für ZHAW Mitarbeitende mit Anliegen rund um die Statistik bestehen.
Die Folien der Beiträge können hier heruntergeladen werden.
Auch nächstes Jahr ist im Juni ein Treffen über Erfahrungen mit statistischen Themen in Lehre und Forschung geplant. Personen, welche sich ebenfalls an diesem Austausch beteiligen möchten und nicht bereits für das diesjährige Treffen angefragt wurden, können sich gerne bei Christoph Hofer melden.
Die fundierte Anwendung von statistischen Methoden ist in der Forschung Voraussetzung für qualitativ hochwertige Arbeiten. Die ZHAW bietet deshalb allen Forschenden der ZHAW eine niederschwellige Möglichkeit, sich in statischen Fragen beraten zu lassen (die ersten beiden Beratungsstunden sind gratis). Weitere Details finden sich unter:
Statistische Beratung in Winterthur
Statistische Beratung in Wädenswil
Christoph Hofer, Institut für Datenanalyse und Prozessdesign