Swiss-AL, die an der ZHAW entwickelte Plattform für Sprachdaten für die angewandte Forschung, umfasst mit über 4.5 Millionen Texten die grösste Korpusfamilie der Schweiz. Die Plattform wird zu einer Open-Research-Data-Ressource entwickelt. Welche rechtlichen Fragen sind dabei relevant?
Gastbeitrag von Prof. Dr. Philipp Dreesen, Institute of Language Competence, und Daniela Baumann, Institut für Angewandte Medienwissenschaft.
Die Plattform Swiss-AL enthält Texte von zentralen Akteuren öffentlicher Kommunikation in der Schweiz (z.B. journalistische Medien aus der gesamten Schweiz, Bundes- und kantonale Behörden, Berufsverbände, Wirtschaftsunternehmen, Universitäten, NGOs), dies in vier Sprachen (Deutsch, Französisch, Italienisch und Rätoromanisch). Diese dienen Forschenden und an Sprachdaten Interessierten als Datengrundlage für die Untersuchung aktueller gesellschaftlicher Diskurse – schon heute und ab 2025 mit komplett neuen Möglichkeiten. Dies ist aber nur möglich, wenn ein öffentlicher Zugang zu Daten gewährleistet ist: Seit Anfang des Jahres wird deshalb Swiss-AL zu einer Open-Research-Data-Ressource weiterentwickelt. Dies vollzieht sich im Rahmen des Projekts «Swiss-AL: Linguistic ORD Practices for Applied Sciences» (im Folgenden Swiss-ALCHORD), finanziert von der ZHAW und swissuniversities im Rahmen der Schweizer Open Science Strategie.
Doch nicht nur Swiss-AL ändert sich. Auch die rechtlichen Rahmenbedingungen sind im Wandel: Man denke etwa an das neue Schweizer Datenschutzgesetz, die relativ neue Wissenschaftsschranke im Urheberrecht und die möglichen Wirkungen des EU Digital Act. All dies betrifft auch die Arbeit mit rechtlich bedenklichen Daten, genauer mit Daten, die urheberrechtlich und/oder datenschutzrechtlich relevant sind.
Rechtliche Unsicherheiten in der Open Science Transformation
Das sich fortentwickelnde Recht berücksichtigt die digitale Transformation – von der Berücksichtigung bestimmter rechtlicher Aspekte in der digitalen Transformation sind wir in der Forschung aber noch weit entfernt. Wenn Swiss-AL demnächst von allen Forschungsbereichen, die mit Sprachdaten arbeiten, genutzt werden soll, brauchen alle Beteiligten rechtliche Gewissheit im Umgang mit Daten: Was dürfen wir technisch mit den Daten tun? Wer darf Zugriff bekommen? Dürfen wir die Daten teilen? Wo dürfen Daten gespeichert werden? Wie verhält es sich mit Schweizer Recht, EU-Recht und insbesondere US-amerikanischem Recht? Was ist zu beachten bei Fragen der Lizensierung von Datenanalyse-Softwares? Je tiefer man sich mit diesen und weiteren Fragen befasst, desto deutlicher wird, welche Expertisen erforderlich sind, um Entscheidungen treffen zu können. Wir Forschenden treten dabei in unterschiedlichen Rollen auf – beispielsweise als Datenanbieter:innen, als Datennutzer:innen oder als Nutzer:innen von Daten-Repositories.
Sich mit diesen Fragen zu befassen, bringt die Angewandte Forschung weiter. Dies, indem wir Sicherheit bekommen: Sind Datensätze (z.B. Korpora) in Forschungs- und Entwicklungsprojekten erstellt und basieren auf rechtlichen Verträgen, zum Teil mit Geheimhaltungspflicht, ist das Teilen von Daten und damit von Forschungsergebnissen erschwert. Best Practices wie das Teilen der Daten in aggregierter Form sind bisher in vielen Disziplinen noch nicht entstanden. Bestehen demnächst in interdisziplinären Projekten unterschiedliche rechtliche Vorstellungen über Chancen und Risiken des Datenteilens, basierend auf Erfahrungen und Erwartungen, benötigen wir heute Gewissheiten über rechtliche Dimensionen unserer ORD-Praktiken. Sind die ORD-Vorgaben von institutionellen Forschungsförderungen mit datenschutz- und urheberrechtlichen Rahmen unvereinbar, müssen wir jetzt gemeinsam Lösungen finden.
Das Projekt Swiss-ALCHORD sucht den Dialog mit Forschenden und Expert:innen
Das Swiss-ALCHORD-Projekt hat von Beginn an Expert:innen aus dem Bereich Datenschutz und Urheberrecht einbezogen. Damit wird dem Umstand Rechnung getragen, dass Open Science als tiefgreifender Transformationsprozess nur gelingen kann, wenn Personen aus unterschiedlichen Bereichen wie dem Recht, den Sprachdaten-nutzenden wissenschaftlichen Disziplinen, den Dateninfrastrukturen (z.B. CLARIN) sowie den ORD-Institutionen an den Hochschulen (z.B. ZHAW Services Forschungsdaten) eng zusammenarbeiten. Konkret stellt sich die Frage: Wie ist es möglich beim Zugänglichmachen von Forschungsdaten sowohl den FAIR-Prinzipien wie auch dem Datenschutz- und Urheberrecht zu entsprechen?
Die Diskussion dieser Frage und die möglichen Antworten werden wir mit Forschenden der Angewandten Wissenschaften und vier Fachpersonen während einer Podiumsdiskussion am 28. November 2023 diskutieren. Denn aktuell bestehende Widersprüche und sich abzeichnende Dilemmata sind nicht zufriedenstellend bei der Entstehung von nachhaltigen Lösungen, wie sie aktuell entwickelt werden (z.B. SwissUBASE, CLARIN, Swiss-AL).
Weitere Informationen:
- Das Swiss-ALCHORD-Projekt
- Podiumsdiskussion am 28.11.2023
- Kontakt: digitaldiscourselab.linguistik@zhaw.ch