Um Airbnb-Bewertungen von fremdsprachigen Gästen zu verstehen (und zu wissen, worauf ihr euch beim nächsten Urlaub einlasst), sind automatische Übersetzer wie DeepL oder Google Translate eine grosse Hilfe. Aber sind solche Tools auch geeignet, um Forschungsergebnisse zu übersetzen? Alice Delorme Benites vom ZHAW Institut für Übersetzen und Dolmetschen (IUED) erklärt, warum sie lieber ein eigenes Übersetzungssystem für die ZHAW entwickelt.
Was heisst «Alles Gute zum Geburtstag» auf Chinesisch? Wenn ihr euren entfernten Verwandten einen Gruss in ihrer Landessprache schicken wollt, könnt ihr auf maschinelle Übersetzungssysteme wie DeepL oder Google Translate vertrauen.
Alice Delorme Benites vom ZHAW-Departement Angewandte Linguistik weiss, dass solche Tools auch unter Forschenden beliebt sind. Im Rahmen eines DIZH Fellowships und eines Projekts des Digital Futures Fund untersucht sie, wie man maschinelle Übersetzungen für Papers, Abstracts oder Forschungsanträge nutzen kann und was es dabei zu beachten gibt.
Weil DeepL und Co. nicht immer fehlerfreie Ergebnisse liefern, arbeitet Alice an einem eigens für die ZHAW entwickelten maschinellen Übersetzungssystem. Es spricht viel für eine solche interne Lösung:
1. Die besten Studienergebnisse werden international nur veröffentlicht, wenn sie sprachlich einwandfrei sind.
Laut Alice haben hervorragende Forschungs- und Studienergebnisse nur dann eine Chance veröffentlicht zu werden, wenn sie sprachlich auf einem hohen Niveau sind. Selbst bahnbrechende Studien werden international nicht beachtet, wenn sie mit nur mittelmässigen Englischkenntnissen verfasst wurden.
Sprachkurse sind aber zeitintensiv. «Diese Zeit fehlt dann für die Forschung. Eine maschinelle Übersetzung kann die Forschenden unterstützten, aber nur, wenn ihre Sprachkenntnisse gut genug sind, um diese Übersetzung zu prüfen. Ein auf die Hochschule optimiertes System ist genauer und erzielt bessere Ergebnisse», sagt Alice.
2. Modalverben machen den Unterschied: «Das Medikament kann etwas bewirken.»
In wissenschaftlichen Publikationen kommt es auf sprachliche Feinheiten an. Dahinter stecken oftmals Modalverben. Es macht einen Unterschied, ob ein Medikament eine bestimmte Wirkung oder Nebenwirkung haben «kann», «wird» oder «soll». Eine fehlerhafte Übersetzung kann verheerende Folgen haben.
«Die üblichen Tools liefern heute bereits Ergebnisse, die grammatikalisch korrekt übersetzt sind. Aber die wichtige Botschaft der Autoren oder die Textkohäsion können dabei verloren gehen. Die automatische Übersetzung sieht super aus, aber trotzdem ist nicht mehr klar, was die Autoren sagen wollen», sagt Alice.
3. Unveröffentlichte Forschungsergebnisse landen sonst direkt bei Google.
Der wichtigste Grund, warum sich eine Hochschule ein eigenes maschinelles Übersetzungssystem zulegen sollte ist ein sicherer Umgang mit Forschungsdaten. «Die Menschen legen grossen Wert auf Datenschutz und sind bei Cookies zum Beispiel vorsichtig. Aber gleichzeitig speisen sie ihre unveröffentlichten Forschungsergebnisse bei Google Translate ein. Das passt nicht zusammen», sagt Alice.
Ein hochschuleigenes System soll also nicht nur die Qualität der Übersetzung verbessern, sondern vor allem zu einer sichereren Nutzung beitragen. «Vielen sind diese datenschutzrechtlichen Aspekte gar nicht bewusst. Aber es ist wichtig, dass die Forschenden wissen, was mit ihren Daten geschieht, wenn sie einen Text mit Google übersetzen. Mit einem eigenen System können wir kontrollieren, wo die Daten gespeichert werden und so zu mehr Forschungssicherheit beitragen», sagt Alice. Der Prototyp, den Alice mit ihrem Team entwickelt, soll auf einem ZHAW-internen Server beherbergt sein, um einen optimalen Datenschutz zu gewährleisten.
4. Ein eigenes System kann optimal mit den Themenschwerpunkten der ZHAW trainiert werden.
Der Prototyp soll anhand der Forschungsschwerpunkte der ZHAW trainiert werden. Fachspezifisches Vokabular und Textstrukturen können so besser berücksichtigt werden und zu guten Ergebnissen führen. Das System wird zunächst für die Sprachkombination Deutsch-Englisch trainiert und kann später durch andere Sprachen, wie Französisch und Italienisch, erweitert werden.
5. Der hochschulinterne Übersetzungsdienst wird es uns danken – und wir ihm.
Ein von DeepL übersetzter Text sieht auf den ersten Blick gut aus, doch beim genaueren Hinsehen erkennt das geschulte Auge merkwürdige Textstellen. Das erschwert es dem ZHAW-internen Übersetzungsdienst, einen Text zu lektorieren. «Manchmal kommt es vor, dass die Mitarbeitenden einen Text mit DeepL übersetzen und ihn an den Übersetzungsdienst weiterleiten mit dem Auftrag zum Lektorat. Aber das Proofreading ist anders, wenn der Text nicht von einem Menschen stammt», erklärt Alice. Mit einem bekannten internen System wüsste der Übersetzungsdienst, wie ein Text zustande kommt und könne entsprechend arbeiten.
Der Übersetzungsdienst könnte bei Übersetzungsaufträgen auch selbst das maschinelle Übersetzungssystem nutzen, wenn der Kunde auf diese Weise Kosten sparen möchte.
6. Die Nachfrage nach internen Übersetzungssystemen in Unternehmen wird steigen – und unsere Absolventen werden mit ihnen arbeiten.
Grosse, mehrsprachige Unternehmen haben einen enormen Bedarf an Übersetzungsdienstleistungen. Auch sie greifen zu maschinellen Übersetzern wie DeepL und Google und stehen vor ähnlichen datenschutzrechtlichen Problemen. Den Geschäftsbericht mit den aktuellen Jahreszahlen vor Veröffentlichung mit Google übersetzen? Das ist vielen börsenkotierten Grosskonzernen zu heikel.
An der Universität Zürich ist ein Spin-off entstanden, das solche internen Lösungen für Unternehmen entwickelt. «Ihnen ist sicher nie langweilig, da sie immer viele Kunden haben», weiss Alice. Und die ZHAW bildet die Fachpersonen aus, die in den Unternehmen solche Systeme implementieren. «Die UZH bildet Computerlinguisten aus, die die Systeme bauen. Wir an der ZHAW bilden wiederum die Personen aus, die diese Projekte in den Unternehmen managen und anwenden sollen. Unsere Absolventen sollen auch eine beratende Funktion haben und beispielsweise erklären können, warum Menschen manchmal doch besser und sogar kostengünstiger arbeiten können», sagt Alice.
Fazit: Praktischer, sicherer, besser
Vieles spricht also für ein hochschulinternes maschinelles Übersetzungssystem. «Es ist praktischer und sicherer. Ausserdem können wir es immer weiter verbessern, indem wir das System mit Daten trainieren, die zur ZHAW passen», fasst Alice zusammen.
Der Prototyp des von Alice entwickelten Systems soll bis am Ende des Jahres fertig sein. «Das ist also kein Forschungsprojekt, sondern ein Entwicklungsprojekt. Unser Ziel ist es, ein System zu entwickeln, das viele ZHAW-Mitarbeitende gerne nutzen».
sehr spannend! danke