01.10.2018

Maschinelle Übersetzung: Jetzt oder Später?

Home › Technologien, KI und Digitalisierung › Maschinelle Übersetzung: Jetzt oder Später?

Die Evolution maschineller Übersetzungen

„Kernseife = nuclear soap“. Die Zeit, als Google derart lustige maschinelle Übersetzungen (MÜ) bereitstellte, ist längst passé. Heute müssen selbst die schärfsten Kritiker von MÜ zugeben, dass die Ergebnisse deutlich besser geworden sind, wenn auch i.d.R. zusätzliche Bearbeitungsschritte notwendig sind, um sie weiter zu verwenden. Warum tun es sich also die Unternehmen schwer, bereits heute MÜ-Systeme auf breiter Basis einzuführen? Manche Versprechen sagen ja traumhafte Produktivitätssteigerungen und Einsparungen voraus.

Warum zögern Unternehmen noch?

Die Antwort ist eine Kombination unterschiedlicher Gründe. Wenn alle Fakten und Erfahrungswerte klar und deutlich auf dem Tisch lägen, wäre die Entscheidung für oder gegen MÜ bedeutend leichter zu fällen. Man wüsste, welches Ergebnis zu erwarten wäre, wie hoch die Investitionen in Hardware, Software und Arbeitszeit wären und könnte abwägen, ob die Investition sinnvoll ist. Obwohl bereits sehr viel zu diesem Thema publiziert worden ist, fehlt vielen Entscheidern eine Art Leitfaden, wie sie die Einführung von MÜ in ihrem Unternehmen angehen können. Wir versuchen hier, die wesentlichen Punkte darzulegen.

Entscheidungsfaktoren für MÜ-Systeme

Als erstes ist es wichtig, sich ein klares Bild von den Zielen zu machen, die man mit MÜ erreichen möchte. Geht es primär um Kosteneinsparungen, um Zeitgewinn oder um die Bewältigung von Informationsmengen, die mit Humanübersetzern nicht zu schaffen sind, um nur einige der möglichen Ziele zu nennen.

Kostenvergleich: MÜ-Systeme vs. Humanübersetzer

Wenn es um die Kosten geht, ist es zunächst einmal wichtig, die richtige Vergleichsbasis herzustellen. Auf der einen Seite stehen alle Kosten, die mit dem Aufbau und dem Betrieb eines MÜ-Systems, eventuell in Kombination mit Ausgaben für Post-Editing, zusammenhängen und auf der anderen Seite die Kosten von Humanübersetzern, wenn diese regelmäßig mithilfe von Übersetzungsdatenbanken (Translation-Memorys) übersetzen. Der Einsatz von Translation-Memory-Systemen zusammen mit Redaktionssystemen hat in den letzten Jahren bei vielen Unternehmen bereits zu deutlichen Kosteneinsparungen geführt.

Der Zeitfaktor: Schnelligkeit vs. Qualität

Wenn der Zeitfaktor im Vordergrund steht, muss der Vergleich den Gesamtprozess einbeziehen. Bei der reinen Zeit für die Übersetzung eines Textes ist die Maschine eindeutig im Vorteil. Es ist ja Maschinenzeit. In manchen Situationen reicht das schon, etwa wenn es darum geht, den technischen Support in die Lage zu versetzen, auf Anfragen in Fremdsprachen schneller zu reagieren. Allerdings müsste man korrekterweise die gesamte Bearbeitungszeit für maschinelle Übersetzungen berücksichtigen. Die Maschine muss nicht nur einmal, sondern regelmäßig trainiert werden. Das bedeutet, dass in regelmäßigen Abständen die Ergebnisse von korrigierten Übersetzungen benutzt werden, um das MÜ-System zu optimieren. Ferner kommt der normalerweise erforderliche Zeitaufwand für das Post-Editing der maschinell übersetzten Texte hinzu. Die Aussagen über die Produktivität eines Post-Editors (Spezialist, der maschinelle Übersetzungen prüft) schwanken je nach Qualitätsmaßstab und MÜ-Output stark. Manche Post-Editoren setzen bspw. bei durchschnittlicher MÜ-Qualität und Qualitätsanspruch eine Leistung von max. 5000 bis 6000 Wörtern pro Arbeitstag an.

Schritte zur Implementierung von MÜ-Systemen

Ist man sich über die primären Ziele im Klaren, geht es um die konkrete Umsetzung eines MÜ-Vorhabens. In diesem Zusammenhang spielen viele Faktoren eine Rolle:

die Auswahl des Systems und der erforderlichen Hardware-Infrastruktur
die Auswahl und die Organisation von Trainingsdaten
das Entwerfen eines bzw. mehrerer MÜ- Prozesse
der Aufbau qualifizierter Ressourcen für das Post-Editing
die Risikoanalyse (Auf solche Analysen haben sich Dienstleister wie RisikoScouts spezialisiert.)

Training eines eigenes MÜ-Systems oder Standardlösung?

Grundsätzlich fällt die erste Entscheidung zwischen dem kompletten Aufbau eines eigenen MÜ-Systems mit eigener Infrastruktur und der Benutzung des MÜ-Systems eines Marktanbieters, das man mit eigenen Daten trainieren kann. Es gibt am Markt einige Open Source Systeme, die man kostenlos herunterladen kann und die übrigens auch von den meisten kommerziellen Plattformen verwendet werden: Moses (statistisches MÜ), OpenNMT oder TensorFlow NMT (neuronales MÜ). Solch ein System zu installieren ist zwar nicht einfach, aber es liegt wohl im Vermögen der meisten IT-Mitarbeiter eines Unternehmens, sodass das System selbst nicht das Problem ist. Vielmehr liegen die Herausforderungen bei der Anpassung des Basissystems und bei der Hardware, denn das Trainieren von Modellen geht mit enormen Rechnerleistungen einher. Die Konfiguration und die Erweiterung des installierten Basissystems sind nicht trivial und können eigentlich nur erfolgreich funktionieren, wenn man ein tiefes Verständnis der Funktionsweise statistischer und neuronaler MÜ-Systeme hat. Der IT-Verantwortliche muss beispielsweise Parameter wie die Anzahl der Epochen (Lernzyklen) oder die optimale Breite der Worteinbettungen oder Wortvektoren („embedding size“) festlegen. Daher empfiehlt es sich, diese Arbeit einem der spezialisierten Anbieter maschineller Übersetzungsplattformen zu überlassen, wenn man diese Kenntnisse nicht im Hause hat bzw. nicht aufbauen kann. Hat man jedoch diese Ressourcen im Hause, ist man natürlich besser gewappnet, um individuelle Anforderungen zu berücksichtigen und umzusetzen.

Wer ein bereits vorkonfiguriertes System benutzt, ist nicht gleich startklar. Zuerst müssen für alle benötigten Sprachkombinationen Trainingsdaten besorgt und auch optimiert werden. Neben den (großen) Mengen an Trainingsdaten ist deren Qualität extrem wichtig, wenn man gute Ergebnisse erzielen möchte.

Translation-Memorys eignen sich für das Training, wenn sie qualitativ hochwertig sind. Die Firma Autodesk benutzte bspw. ca. 9 Millionen englisch-japanische Segmente, um ihre statistische Engine Moses zu trainieren. Diese Trainingsdaten müssen zuerst einmal thematisch zu künftigen Übersetzungsprojekten passen, aber auch sprachlich und technisch so perfekt wie möglich sein. Translation- Memorys sind das Ergebnis langjähriger Übersetzungstätigkeit durch Humanübersetzer und können auch Fehler, Inkonsistenzen oder Teilsegmente enthalten, die man bei künftigen Übersetzungen nicht wieder haben möchte. Diese Daten zusammenzustellen und zu bereinigen ist zeitaufwändige Arbeit, die bei der Gesamtbewertung der Alternativen maschinell oder human berücksichtigt werden sollte.

Post-Editing: Unverzichtbar für Qualität

In der Regel bedeutet die Einführung eines MÜ-Systems auch neue Prozesse für ein Unternehmen. Die Arbeit wird anders organisiert, andere Ressourcen werden benötigt. Soll das System allein funktionieren oder in Kombination mit Translation-Memory-Systemen? Möchte man regelmäßig die Qualität der Ergebnisse messen, um an der Optimierungsschraube zu drehen? Wie geht das? Welche Maßstäbe werden angesetzt? Das sind ebenfalls Fragen, die im Vorfeld zu klären sind. So kann sich beispielsweise herausstellen, dass es bei einigen Sprachen besser ist, die Ausgangstexte vor der eigentlichen Übersetzung anzupassen, um bestimmte Maschinenfehler zu vermeiden. Ein wichtiger Schritt ist das Post-Editing. Dazu werden Fachleute benötigt, die besonders für diese Art von Arbeit geschult sind, denn zum einen machen Maschinen ganz andere Fehler als Humanübersetzer und zum anderen machen nicht alle Systeme (statistisches maschinelles Übersetzen SMT bzw. neurales maschinelles Übersetzen NMT) die gleichen Fehler. Der Post-Editor muss also auf unterschiedliche Merkmale achten.

Risikoanalyse: Abwägen von Vor- und Nachteilen

Schließlich kommt noch die Risikoanalyse zum Tragen. Auch wenn die maschinell erstellte Übersetzung bei entsprechenden Mengen günstiger ist als die Humanübersetzung, ist das Risiko, das von einer solchen Übersetzung für das Unternehmen ausgeht, deutlich größer. Denn Maschinen machen, wie bereits gesagt, andere Fehler als Menschen. Einer dieser regelmäßigen Maschinenfehler ist, dass eine gut klingende Übersetzung manchmal mehr bzw. weniger Informationen enthält, als das, was im Ausgangstext steht. Nicht alle Post-Editoren, die ja nicht zu langsam sein dürfen, erkennen das bei plausibel klingenden Übersetzungen.

Fazit und Ausblick

Heute kann niemand pauschal eine Aussage für oder gegen MÜ treffen. Wer die obigen Punkte für seine Situation und sein Unternehmen beantwortet, hat schon eine sachliche Entscheidungsgrundlage. Falls die Vorteile von MÜ überwiegen, empfiehlt es sich, mit einer Sprachkombination anzufangen für die es ausreichend Trainingsdaten gibt und die besser übersetzbar ist. Damit werden erste Erfahrungen gesammelt, die auf weitere Sprachen übertragen werden können.