Maschinelle Übersetzung

MÜ-Programme (häufig auch - irrtümlich - als Volltextübersetzer bezeichnet) versuchen, einen Text selbstständig zu übersetzen. Die meisten aktuellen Programme arbeiten auf Satzebene, einige modernere beziehen auch Teile des Gesamttextes in gewisser Weise mit ein. Ältere, sehr billige Programme arbeiten oft Wort für Wort und eignen sich allenfalls als elektronische Wörterbücher. Zum Übersetzen sind sie ungeeignet. Aber auch bessere Programme sind nur sehr selten in der Lage, korrekte Übersetzungen zu liefern. Sinnvoll ist ihr Einsatz für Rohübersetzungen, die nachbearbeitet werden sollen, oder wenn man nur einen ungefähren Überblick über den Inhalt eines fremdsprachlichen Textes bekommen möchte. Meist ist jedoch eine konventionelle Übersetzung weniger zeitaufwändig, kostengünstiger und vor allem zuverlässiger.

Funktionsweise

Grob gesagt bestehen MÜ-Programme aus einer Wörterbuchkomponente, die für die Übersetzung der ausgangssprachlichen Wörter sorgt, und einem Grammatik-Modul, das für die Erzeugung der Satzstruktur in der Zielsprache und ggf. für die Analyse des ausgangssprachlichen Satzes verantwortlich ist. Die genauere Funktionsweise der einzelnen Programme unterscheidet sich jedoch erheblich.

Ältere Übersetzungsprogramme verfolgen meist den sogenannten direkten Ansatz. Sie enthalten oft nur eine kleine Grammatikkomponente. Der Satz des Ausgangstextes wird zunächst Wort für Wort mithilfe des integrierten Wörterbuches übersetzt und anschließend an die grammatische Struktur in der Zielsprache angepasst. Eine grammatische Analyse des ausgangssprachlichen Satzes findet nicht statt. Dieses simple Übersetzungsprinzip liefert sehr schlechte Ergebnisse; korrekte Übersetzungen entstehen hier nur, wenn die Strukturen der beiden Sprachen zufällig identisch oder sehr ähnlich sind.

Modernere Systeme, die eine bessere Übersetzungsqualität bieten, arbeiten nach dem Transfer-Prinzip. Hier wird zuerst die grammatische Struktur des Ausgangssatzes analysiert, anschließend werden die grammatische Struktur und die Wörter in die Zielsprache übertragen. Aus diesen Daten wird daraufhin der zielsprachliche Satz erzeugt (generiert). Ähnlich funktionieren auch Interlingua-Systeme. Dabei wird der ausgangssprachliche Satz in der Analysephase in eine abstrakte Zwischensprache überführt, aus der in der Generierungsphase der zielsprachliche Satz erzeugt wird. Problematisch ist es jedoch, eine wirklich abstrakte Beschreibungssprache erst einmal zu finden, häufig beschränkt man sich daher auf die Überführung der grammatischen Informationen und nutzt für die Übersetzung der Wörter das Transfer-Prinzip. Vorteile der Interlingua liegen jedoch bei der Übertragung komplizierter sprachlicher Strukturen, da hier der Abstraktionsgrad höher ist als bei Transfersystemen. Da diese beiden Ansätze zur Übersetzung im Wesentlichen linguistische Regeln heranziehen, werden sie auch als regelbasierte MÜ (Rule-based Machine Translation, RBMT) bezeichnet.

Im Kontrast zur regelbasierten MÜ steht die statistische maschinelle Übersetzung (Statistical Machine Translation, SMT). Hierbei wird eine umfangreiche zweisprachige Textsammlung analysiert, und auf dieser Basis werden ein Wörterbuch und sowie grammatische Transferregeln erzeugt. Auf diese Weise kann man sehr schnell ein neues System für unbekannte Sprachen aufbauen. Da dies automatisch geschieht und der SMT-Ansatz vergleichsweise jung ist, fällt die Übersetzungsqualität allerdings noch deutlich schlechter als bei regelbasierten Systemen aus.

Ein weiteres Verfahren, das bei vielen professionellen Programmen meist ergänzend zum Einsatz kommt, ist die beispielbasierte MÜ (Example-Based Machine Translation, EBMT). Hierbei wird auf ein Translation-Memory (TM), wie es auch von CAT-Programmen genutzt wird, zurückgegriffen. In solchen TMs sind vorhandene Übersetzungen gespeichert, die bei identischen Sätzen einfach eingefügt werden können. Zusätzlich werden die TMs auch genutzt, um bei ähnlichen Sätzen mithilfe der gespeicherten Sätze die Übersetzungen zu erzeugen.

Da alle aktuellen Ansätze jeweils bestimmte Stärken und Schwächen aufweisen, werden bei den meisten Systemen in der Praxis mehrere dieser Methoden kombiniert.