Die Masse macht's
Grundlagen: Maschinelles Übersetzen
Bislang waren die Erfolge beim automatischen Übersetzen menschlicher Sprache eher bescheiden. Neuen Aufwind versprechen nicht bessere Grammatikmodelle, sondern Statistik und rohe Rechengewalt. Davon profitiert wieder einmal Google.
- Grundlagen: Maschinelles Übersetzen
- Übersetzungsverfahren
- Statistische Verfahren

Wenn der Computer übersetzt, hat der Mensch etwas zu lachen. Übersetzungsprogramme liefern manchmal verständliche, selten korrekte und oft lustige Texte. Wer hin und wieder einen Online-Translator zu Rate zieht, muss oft schon bei einfachsten Sätzen schmunzeln. Die CNN-Meldung "Microsoft expects Adobe to file suit" (Microsoft erwartet, dass Adobe einen Prozess anstrengt") übersetzt ein Online-Dolmetscher mit "Microsoft erwartet luftgetrockneten Ziegelstein, um Klage einzuordnen". Solch dadaistische Texte muten mehr oder weniger alle digitalen Übersetzer ihren Nutzern zu. Tatsächlich aber taugt die maschinelle Übersetzung (MÜ) nicht nur zur Belustigung. Zwar ist trotz jahrelanger Forschungsanstrengungen der Mensch als Übersetzer immer noch jedem Programm überlegen. Doch in bestimmten Kontexten, mit entsprechend aufbereiteten Texten und guten Übersetzungsprogrammen wie Systran oder Personal Translator lassen sich zwar keine perfekten, aber doch passable Ergebnisse erzielen.

So berichten Unternehmen, die ihr Geld mit Übersetzungen verdienen, von Kosteneinsparungen um 30 Prozent und mehr, wenn sie ergänzend automatische Übersetzer einsetzen. Diese übernehmen zeitsparend die Rohübersetzung, die die menschlichen Profi-Übersetzer korrigieren und ergänzen. Oft geht es weniger um eine stilistisch geschliffene Übersetzung, sondern um ein grobes Verständnis. So lässt Microsoft viele nicht englischsprachige Internet-Hilfsseiten seiner Knowledge Base maschinell erstellen. Auch bei der EU übernehmen Computer einen großen Teil der Übersetzungsarbeit. Bereits 1976 erwarb die damalige Europäische Gemeinschaft für 300 000 Dollar die Nutzungsrechte an der Übersetzungs-Software Systran und entwickelte diese zu einer speziellen Version namens "EC Systran" weiter. Heute liefert die Software Übersetzungen für 26 Sprachpaare bei einem Ausstoß von mehreren Hunderttausend Seiten pro Jahr und 35% eingesparter Übersetzungszeit. Wie es losging

Die Idee, menschliche Sprache mit Computern zu übersetzen, ist so alt, wie die Rechenmaschinen selbst. Antreiber dafür waren vor allem militärische Interessen, der Erfolg der Kryptografie im Zweiten Weltkrieg und das Aufkommen der ersten Computer. Als Geburtsstunde der MÜ gilt das so genannte "Weaver-Memorandum" von 1949, in dem der Mathematiker Warren Weaver die Übersetzung von Sprache durch Computer propagierte. Finanziert vom Pentagon versuchten sich Forscher an der Programmierung der maschinellen Übersetzung. Weaver betrachtete das mechanische Übersetzen als eine Art Codeknacken. Natürliche Sprachen seien letztendlich Zeichenketten, die nur umcodiert werden müssen: In einer Datenbank sollte ein Rechner Wort für Wort nach den Entsprechungen der eingegebenen Vokabeln suchen. Danach ersetzt der Computer die gefundenen Wörter der Quellsprache in der gleichen Reihenfolge durch das entsprechende Wort der Zielsprache. Anschließend werden Satzstellung und Flexion nach den Regeln der Zielsprache angepasst.

Diese ersten Versuche waren völlig unzureichend, da keine wirkliche Analyse des Ausgangstextes erfolgte. Vor allem die Analyse syntaktischer Strukturen wie Nominalgruppen, Prädikatstrukturen und Teilsätze, die semantische Analyse und die Bewältigung von Unterschieden zwischen Ausgangs- und Zielsprache, also die eigentlichen Übersetzungsschwierigkeiten, wie sie von der Humanübersetzung her bekannt sind, war damit nicht in den Griff zu bekommen. 1966 empfahl eine staatliche US-Kommission den Abbruch aller Projekte zur maschinellen Übersetzung, da man keine Chance sah, dass in absehbarer Zeit ein akzeptables Programm erstellt werden könnte. Als Folge davon kam die Forschung für zwei Jahrzehnte nahezu zum Erliegen. Erst mit dem Aufkommen leistungsstarker Computer in den 80er Jahren und Fortschritten in der Sprachwissenschaft und Informatik wurden die Arbeiten an der MÜ wieder aufgenommen.
Gutscheine
-
HelloFresh
Bis zu 120€ + GRATIS Versand der 1. Box mit den HelloFresh Rabattcodes Zum Gutschein
bis 31.01.2024+ bis zu 4,00€ Cashback -
Cyberport
25€ EXTRA Cyberport Gutschein im Technik-Sale Zum Gutschein
bis 27.09.2023+ bis zu 0,5% Cashback -
C&A Gutscheine und Angebote
C&A Gutschein: 10% extra Rabatt auf alle Oberteile Zum Gutschein
bis 27.09.2023+ bis zu 3,5% Cashback -
Calzedonia
20% Calzedonia Rabattcode erhalten Zum Gutschein
bis 31.12.2037+ bis zu 4,0% Cashback -
EDEKA smart
EDEKA smart Gutschein: GRATIS Artikel exklusiv als Kunde Zum Gutschein
bis 31.12.2037+ bis zu 13,00€ Cashback(statt11,00€) -
Geero
EXKLUSIVER Gutschein: 6% auf alle Geero2 E Bike Modelle Zum Gutschein
bis 27.09.2023