Maschinelle Übersetzung vs. KI-Übersetzung – was ist der Unterschied?
Moderne Technologien für die automatische Übersetzung entwickeln sich rasant, und heute stehen zwei Hauptansätze im Vordergrund: Maschinenübersetzung und Übersetzung mit künstlicher Intelligenz.
Was genau steckt dahinter?
Bei der maschinellen Übersetzung kommen neuronale maschinelle Übersetzungssysteme (Neural Machine Translation, NMT) zum Einsatz. Es handelt sich um Programme, die sowohl online als auch offline genutzt werden können. Der Benutzer lädt Text in der Originalsprache in das Programm und erhält den übersetzten Text.
KI-Übersetzung umfasst dagegen die Verwendung breitgefächerter großer Sprachmodelle (Large Language Modells) bezeichnet. Meistens handelt es sich bei diesen Modellen um Chat-Bots, wie z. B. GPT, DeepSeek und andere. Der Übersetzungsprozess mit Chat-Bots besteht darin, dass einem Chat-Bot Aufgaben zur Übersetzung von Text mithilfe spezieller Eingabeaufforderungen (Prompts) gestellt werden.
Die Verwirrung bei der Unterscheidung dieser Begriffe kann dadurch entstehen, dass die Struktur von NMT- und LLM-Systemen weitgehend übereinstimmt. Beide Technologien basieren auf neuronalen Netzen und verwenden eine Transformer-Architektur. Sie unterscheiden sich jedoch in der Art und Weise, wie die Technologien im Programm verwendet werden. Während NMT-Systeme Texte übersetzen, indem sie Entsprechungen für Wörter oder Wortketten aus dem Originaltext in der Zielsprache finden, generieren LLM-Systeme einen neuen, zusammenhängenden Text mit derselben Bedeutung in der Fremdsprache.
Dieser Unterschied in der Funktionsweise der Programme bedingt auch den Unterschied im Übersetzungsstil.
Syntax. NMT-Systeme behalten beim Übersetzen fast immer die syntaktische Struktur des Ausgangssatzes bei. Eine Ausnahme bilden klischeehafte Ausdrücke, wenn das NMT-System zuvor auf deren korrekte Übersetzung trainiert wurde. LLM-Systeme streben hingegen eine Veränderung der Syntax ann wobei LLMs dazu neigen, zwei Sätze bei der Übersetzung zu einem zu verbinden. Das ist bei der Eingabeaufforderung unbedingt zu beachten, da die meisten CAT-Tools (z. B. memoQ, Trados) keine Abweichungen in der Anzahl der Segmente im Originaltext und in der Übersetzung unterstützen. Aus dem folgenden Beispiel wird ersichtlich, dass die Syntax der NMT-Übersetzung die Syntax des Originals wiederholt, und das LLM-System die Syntax näher an der Referenz übersetzen.
| Original | Referenz | LLM-Übersetzung (KI) | NMT-Übersetzung |
| С сентября 2023 года в России идет эксперимент по партнерскому финансированию (ЭПФ), который продлится еще один год. | Since September 2023, an experiment in partnership financing (PF) is underway in Russia, which stands to extend into next year. | Since September 2023, an experiment on partnership financing (EPF) has been underway in Russia, which will last for another year. | Since September 2023, Russia has been conducting an experiment on partnership financing (EPF), which will last for another year. |
Natürliche Sprache. Der vom LLM-System übersetzte Text klingt natürlicher als die Übersetzung mit NMT-Systemen. Die Natürlichkeit der LLM-Übersetzung tendiert jedoch zu einem neutralen Stil und Register, was sich negativ auf die Qualität bestimmter Arten von Übersetzungen auswirken kann. Für technische Texte, für die eine bestimmte Wortfolge, hochspezialisierte Abkürzungen usw. charakteristisch sind, eignet sich dagegen die maschinelle Übersetzung besser.
| Original | Referenz | LLM-Übersetzung (KI) | NMT-Übersetzung |
| Figure 2: Bakyrchik Zone 1 Underground Reticulation Pipeline Route Profiles | Рисунок 2. Рудник Бакырчик. Зона 1. Профили трасс подземных закладочных трубопроводов | Рисунок 2: Маршрутные профили подземного трубопровода в зоне 1 Бакырчик | Рисунок 2. Рудник Бакырчик. Зона 1. Профили трасс подземных сетчатых трубопроводов |
Genauigkeit. NMT-Systeme suchen nach Übersetzungsäquivalenten, sodass sie stets die faktischen Informationen beibehalten. Wenn das Programm nicht über ausreichendes Wissen zur Übersetzung von Wörtern oder Wortgruppen verfügt, erkennt es diese als Eigennamen und übersetzt sie mithilfe von Transliteration. LLM-Systeme generieren den Text in der Zielsprache neu, wobei der Sinn erhalten bleibt. Dabei kann es bei der Übersetzung in äußerst seltenen Fällen zu „Halluzinationen” oder Verzerrungen des LLM kommen.
Halluzinationen können auftreten, wenn ein LLM nicht genug Informationen hat, um eine Antwort zu erstellen, und sich diese „ausdenkt“. Wenn ein LLM-System beispielsweise nicht weiß, wie ein Begriff übersetzt werden soll, übersetzt es ihn „intuitiv“ und meistens ist eine solche Übersetzung falsch. Im Gegensatz zur Transliteration von NMT-Systemen sind diese Übersetzungen bei der Nachbearbeitung schwer zu finden, da sie authentisch wirken können.
| Original | Referenz | LLM-Übersetzung (KI) |
| The other ingredients are mannitol, methionine, poloxamer 188, diluted phosphoric acid, sodium hydroxide, water for injections. | Les autres composants sont: mannitol, méthionine, poloxamer 188, acide phosphorique dilué, hydroxyde de sodium, eau pour préparations injectables. | Les autres ingrédients sont le mannitol, la méthionine, le poloxamère 188, l’acide phosphorique dilué, l’hydroxyde de sodium, l’eau pour préparations injectables. |
Die Verzerrung von LLMs erwächst daraus, dass LLM-Systeme „statistische Vorurteile“ aus den Daten, mit denen sie arbeiten, übernehmen. Im Bereich der Übersetzung bezieht sich diese Verzerrung auf Pronomen oder Berufsbezeichnungen, für die es zwei Varianten gibt: weiblich und männlich. Der Beruf male nurse würde im LLM-System beispielsweise als „Krankenschwester“ und nicht als „Krankenpfleger“ übersetzt werden, da es statistisch gesehen mehr Krankenschwestern gibt.
| Original (Türkisch ohne Geschlechtsangabe) | LLM-Übersetzung (KI) |
| o bir hemşire | Il (masc.) est infirmière (fem.) (masc. = infirmier) |
In der türkischen Sprache fehlt z. B. die Geschlechtsangabe. In diesem Fall übersetzt das LLM das Segment mit dem männlichen Pronomen (il), wobei es die Berufsbezeichnung „Krankenschwester/Krankenpfleger“ (hemşire) mit dem weiblichen Geschlecht in Einklang bringt.
Ähnlichkeiten und Unterschiede zwischen NMT- und LLM-Systemen
| Parameter | NMT | LLM |
| Architektur | Neuronale Netze | |
| Transformer-Architektur | ||
| Art der Übersetzung | Sucht Äquivalente zum Originaltext (Textübersetzung) | Schreibt den Text unter Beibehaltung des ursprünglichen Sinns um (Textgenerierung) |
| Syntax | Behält die Satzstruktur bei | Wählt eine Satzstruktur, die in der Übersetzungssprache natürlicher klingt |
| Genauigkeit | Behält die faktischen Informationen bei | Bei der Übersetzung können „Halluzinationen” und Verzerrungen auftreten (selten). |
Maschinelle Übersetzung und KI-Übersetzung sind zwei leistungsstarke Technologien, jede mit ihren eigenen Stärken und Grenzen. Für Aufgaben, die genaue Begriffe und die Beibehaltung der Struktur des Ausgangstexts verlangen, sind Neuronale maschinelle Übersetzungssysteme (NMT) nach wie vor ein zuverlässiges Tool. Große Sprachmodelle (LLM) bieten unterdessen eine natürlichere und flexiblere Übersetzung, insbesondere bei kreativen Aufgaben. Die Wahl zwischen den beiden Systemen hängt daher von den konkreten Anforderungen ab. Wenn eine strenge Übereinstimmung mit dem Original erforderlich ist, sind NMTs die bessere Wahl. Wenn Natürlichkeit und Anpassungsfähigkeit wichtig sind, liefern LLMs die besseren Ergebnisse. Durch die Kombination der Stärken dieser Systeme und unter Berücksichtigung der Besonderheiten der jeweiligen Technologien kann eine hochwertige Übersetzung für nahezu jede Aufgabe erzielt werden. Es ist entscheidend zu verstehen, welches System in welchen Fällen verwenden werden muss, um ein optimales Ergebnis zu erzielen.


