Neue Sprachen für Machine-Translation-Systeme
Lassen Sie uns gemeinsam einen Blick auf die neusten Entwicklungen im Bereich Machine Translation werfen. Ich habe hier für Sie die meiner Meinung nach wichtigsten Neuigkeiten zusammengefasst:
Microsoft ergänzt seinen Azure Cognitive Services Translator um 13 weitere afrikanische Sprachen
Microsoft hat seinen Azure Cognitive Services Translator um 13 afrikanische Sprachen erweitert (https://azure.microsoft.com/ru-ru/products/cognitive-services/translator/). Texte und Dokumente können ab jetzt aus und in diese neuen Sprachen übersetzt werden. Sesotho (Süd-Sotho), Sesotho sa Leboa (Nord-Sotho), Setswana (Tswana) und Xhosa sind damit die neusten offiziellen südafrikanischen Sprachen, die von Microsofts Machine-Translation-Engine unterstützt werden. Erst letztes Jahr wurde das System um die Sprache Zulu erweitert. Weitere Sprachen sind ChiShona, Hausa, Igbo, Kinyarwanda, Lingala, Luganda, Nyanja, Kirundi und Yoruba. Damit werden aktuell insgesamt 124 Sprachen angeboten und Millionen Menschen in Afrika und dem Rest der Welt können ab jetzt die sprachliche Unterstützung in Anspruch nehmen. Innerhalb des Ökosystems von Microsoft kann der Service zum Beispiel mit Microsoft 365 integriert werden (zur Übersetzung von Texten und Dokumenten), mit dem Microsoft Edge Browser und der Suchmaschine Bing (zur Übersetzung kompletter Websites), mit SwiftKey (zur Übersetzung von Nachrichten), mit LinkedIn (zur Übersetzung von User-Inhalten), mit der Translator-App (für spontane Unterhaltungen auf verschiedenen Sprachen), und mehr. Diese Integrationsmöglichkeiten sind sowohl hinsichtlich der technologischen Weiterentwicklung, aber auch in Bezug die Wettbewerbsfähigkeit sehr wertvoll. Unternehmen, die Übersetzungen in und aus Sprachen anbieten können, die von den meisten Anbietern nicht unterstützt werden, haben dadurch einen entscheidenden Wettbewerbsvorteil. Das gilt natürlich nur, wenn die Nachfrage nach diesen Sprachen groß ist. Dabei ist zu beachten: Die Sprachen müssen von vielen Menschen verwendet werden und es muss ein großer Bestand an Texten in diesen Sprachen vorhanden sein, der kontinuierlich von verschiedenen engagierten Personen erweitert und von professionellen Linguisten überprüft wird.
Die Machine-Translation-Engine der Universität Tartu unterstützt jetzt 17 neue finno-ugrische Sprachen
Die Engine ist unter folgendem Link verfügbar: https://neurotolge.ee
Forscher des Institut of Computer Science an der Universität Tartu haben das eigene Machine-Translation-System „Neurotõlge“ um die Sprachen Livisch, Komi, Wepsisch und 14 weitere ressourcenarme finno-ugrische Sprachen erweitert. Viele dieser Sprachen sind damit zum ersten Mal in einem öffentlich zugänglichen Machine-Translation-System verfügbar. Anbieter wie Google Translate oder ähnliche Engines unterstützen diese Sprachen bisher nicht. Insgesamt unterstützt Neurotõlge 23 finno-ugrische Sprachen: Zusätzlich zu den gängigeren Sprachen Estnisch, Finnisch und Ungarisch sind jetzt auch Livisch, Võro, Karelisch (Proper), Livvi-Karelisch, Lydisch, Wepsisch, Nordsamisch, Südsamisch, Inarisamisch, Skoltsamisch, Lulesamisch, Komi, Komi-Permjakisch, Udmurtisch, Bergmari und Wiesenmari, Ersjanisch, Mokschanisch, Mansisch und Chantisch verfügbar. Die Forschergruppe hat nun Sprecher und Forscher dieser Sprachen aufgerufen, geprüfte Übersetzungen in/aus diesen Sprachen einzureichen, um die Qualität der maschinell übersetzten Inhalte zu verbessern. Gedichte, Artikel, Bücher und andere Inhalte aus diesen Sprachen sind ebenfalls sehr nützlich und können an ping@tartunlp.ai gesendet werden. Die eingesendeten Inhalte werden anschließend zum Bestand hinzugefügt. Je höher die Qualität der Texte, mit denen die Engine gefüttert wird, desto höher ist auch die Qualität der maschinellen Übersetzung. Um die Qualität der Übersetzungen zu verbessern, ist Feedback entscheiden, da es für die meisten dieser Sprachen nur sehr begrenzte Ressourcen gibt, anhand derer die Machine-Translation-Systeme entwickelt werden können. Die Arbeit der Forscher wird vom National Programme of Estonian Language Technology gefördert.
KI-Systeme können illegale Übersetzungen von Mangas verhindern
Es gibt jetzt ein KI-basiertes Machine-Translation-System für Mangas, das japanische Mangas schnell und einfach ins Englische übersetzt. In der letzten Ausgabe von Kizuna wird beschrieben, wie das System Texte in Mangas erkennt und diese schnell und in der richtigen Reihenfolge ins Englische überträgt. Hier erfahren Sie mehr dazu: https://www.japan.go.jp/kizuna/2023/02/manga_translation_service.html
Japanische Mangas wie Demon Slayer, One Piece, Slam Dunk und Dragon Ball sind weltweit sehr beliebt und unzählige Übersetzungen dieser Mangas sind als Raubkopien im Umlauf. „Das System wurde bereits von über 10 Firmen in und außerhalb Japans eingeführt und wird zur Übersetzung von 40 000 bis 50 000 Seiten monatlich eingesetzt“, sagt Ishiwatari Shonosuke, Mitgründer und CEO von Mantra. Das System nutzt künstliche Intelligenz, um großen Mengen an Daten zum Verfeinern der Engine zu verarbeiten, wobei der Fokus auf den Bildern und Übersetzungen von Mangas liegt. Die KI erkennt die Positionierung und den Inhalt von Texten in Bildern und übersetzt diese umgangssprachlich, unter Berücksichtigung der Reihenfolge und des Kontexts. Texte aus Bildern können ganz einfach übersetzt und ausgetauscht werden, indem die Daten des Mangas in das System hochgeladen werden und die Sprache ausgewählt wird. Der gesamte Prozess dauert nur wenige Sekunden pro Seite. „Wenn wir unsere Effizienz steigern und übersetzte Mangas ohne Zeitverzug veröffentlichen, können wir das Auftreten von illegalen Manga-Übersetzungen verhindern. Eine Gruppe von Raubkopierern hat bereits angekündigt, dass sie künftig keine Mangas mehr illegal übersetzen werden, die durch unser System übersetzt und veröffentlicht wurden“, sagt Ishiwatari.