Aktuelle Neuigkeiten aus dem Bereich der Sprachdienstleistungen
Lassen Sie uns in die neuesten Nachrichten aus der Welt der Sprachen eintauchen. Ich habe die meiner Meinung nach wichtigsten Updates für Sie ausgewählt.
Microsoft Translator unterstützt jetzt 20 indische Sprachen
Microsoft India hat angekündigt, vier neue Sprachen hinzuzufügen: Bhojpuri, Bodo, Dogri und Kashmiri sind jetzt in Microsoft Translator verfügbar. Mit dieser neuen Version erhöht sich die Gesamtzahl der von Microsoft Translator unterstützten indischen Sprachen auf 20, darunter Assamesisch, Bengali, Gujarati, Hindi, Kannada, Konkani, Maithili, Malayalam, Marathi, Nepali, Odia, Punjabi, Sindhi, Tamil, Telugu und Urdu. Damit kommt Microsoft Translator seinem Ziel, alle 22 offiziellen indischen Sprachen zu unterstützen, einen Schritt näher und deckt nun Sprachen ab, die von fast 95 % der Bevölkerung des Landes gesprochen werden. Dieser Fortschritt wird lokalen Handwerkern und Unternehmen neue wirtschaftliche Möglichkeiten eröffnen, da sie nun mit einem breiteren Publikum in Kontakt treten können. Noch wichtiger ist aber, dass diese Erweiterung dazu beiträgt, das indigene Wissen und die kulturelle Identität zu bewahren, indem sie die Kluft zum Mainstream überbrückt.
Der Zugriff auf die Übersetzungsfunktion ist über die Microsoft Translator-App, den Edge-Browser, Office 365, Bing Translator und die Azure AI Translator API für Unternehmen und Entwickler möglich. Diese API wird von Unternehmen wie Jio Haptik und Koo verwendet. Mit Azure AI Translator stehen Benutzern neben den neu eingeführten Sprachen mehr als 135 weitere Sprachen für Übersetzungen von Apps, Websites, Workflows und Tools zur Verfügung. Unternehmen können die mehrsprachige Unterstützung unter anderem für Übersetzungen von E-Content, E-Commerce-Produktkatalogen, Produktdokumentationen und interner Kommunikation nutzen. Dieses neue Update wird sich auf fast 61 Millionen Menschen auswirken. Bhojpuri wird von rund 51 Millionen Menschen im Osten von Uttar Pradesh, Bihar und Jharkhand gesprochen. Bodo wird von etwa 1,4 Millionen Menschen in den Bundesstaaten Assam und Meghalaya sowie im benachbarten Bangladesch gesprochen. Dogri wird von 1,6 Millionen Menschen in Jammu und Kaschmir, Himachal Pradesh und Punjab gesprochen. Kashmiri wird von etwa 7 Millionen Menschen in Jammu und Kaschmir sowie in Teilen des benachbarten Pakistan gesprochen. Der Zugang zu technologiebasierten Lösungen über Sprachbarrieren hinweg fördert die Stärkung der Demokratie.
Einsatz von KI zur Verbesserung der Verständigung von Patienten nach einer Laryngektomie
https://medicalxpress.com/news/2023-10-ai-patients-laryngectomy.html
Die häufigste Art der Laryngektomie, ein chirurgischer Eingriff zur Entfernung von Kehlkopfkrebs im fortgeschrittenen Stadium, verändert die Stimme des Patienten dramatisch und kann deren tägliches Leben erheblich beeinträchtigen. Um die Lebensqualität von Patienten nach einer Laryngektomie zu verbessern, hat ein Forscherteam aus Litauen eine Studie durchgeführt, in der künstliche Intelligenz eingesetzt wurde, um die Sprache von Laryngektomiepatienten zu „bereinigen“.
Den Forschern zufolge müssen sich Patienten mit Kehlkopfkrebs oft einer umfangreichen Operation unterziehen, in der ihr Kehlkopf teilweise oder vollständig entfernt wird. Nach einer solchen Operation bleibt der Stimmapparat des Patienten geschädigt zurück. Die Funktion der Stimme ist stark beeinträchtigt oder fehlt ganz, während die Atmung über ein Tracheostoma, eine chirurgisch angelegte Öffnung der Luftröhre, erfolgt. Bei diesen Patienten wird die Stimme, die mithilfe der verbleibenden anatomischen Strukturen erzeugt wird, welche von Natur aus nicht für die Stimmerzeugung vorgesehen sind, als Ersatzstimme bezeichnet.
Das Hauptziel dieser Forschung ist die Entwicklung von KI-basierenden Algorithmen zur automatischen Verbesserung und Bewertung der Ersatzstimme bei Patienten nach einer Kehlkopfkrebsoperation. Die entwickelten Algorithmen werden derzeit im größten litauischen Universitätskrankenhaus – dem Hospital of Lithuanian University of Health Sciences – klinisch getestet, insbesondere in der Klinik für Hals-, Nasen- und Ohrenheilkunde. Die Veränderungen der Stimme nach einer Laryngektomie variieren stark je nach Schwere des Falles – bei manchen Personen kann es zu lediglich leichten Veränderungen der Stimme kommen, während andere roboterhaft oder krächzend klingen. Folglich ist es nicht immer einfach zu verstehen, was der Patient mitteilen möchte. Die Sprachverarbeitung des Algorithmus umfasst die Berechnung des Spektrogramms der verzerrten Stimme, das Extrahieren von Frequenzstatistiken, die Bewertung der Geräuschempfindlichkeit, der Geräuscherzeugung und anderer Parameter, die zur „Bereinigung“ der Stimme beitragen.
Wie SignBank+ die maschinelle Übersetzung mehrsprachiger Gebärdensprachen verbessert
https://slator.com/how-signbank-improves-multilingual-sign-to-spoken-language-machine-translation/
Forscher der Bar-Ilan-Universität und der Universität Zürich führten eine Studie mit dem SignBank-Datensatz durch, einem mehrsprachigen Gebärdensprachdatensatz mit mehreren Domänen, und entwickelten eine erweiterte Version des Datensatzes namens SignBank+. Ziel der Forscher war es, den Übersetzungsprozess zu rationalisieren und das Training und die Implementierung des Modells zu verbessern. Während sich ihre frühere Forschung auf die maschinelle Übersetzung zwischen Gebärden- und gesprochenen Sprachen in beide Richtungen konzentrierte, konzentrierte sich ihre spätere Arbeit auf maschinell übersetzte Gebärdensprache. Dies erreichten sie durch den Einsatz von SignBank+ und SignWriting als Zwischenschritt zur Erstellung von Textübersetzungen.
Die Forscher haben das Fingeralphabet für Buchstaben und Zahlen zusammengestellt und kommentiert, Inkonsistenzen und Fehler aus dem ursprünglichen Datensatz beseitigt und ihn anhand einer Stichprobe von 22 Gebärdensprachen durch die Einbeziehung von Variationen mehrerer Begriffe erweitert.
Der Datensatzbereinigungsprozess umfasste die Verwendung von ChatGPT. Für diese Phase entwickelten sie eine „Pseudofunktion“, die die Anzahl der Zeichen, den Sprachcode und die vorhandenen Begriffe ermittelt und eine bereinigte, parallele Version der Begriffe zurückgibt. Sie bestätigten diese Methode, indem sie das Modell gpt-3.5-turbo-0613 an manuell gereinigten Proben verwendeten und die Ergebnisse mit dem bereinigten Datensatz verglichen.
Um die Qualität ihrer Datensatzbereinigungs- und -erweiterungsarbeiten zu bewerten, untersuchten sie deren Auswirkungen auf die mehrsprachige MT. Dazu trainierten sie MT-Modelle. Für ihren Testsatz verwendeten die Forscher manuell annotierte Daten, einschließlich Tags zur Identifizierung der Ausgangs- und Zielsprachen. Die Testbedingungen umfassten den Einsatz verschiedener Test-Frameworks und vortrainierter, nicht optimierter Modelle sowie mehrsprachige Übersetzungsszenarien unter Verwendung der ersten 3 000 Einträge.