Aktuelle Neuigkeiten aus dem Bereich der Sprachdienstleistungen
Lassen Sie uns über aktuelle Neuigkeiten aus dem Bereich der Sprachdienstleistungen besprechen. Ich habe hier für Sie die meiner Meinung nach wichtigsten Entwicklungen zusammengefasst:
Google stellt ein neues KI-Modell vor, das visuelle Informationen und Sprache in automatischen Operationen übersetzt
Robotics Transformer 2 (RT-2) ist ein bahnbrechendes Vision-Sprache-Aktion-Modell, das uns einer Zukunft näher bringt, in der Assistenzroboter mehr und mehr Einzug erhalten. Es wurde anhand von Texten und Bildern aus dem Internet trainiert, was es dazu befähigt, Ergebnisse zu generieren, auf deren Grundlage Roboter direkt gesteuert werden, und diese auf effektive Weise zu „sprechenden Robotern“ zu machen. Die Entwicklung von Robotern, die zur Lösung von komplexen, abstrakten Aufgaben in verschiedenen und unspezifischen Umgebungen fähig sind, ist eine große Herausforderung. Anders als bei Chatbots erfordern Roboter einen praktischen Bezug zur realen Welt und ein Bewusstsein ihrer Fähigkeiten. Für gewöhnlich bedeutete dies, dass Roboter anhand von Milliarden von Daten trainiert werden müssen, was für die meisten Akteure, die an Innovationen arbeiten, zu zeitaufwändig und unpraktisch ist. RT-2 verfolgt bei der Lösung des Problems einen neuen Ansatz. Es verbessert die Fähigkeit von Robotern zu logischem Denken und macht die Arbeit mit komplexen Systemstapeln überflüssig, da in einem einzigen Modell die Fähigkeit zum komplexen Denken mit der Steuerung von automatisierten Handlungen vereint wird. RT-2 ist in der Lage, mit nur kleinen Mengen an Trainingsdaten das mittels Sprach- und Bildtraining gewonnene Wissen direkt in die Steuerung von Robotern zu übersetzen. Das gilt auch für Aktionen, für die der Roboter nie explizit trainiert wurde. Die Vorteile des Verfahrens von RT-2 sind immens. Das Verfahren versetzt Roboter in die Lage, ihr Verhalten in neuen Situationen und Umgebungen schneller anzupassen, wobei sie Aufgaben genauso gut erfüllen, wie es früheren Modelle möglich war, und diese in unbekannten Szenarien deutlich übertreffen. Dazu kommt noch, dass die Fähigkeit von RT-2, gelernte Verhaltenskonzepte auf neue Situationen zu übertragen, die Roboter immer näher daran bringt, wie Menschen zu lernen und sich anzupassen. Dieser Vorstoß im Ausbau der Fähigkeiten bedeutet nicht nur eine engere Verflechtung zwischen KI und Robotertechnik. Diese Entwicklung bringt den Einsatz universellerer Roboter immer näher, die besser in auf Menschen ausgerichtete Umgebungen eingesetzt werden können. Es ist noch viel zu tun, bis das Potenzial von Assistenzrobotern voll ausgeschöpft werden kann. Währenddessen bietet RT-2 einen Ausblick auf eine spannende Zukunft der Einsatzes von Robotertechnik – eine Zukunft, in der Roboter aus verschiedenen Datenquellen lernen und ein breites Spektrum an Aufgaben lösen können. Das bringt uns einer Welt näher, in der wir die Hilfe von fortschrittlichen und leistungsfähigen Assistenzrobotern in Anspruch nehmen können.
Gedankenlesen mittels Maschinen zur Unterstützung von stummen Patienten
Im Roman von Alexandre Dumas Der Graf von Monte-Cristo erleidet eine der handelnden Figuren, Monsieur Noirtier de Villefort, einen schrecklichen Schlaganfall, der ihn für den Rest des Lebens gelähmt an den Rollstuhl fesselt. Obwohl er geistig hellwach war und alles, was um ihn geschah, bewusst mitbekam, war er nicht mehr in der Lage, sich zu bewegen, und konnte nicht sprechen. Er verließ sich auf die Hilfe seiner Enkelin Valentine, die das Alphabet aufsagte und im Wörterbuch blätterte, um die Wörter zu finden, die er meinte. Dank dieser rudimentären Form von Kommunikation konnte der alte Mann seine Enkelin davor retten, von ihrer Stiefmutter vergiftet zu werden, und vereitelte die Versuche seines Sohnes, sie gegen ihren Willen zu verheiraten. Dumas Darstellung der katastrophalen Lage dieser Person – in der, wie er es beschreibt, „die Seele in einem Körper gefangen ist, der seinem Willen nicht mehr gehorcht“ – ist eine der frühesten Beschreibungen des Locked-in-Syndroms. Diese Form der schweren Lähmung wird durch eine Schädigung des Hirnstamms verursacht, meist aufgrund eines Schlaganfalls. Aber auch Tumorerkrankungen, traumatischen Hirnverletzungen, Schlangenbisse, Drogenmissbrauch, Infektionen oder neurodegenerativen Erkrankungen wie amyotrophe Lateralsklerose (ALS) können der Grund dafür sein. Die Erkrankung gilt aber als selten, es ist jedoch schwer zu sagen, wie viele Fälle es genau gibt. Viele Patienten mit Locked-in-Syndrom kommunizieren mittels einer Technik, mit der Augenbewegungen und Blinzeln auswertet werden, was jedoch auch nicht immer möglich ist, z. B. wenn Patienten vollständig bewegungsunfähig sind und selbst das Bewegend der Augen und der Augenlider nicht mehr möglich ist, so dass die Kommunikation über Aufforderungen wie „blinzeln Sie zweimal, wenn Sie mich verstehen“ nicht mehr funktioniert. Infolgedessen verbringen Patienten durchschnittlich 79 Tage in ihrem bewegungsunfähigen Körper, bevor die richtige Diagnose gestellt wird – hellwach, aber nicht imstande, sich mitzuteilen. Das Aufkommen von Schnittstellen-Technologien, mit denen eine Kopplung zwischen Gehirn und Maschine möglich ist, hat Hoffnungen geweckt, die Kommunikation für Menschen in einem solchen Zustand wieder zu ermöglichen und ihnen einen Weg zu bieten, sich mit der Außenwelt auszutauschen. Bei diesen Technologien kommen typischerweise implantierbare Geräte zum Einsatz, mit denen Gehirnwellen, welche mit der Sprachfunktion zusammenhängen, ausgelesen werden, und die beabsichtigte Mitteilung dann durch entsprechende Computeralgorithmen aufbereitet und übersetzt, ausgegeben wird. Die nützlichste und wichtigste Neuerung hier ist, dass kein Blinzeln erforderlich ist, dass keine Augenbewegungen nachverfolgt werden müssen und keine Lautäußerungen notwendig sind. Stattdessen werden Buchstaben oder Wörter, die eine Person still in ihrem Kopf „sagt“, erkannt und erfasst. Mithilfe dieser Technologie haben Forscher viele Stunden an Daten aufgezeichnet und sie in ausgeklügelte Machine Learning-Algorithmen eingespeist. Heute tragen fast 40 Menschen weltweit Implantate mit Mikroelektroden-Arrays, uns es werden immer mehr. Ein anderer, von Jun Wang von der University of Texas in Austin entwickelter Ansatz nutzt fortgeschrittene Bildgebungstechniken, Magnetenzephalographie (MEG) genannt, die durch elektrische Ströme im Gehirn erzeugte magnetische Felder an der Schädelaußenseite erfasst und die entsprechenden Signale anschießend in Text übersetzt. Derzeit arbeitet er an einem Gerät, das dank Verwendung von MEG, die 44 Phoneme oder Sprachlaute in der englischen Sprache – wie ph oder oo – erkennen soll, die zur Aufbau von Silben, Wörtern und schließlich Sätzen verwendet werden könnten.
ModernMT führt Trust Attention ein, um die Qualität von MT deutlich zu steigern
https://blog.modernmt.com/modernmt-introduces-trust-attention-to-improve-mt-quality/
ModernMT hat Trust Attention eingeführt, das es MT-Systemen ermöglicht, vertrauenswürdigere Daten zu bevorzugen und diese Daten das Modellverhalten im stärkeren Maße beeinflussen zu lassen. Diese Neuentwicklung bietet global agierenden Unternehmen eine überlegene Plattform, um optimierte unternehmensspezifische Übersetzungswerkzeuge zu bauen. Besonders deutlich ist dieser Fortschritt bei dynamisch adaptiven MT-Modellen wie ModernMT bemerkbar, bei denen kleine Mengen an fortlaufend eingebrachten Korrektur-Feedbacks zu einer kontinuierlichen Verbesserung der Qualität der MT-Ergebnisse führen. Die Erfolgsbilanz von ModernMT während der gesamten Einsatzzeit ist so beeindruckend, dass man sagen könnte, dass die Leistung von ModernMT über Milliarden bei Milliarden von Samples und vielen Sprachen in Produktionsszenarien nahe an der Singularität liegt. Hier wird der Punkt erreicht, an dem menschliche Lektoren nicht in der Lage sind, zu unterscheiden, ob ein Text von einem Menschen oder von einer Maschine generiert wurde, weil sich beide in Qualität und Stil so nah kommen. MT-Technologien entwickeln sich weiter und werden ständig verbessert, wobei jüngste Updates eine viel umfassendere und detailliertere Kontexterkennung auf Dokumentebene ermöglichen. Sommer 2023 markiert einen interessanten Wendepunkt in der Entwicklung von KI-basierten Technologien für Sprachübersetzung, und wir können nun sehen, dass große Sprachmodelle (Large Language Models, LLMs) auch eine neue technologische Herangehensweise darstellen, um Maschinen die Aufgabe der Sprachübersetzung übernehmen zu lassen. LLMs liefern besonders beeindruckende Ergebnisse, wenn es um Redewendungen geht, und verbessern die Sprachgewandtheit maschineller Übersetzungen. Das KI-Produkt-Team von Translated forscht und untersucht weiterhin die Möglichkeiten zur kontinuierlichen Verbesserung reiner MT-Modelle, hybrider MT-Systeme sowie allgemeiner KI-Modelle und reiner allgemeiner KI-Modelle. ModernMT Version 7 stellt ein bedeutendes Upgrade zu seinem wichtigsten adaptiven MT-System bereit. Mit dieser neuen Version wird Trust Attention eingeführt, eine neuartige Technik, inspiriert von der Art und Weise, wie menschliche Forscher Informationen aus vertrauenswürdigen Quellen priorisieren. Das Modell der Version 7 bevorzugt dabei identifizierte vertrauenswürdige Daten sowohl im Training als auch für den Prozess der logischen Entscheidungsfindung. Obwohl es branchenweit üblich ist, automatisierte algorithmengestützte Verfahren zu verwenden, um Datenvalidierungs- und Verifizierungsabläufe zu steuern, zeigt die 20-jährige Erfahrung von Translated in der Zusammenarbeit mit menschlichen Übersetzern, dass durch menschliche Experten verifizierte verfügbare Daten am vertrauenswürdigsten sind, um die Lernfähigkeit von Sprach-KI-Modellen voranzutreiben. Durch Menschen verifizierte Daten bilden den wichtigsten Treiber für präferenzbasiertes Lernen in den Modellen von ModernMT Version 7. „Garbage in, garbage out“ ist ein grundlegende Prinzip im Bereich Computertechnik und KI-Anwendung, das die Bedeutung der Qualität von Eingabedaten hervorhebt. Das bedeutet: Wenn die Qualität der in ein System eingegebenen Daten schlecht ist, wenn die Daten ungenau oder für das avisierte Ziel irrelevant sind, wird auch die Ausgabe des Systems von schlechter Qualität, ungenau oder irrelevant sein. Das Bewusstsein für dieses Prinzips ist besonders wichtig im Zusammenhang mit KI-Modellen, die Machine Learning- und Deep Learning-Modelle verwenden und stark auf Daten angewiesen sind, die für Training und Validierung verwendet werden. Wenn Daten, die für das Training des Modells verwendet werden, verzerrt oder unvollständig sind oder Fehler enthalten, werden vom KI-Modell wahrscheinlich ebenfalls unzuverlässige oder verzerrte Ergebnisse geliefert. Herkömmliche MT-Systeme sind im Allgemeinen nicht in der Lage, während des Trainings zwischen vertrauenswürdigen und qualitativ minderwertigem Trainingsdaten zu unterscheiden und in der Regel werden alle Daten gleich gewichtet. So können qualitativ hochwertige Daten und stark verrauschte Daten im Wesentlichen den gleichen Einfluss auf die Leistung eines Übersetzungsmodells haben. ModernMT versetzt ein System in die Lage, vertrauenswürdigere Daten zu bevorzugen und diese Daten das Modellverhalten im stärkeren Maße beeinflussen zu lassen.
Machine Learning dämmt die Verbreitung von Fake News ein
https://www.kompas.id/baca/english/2023/08/02/en-mesin-pembelajar-memitigasi-penyebaran-kabar-bohong
Die Entwicklung digitaler Technologien hat das Inverkehrbringen und die Verbreitung von Falschinformationen erleichtert. Machine Learning oder lernende Maschinen mit Blockchain-Technologie oder Blockchain können dazu beitragen, die Verbreitung von Fake News einzudämmen. Die jüngsten Forschungsarbeiten an der State University of New York in Binghamton, USA, tragen zu einer Studie bei, die Werkzeuge zur Erkennung von Mustern liefern, die typisch für Falschinformationen sind. Dies hilft Content-Erstellern, auftretende Ungenauigkeiten zu erkennen. Die Forschung stellt ein Machine Learning-System – ein Teilbereich der Künstliche Intelligenz – in Aussicht, das mit Hilfe von Daten und Algorithmen die Art und Weise nachahmt, wie Menschen feststellen, ob ein Inhalt den Lesern schaden könnte. Ein Beispiel hierfür sind Informationsmitteilungen, in denen zum Höhepunkt der COVID-19-Pandemie falsche alternative Behandlungsmethoden angepriesen wurden. Im Framework für Machine Learning werden Daten und Algorithmen verwendet, um Indikatoren für Falschinformationen zu identifizieren. Diese Beispiele werden anschließend zur Verbesserung der Erkennungsprozesse benutzt. Machine Learning-Systeme könne auf Grundlage der gesammelten Informationen Fake News eindämmen, indem sie erkennen, welche Nachrichten bei ihrer Verbreitung den größten Schaden anrichten könnten. Die Forscher schlagen eine Umfrage mit 1.000 Personen vor, die zwei Gruppen angehören; die eine Gruppe bestehend aus Fake News-Checkern und die andere aus Content-Nutzern, die diesen Fake News ausgesetzt sein könnten. In der Umfrage wird das bestehende Blockchain-System beschrieben und die Bereitschaft der Teilnehmer abgefragt, das System in verschiedenen Szenarien zu nutzen. Die Verbreitung von Falschmeldungen muss unterbunden werden, da diese erhebliche negative Auswirkungen haben können. Das Machine Learning-System ermöglicht die Analyse von Texten und vergibt Bewertungen entsprechend der Wahrscheinlichkeit, dass Artikel Falschinformationen enthalten.