Aktuelle Neuigkeiten aus dem Bereich der Sprachdienstleistungen
Lassen Sie uns über die aktuellen Neuigkeiten aus dem Bereich der Sprachdienstleistungen sprechen.
Das Yandex SpeechKit versteht jetzt auch Usbekisch
https://turkmenportal.com/blog/63391/golosovoi-servis-yandeksa-osvoil-uzbekskii-yazyk
Die Fähigkeiten des Yandex SpeechKits wurden um die Spracherkennung und -synthese der usbekischen Sprache ausgeweitet. Damit wurde Usbekisch als 16. Sprache in das Yandex SpeechKit aufgenommen. Zum Trainieren des SpeechKits von Yandex wurde ein echter Sprecher hinzugezogen. Zusätzlich zur Spracherkennung und -synthese der usbekischen Sprache, ist das System in der Lage, Transkripte auf Usbekisch zu erstellen. Das Yandex SpeechKit ist ein effektives Werkzeug für den Einsatz in Callcentern und bei der Entwicklung von Sprachassistenten.
KI hilft, Sprachbarrieren bei der Arbeit mit antiken Sprachen zu überwinden
https://decrypt.co/147176/ai-ancient-language-translation-cuneiform-akkadian
Die Entschlüsselung antiker Sprachen und Texte war für Archäologen lange Zeit eine große Herausforderung. Neuerdings nutzen Forscher künstliche Intelligenz, um Sonderformen von schriftlichen Überlieferungen und antiken Sprachen schnell ins Englische zu übersetzen, so auch in Keilschrift geschriebene altertümliche Texte und ägyptische Hieroglyphen. Trotz der Herausforderungen, wie etwa durch den Mangel an großen Datenmengen, ist es den Forschern gelungen, KI-Modelle mit Zehntausenden von Beispieltexten zu trainieren. Durch diesen Durchbruch sind sie nun in der Lage, Akkadisch, eine im ganzen Mittleren Osten und in Mesopotamien verbreitete Sprache der damaligen Zeit, zu übersetzen.
Entwicklung neuer Möglichkeiten, um große Sprachmodelle schneller und kostengünstiger zu trainieren
https://techxplore.com/news/2023-07-team-faster-cheaper-large-language.html
Ein Team der Stanford University hat Sophia entwickelt, eine neue Methode zur Optimierung des Vortrainings von großen Sprachmodelle (LLMs), die doppelt so schnell ist wie aktuelle Ansätze. Anwendungen wie ChatGPT, die auf großen Sprachmodellen basieren, kommen immer mehr zum Einsatz und ziehen die Aufmerksamkeit der Medien auf sich. Aufgrund der immens hohen Kosten, die für das Vortraining dieser Modelle aufgewendet werden müssen, wird das LLM-Segment jedoch von nur wenigen großen Technologieunternehmen dominiert. Schätzungen zufolge liegen die Kosten am unteren Ende um 10 Millionen Dollar, können aber auch das Zehn- oder sogar Hundertfache dieses Betrags erreichen.
Diese Modelle bestehen aus Millionen oder sogar aus Milliarden von Parametern, die zusammenarbeiten. Liu Hong, ein Absolvent der Computer Sciences an der Stanford University, vergleicht dies mit Fabrikarbeitern, die alle ein gemeinsames Ziel verfolgen. Eine wichtige Eigenschaft dieser Parameter ist ihre Krümmung, die die maximal erreichbare Geschwindigkeit zeigt, welche in Bezug auf ein vortrainiertes LLM erreicht werden kann. In der Analogie der Fabrikarbeiter entspricht die Krümmung dem Arbeitsaufkommen. Durch genaue Schätzung der Höhe des Arbeitsaufkommens kann ein Optimierungsprogramm die Effizienz des LLM-Vortrainings steigern.
Premierminister Modi präsentiert indische KI-gestützte Sprachplattform
Die künstliche Intelligenz birgt immenses Potential. Die Regierung von Indien enthüllt Bhashini, eine native KI-gestützte Sprachplattform. Bhashini reißt Sprachbarrieren ein, indem sie Übersetzungen in Echtzeit bereitstellt und somit Menschen, die unterschiedliche Sprachen sprechen, in die Lage versetzt, miteinander über digitale Kanäle zu interagieren. Premierminister Narendra Modi hat seine Bereitschaft darüber zum Ausdruck gebracht, diese Technologien mit anderen Nationen der Shanghaier Organisation für Zusammenarbeit (Shanghai Cooperation Organization, SCO) zu teilen. Gegenwärtig sind Mandarin und Russisch offizielle Sprachen der SCO. Indien setzt sich für die Aufnahme von Englisch als eine weitere offizielle Sprache ein. Bhashini nutzt KI/ML und die Verarbeitung natürlicher Sprache (NLP), um Open-Source-Modelle und -Werkzeuge für in Indien gesprochene Sprachen zu entwickeln und zu verbreiten.