Bisher
Inzwischen
ermöglicht KI erhebliche Fortschritte bei der Umwandlung von gedachter in gesprochene Sprache. Mehrere Forschungsteams haben Systeme entwickelt, die ihre Nutzer nahezu in Echtzeit auf diese Weise kommunizieren lassen.
„Mit unserem Ansatz übertragen wir die schnelle Sprachdekodierungskapazität von Geräten wie Alexa und Siri auf Neuroprothesen“, berichtet Gopala Anumanchipalli von der University of California in Berkeley. Gemeinsam mit seinem Team hat er eine Gehirn-Computer-Schnittstelle entwickelt, die über implantierte Elektroden kontinuierlich die Signale aus dem motorischen Sprachzentrum empfängt, also aus dem Bereich des Gehirns, in dem die Sprechbewegungen geplant werden. Diese Signale übersetzt eine Künstliche Intelligenz in gesprochene Sprache.
Getestet haben die Forschenden ihr System an einer Patientin, die aufgrund eines Hirnstamm-Infarkts gelähmt ist und nicht mehr sprechen kann. Um die KI zu trainieren, versuchte die Patientin, verschiedene vorgegebene Sätze auszusprechen. Dadurch lernte die KI, die neuronalen Signale mit den beabsichtigten Artikulationsbewegungen in Verbindung zu bringen. Nach der Trainingsphase konnte das System auf diese Weise auch neue Wörter erkennen, die nicht im Trainingswortschatz enthalten waren.
Die Sprachausgabe erfolgt mit einer Verzögerung von nur rund einer Sekunde. Anhand von Sprachaufnahmen der Patientin aus einer Zeit vor dem Schlaganfall hat das Forschungsteam eine Computerstimme geschaffen, die ihrer eigenen zum Verwechseln ähnlich ist. „Ihre eigene Stimme fast in Echtzeit zu hören, verstärkte bei der Patientin das Gefühl der Verkörperung“, berichtet Anumanchipalli.
Noch einen Schritt weiter geht ein Team um Sergey Stavisky von der University of California in Davis. Statt die Gehirnaktivität in Text zu übersetzen und diesen dann von einer Computerstimme vorlesen zu lassen, hat die Forschungsgruppe ein System entwickelt, das die Stimme von Grund auf anhand der neuronalen Signale synthetisiert. Auf diese Weise können erstmals sogar sprachliche Nuancen wie Änderungen in der Tonhöhe und der Betonung zum Ausdruck gebracht werden. In Tests konnte die KI-basierte Gehirn-Computer-Schnittstelle die Artikulationsabsichten eines ALS-Patienten mit einer Verzögerung von nur einer vierzigstel Sekunde in gesprochene Sprache übersetzen, sodass er anderen sogar ins Wort fallen konnte.
Bislang handelt es sich allerdings bei beiden Ansätzen nur um Machbarkeitsbeweise. Bevor die Systeme außerhalb klinischer Studien in der Praxis eingesetzt werden können, ist noch viel Feinarbeit notwendig, etwa um die Fehlerrate der Spracherkennung zu reduzieren. Ein langfristiges Ziel ist zudem, ausreichend genaue Signale an der Kopfhaut abzuleiten, um die invasive Implantation von Elektroden zu vermeiden. Elena Bernard





