„Wendepunkt in der Technologie“: Gehirn-Computer-Schnittstellen rekonstruieren Sprache und Mimik – das sagen Experten

Michael van den Heuvel

Interessenkonflikte

12. September 2023

Frank Willett (l.) von Stanford Medicine bedient die Software zur Spracherkennung. Sein Patient Pat Bennett trägt Sensoren, mit denen Signale aus dem Gehirn erfasst werden. Die Worte erscheinen auf dem Bildschirm. Foto: Steve Fisch

Leistungsstarke Gehirn-Computer-Schnittstellen (Brain-Computer-Interfaces, BCI) dekodieren die Gehirnaktivität schneller, genauer und mit einem größeren Wortschatz als bestehende Technologien, wie 2 Studien in Nature zeigen [1,2]. Patienten mit amyotropher Lateralsklerose bzw. mit Schlaganfall hatten dank neuer BCI die Möglichkeit, Kontakt zu ihrer Umgebung aufzunehmen. In beiden Fällen waren invasive Verfahren zur Platzierung der Elektroden notwendig.

Unterschiedliche Szenarien zur Dekodierung von Sprache

In der BrainGate2-Studie erfasste eine Elektrode die neuronale Aktivität von Zellen des Gehirns. Signale wurden mit einem künstlichen Sprachmodell in Text umgewandelt. Bei einer Frau mit amyotropher Lateralsklerose (ALS) erreichten Dr. Francis Willett von der Stanford University in Kalifornien und Kollegen als Rate 62 Wörtern pro Minute. Das sei mehr 3,4-mal so schnell wie der bisherige Rekord, schreiben sie. Zum Vergleich: Natürliche Sprache liegt bei etwa 160 Wörtern pro Minute.

Die Wortfehlerrate betrug 9,1% bei einem Wortschatz von 50 Wörtern (das sind 2,7-mal weniger Fehler als das bisherige Sprach-BCI) und 23,8% bei einem Wortschatz von 125.000 Wörtern.

Einen anderen technischen Ansatz haben Dr. Edward Chang von der University of California San Francisco und Kollegen mit der BRAVO-Studie verfolgt. Sie implantierten eine Folie aus Silikon oberflächlich auf dem Gehirn. Mit Elektroden erfassten sie im Sprachkortex Signale und werteten diese aus.

Ihre BCI kann Text oder Sprache ausgeben, alternativ auch einen Avatar ansteuern, der typische Bewegungen beim Sprechen imitiert. Die Dekodierung des Textes einer Frau mit einem Hirnstamm-Schlaganfall erreichte eine mittlere Rate von 78 Wörtern pro Minute. Das ist 4,3-mal so schnell ist wie der bisherige Rekord. Als Wortfehlerrate geben die Autoren 25% an.

Bessere Kommunikation für Menschen mit Lähmungen in Sicht?

„Die Ergebnisse signalisieren einen Wendepunkt in der BCI-Technologie zur Wiederherstellung der Kommunikation für Menschen mit schweren Lähmungen“, schreiben Dr. Nick Ramsey vom University Medical Center Utrecht in den Niederlanden, und Nathan Crone von der Johns Hopkins University School of Medicine, Baltimore, in einem begleitenden Leitartikel [3].

 
Die Ergebnisse signalisieren einen Wendepunkt in der BCI-Technologie zur Wiederherstellung der Kommunikation für Menschen mit schweren Lähmungen. Dr. Nick Ramsey und Nathan Crone
 

Derzeitige Systeme, die gelähmten Menschen bei der Kommunikation hälfen, seien zu langsam. Sie erreichten oft nur wenige Wörter pro Minute, verglichen mit der normalen Sprache, schreiben Ramsey und Crone. „Die beiden in Nature vorgestellten Hochleistungs-BCIs stellen jedoch einen großen Fortschritt in der neurowissenschaftlichen und neurotechnischen Forschung dar“. Sie seien „vielversprechend, um die Lebensqualität von Menschen zu verbessern, die ihre Stimme aufgrund von neurologischen Verletzungen oder Krankheiten verloren haben.“

Die Editorialisten weisen jedoch auf einige Limitationen hin. Beide BCIs befänden sich derzeit im experimentellen Stadium; nur Forscher könnten sie bedienen. Und ein sichtbarer Zugang am Kopf zum Abgreifen der Signale sei stigmatisierend. Ob sich der getestete Algorithmus für alle Patienten eigne, müsse noch geklärt werden.

Ein vielversprechendes Konzept

„Die in beiden Studien vorgestellten Technologien zeigen, dass Bewegungsplanungen des Sprachapparates fast in Echtzeit aus Hirndaten auslesbar sind“, kommentiert Prof. Dr. Thorsten Zander von der Brandenburgischen Technischen Universität Cottbus-Senftenberg gegenüber dem Science Media Center Germany [4]. Die Ansätze bauten zwar auf älteren Studien auf, seien „ingenieurstechnisch jedoch einen klaren Fortschritt“.

 
Die in beiden Studien vorgestellten Technologien zeigen, dass Bewegungsplanungen des Sprachapparates fast in Echtzeit aus Hirndaten auslesbar sind. Prof. Dr. Thorsten Zander
 

Zur Frage der klinischen Anwendbarkeit erklärt Zander: „Beide Ansätze sind im Moment patientenindividuell, da sie ein mehrwöchiges Training erfordern.“ Trotzdem zeigten die Studien, dass es möglich sei, diese Systeme anderen Patienten zur Verfügung zu stellen, jedoch nur mit erneuter Trainingsphase. „Des Weiteren bleibt individuell einzuschätzen, ob der Nutzen für den Patienten eine Schädigung des Gehirngewebes durch die Implantation rechtfertigt“, sagt der Experte.

Im nächsten Schritt seien Tests mit einer größeren Patientengruppe sinnvoll. „Ideal wären Patienten, die ihre Kommunikationsfähigkeiten voraussichtlich in einem absehbaren Zeitraum verlieren werden“, spekuliert Zander. „Wenn diese Personen die Technologie frühzeitig nutzen könnten, während sie noch kommunizieren können, würden sie nicht nur wertvolles Feedback geben, sondern später auch erheblich von ihren eigenen Erfahrungen profitieren, wenn sie ihre Sprachfähigkeit verlieren.“

Unterschiedliche OP-Verfahren

Auch Prof. Dr. Surjo R. Soekadar von der Charité – Universitätsmedizin Berlin betont, dass es sich bei den Veröffentlichungen um individuelle Ansätze handele. „Der Hauptunterschied zwischen beide Studien liegt in den verwendeten Hirnimplantaten“, kommentiert der Experte. „Während Willet et al. 4 Mikroelektroden-Arrays eingesetzt haben, deren Kontaktflächen in das Hirngewebe eindringen, verwenden Metzger et al. ein sogenanntes epikortikales Array, das mit seinen 253 Kontaktflächen auf dem Hirngewebe aufliegt.“

Jedes der Systeme habe bestimmte Vor- und Nachteile. Für die Mikroelektroden-Arrays seien kleinere Bohrlöcher in den Schädelknochen und kleinere Schnitte in die Hirnhäute erforderlich als für großflächige epikortikale Arrays. „Gleichzeitig zeichnen Mikroelektroden-Arrays nur die Aktivität von sehr begrenzten Hirnbereichen auf.“

Als mögliche Zielgruppen sieht der Experte Patienten mit ausgedehnten linksseitigen Schlaganfällen, die an einer Aphasie leiden, aber auch Patienten mit vollständigem Locked-in-Syndrom (completely locked-in syndrome, CLIS); hier gebe es bereits ältere Studien. Wie Soekadar betont, müssten – soweit vorhanden – andere Kommunikationssysteme den BCI deutlich unterlegen sein.
 

MEHR

Kommentar

3090D553-9492-4563-8681-AD288FA52ACE
Wir bitten darum, Diskussionen höflich und sachlich zu halten. Beiträge werden vor der Veröffentlichung nicht überprüft, jedoch werden Kommentare, die unsere Community-Regeln verletzen, gelöscht.

wird bearbeitet....