Forscher weltweit begeistert: „Dies wird die Medizin verändern“ – DeepMind hat Proteinfaltungsproblem „quasi gelöst“

Sonja Böhm

Interessenkonflikte

9. Dezember 2020

In den Diskussionen um COVID-19, den Corona-Lockdown und die nun bald verfügbaren Impfungen ist eine Meldung von Ende November beinahe untergegangen, die aber nach Ansicht vieler Experten eigentlich eine wissenschaftliche Sensation ist. „Dies wird alles verändern“, so titelte z.B. Nature am 30. November 2020. Es sei ein Durchbruch gelungen, der „die Biologie transformieren wird“.

Revolution in der Biologie

Um was es geht: Das britische Unternehmen DeepMind, eine Tochter der Google Holding Alphabet, hat mit seinem stark verbesserten KI-Programm AlphaFold in einem internationalen Wettbewerb von wissenschaftlichen Teams einen bisher nicht vorstellbaren Erfolg vermeldet. Das „Proteinfaltungsproblem“ – ein wissenschaftliches Rätsel, an dem seit 50 Jahren geforscht wird, und das in seiner Bedeutung der Aufklärung des genetischen Codes gleichgesetzt wird, sei „quasi gelöst“. AlphaFold gelang es mit bisher nicht vorstellbarer Genauigkeit, die dreidimensionale Struktur von Proteinen allein aus ihrer Aminosäure-Abfolge vorherzusagen.

DeepMind hatte mit seinem Programm AlphaFold, das auf Maschinellem Lernen basiert, mit weitem Abstand den 2-jährlich stattfindenden Wettbewerb CASP (die Abkürzung steht für Critical Assessment of Structure Prediction) gewonnen, an dem rund 100 andere wissenschaftliche Teams weltweit teilgenommen hatten. Die anderen Teams wurden dabei so weit in den Schatten gestellt, dass Wissenschaftler von einer „Revolution in der Biologie“ durch die neuen Möglichkeiten sprechen.

Ein Jahrzehnt Tüftelei – und nun in einer halben Stunde gelöst

Die Naturwissenschaften und speziell die Medizin könnten von dem Fortschritt, Proteinstrukturen anhand ihrer Aminosäuresequenz genau vorherzusagen, ungeheuer profitieren. „Es ist ein Game Changer“, wird Prof. Dr. Andrei Lupas, Molekularbiologe und Direktor am Tübinger Max-Planck-Institut für Entwicklungsbiologie, in Nature zitiert.

Der Wissenschaftler gehörte zu den „Juroren“, die die Leistung verschiedener Teams in CASP bewertet haben. Er und sein Team hatten aber auch selbst Proteine als „Targets“ eingereicht, unter anderem eines, an dessen Struktur sie seit einem Jahrzehnt tüftelten. „Mit der Vorhersage von AlphaFold als Suchmodell konnten wir die Struktur in einer halben Stunde lösen“, berichtet Lupas gegenüber dem Science Media Center Deutschland.

 
Mit der Vorhersage von AlphaFold als Suchmodell konnten wir die Struktur in einer halben Stunde lösen. Prof. Dr. Andrei Lupas
 

AlphaFold werde seine Arbeitsweise und die Fragen, mit denen er sich befasse, verändern, sagt Lupas: „Dies wird die Medizin verändern. Es wird die Forschung verändern. Es wird das Bioengineering verändern. Es wird alles verändern.“

„Structure is function“ – und die Struktur lässt sich nun klären

Kollegen von ihm sind ebenso beeindruckt. „Die dreidimensionalen Strukturen von Proteinen sind wesentlich für das Verständnis biologischer Systeme auf molekularer Ebene, da die Form ihre Funktion bestimmt“, erläutert Dr. Sameer Velankar, Europäisches Laboratorium für Molekularbiologie (EMBL-EBI) in Cambridge, UK.

„Structure is function“ lautet ein Axiom der Molekularbiologie. „Die Strukturen können verwendet werden, um neue Proteinfunktionen zu entwerfen, die Stabilität bestehender Proteine zu verbessern oder therapeutische Moleküle mit Anwendungen in der Biotechnologie und der pharmazeutischen Industrie zu entwickeln“, so Velankar weiter.

Bislang sei bei weniger als 1% der Proteine im Menschen die Struktur bestimmt. Als Goldstandard gelten experimentelle Verfahren wie die Kristallstrukturanalyse mit Röntgenstrahlen, Cryo-Elektronen-Tomographie oder die multidimensionale NMR-Spektroskopie. Die Verfahren sind jedoch ungeheuer zeitaufwändig und komplex.

Frühe Versuche, Computer zu nutzen, um einfachere und schnellere Wege zur Strukturaufklärung zu finden, waren wenig erfolgreich. Auch wenn der US-amerikanische Biochemiker Prof. Dr. Christian Anfinsen bereits in der Frühphase der Protein-Forschung gezeigt hatte, dass sich theoretisch die Struktur eines Proteins aus seiner Aminosäuresequenz ableiten lässt – er erhielt dafür 1972 den Nobelpreis für Chemie.

 
Die Vorhersage der Proteinfaltung am Computer ist kompliziert, weil mehrere Tausend Atome richtig positioniert werden müssen … Dafür gibt es theoretisch mehr Möglichkeiten als Sterne im Universum. Prof. Dr. Jens Meiler
 

Das Problem: „Die Vorhersage der Proteinfaltung am Computer ist kompliziert, weil mehrere Tausend Atome richtig positioniert werden müssen, wie ein riesiges dreidimensionales Puzzle. Dafür gibt es theoretisch mehr Möglichkeiten als Sterne im Universum. Kein Computerprogramm kann alle diese Möglichkeiten testen“, erläutert Prof. Dr. Jens Meiler, Leiter des Instituts für Wirkstoffentwicklung, Universität Leipzig und Professor für Chemie, Pharmakologie und Biomedizinische Informatik, Vanderbilt University, Nashville, USA.

Um die Forschung hier voranzubringen war 1994 das CASP-Gemeinschaftsexperiment ins Leben gerufen worden. Von 100 Proteinsequenzen, deren Struktur experimentell mehr oder weniger aufgeklärt, aber noch nicht publiziert ist, sollen die teilnehmenden Teams jeweils die dreidimensionale Faltungsstruktur vorhersagen. Vor 2 Jahren hatte das AlphaCode-Team zum 1. Mal teilgenommen – und bereits damals den Wettbewerb CASP13 gewonnen. Aber in diesem Jahr in CASP14 outperformte der DeepMind-Ansatz alle anderen bei weitem. Dies obwohl auch die anderen Teams auf Methoden des Machine Learning zurückgriffen.

Verblüffende Genauigkeit mit 92,4 GDT

Die „Juroren“ des Wettbewerbs, unabhängige Wissenschaftler wie Lupas, verglichen die eingereichten Vorhersagen mit den experimentellen Daten und bewerteten die Ergebnisse anhand des sogenannten „Global Distance Test“ (GDT)-Wertes auf einer Skala von 1 bis 100. Dabei sind die Einreichungen anonymisiert, die Juroren wissen nicht, woher sie stammen.

AlphaFold reichte seine Ergebnisse als „Gruppe 427“ ein. Aufgrund der „verblüffenden Genauigkeit“ habe er vermutet, dass es sich um AlphaFold handle, berichtet Lupas in Nature. Das britische DeepMind-Team erreichte über alle 100 Proteine hinweg 92,4 GDT und lag sogar bei den „Hard to Predict“-Proteinen im Median bei etwa 87. Im CASP13-Wettbewerb vor 2 Jahren war hier nur ein Wert von ungefähr 53 erreicht worden.

Die besten konkurrierenden Forschergruppen erreichten einen GDT-Wert von 75. Ein Wert höher als 90 gilt unter Wissenschaftlern als vergleichbar präzise wie die experimentelle Strukturaufklärung, die oft Jahre dauert. AlphaFold konnte in einem knappen Dutzend von Fällen, in denen „Hard to Predict“-Proteinsequenzen zu modellieren waren, letztlich den Forschenden mit seinen Vorhersagen sogar helfen, ihre experimentellen Ergebnisse zu optimieren.

Der Deep-Learning-Ansatz ist so vielversprechend, weil hier nicht der Computer die Struktur – die eindeutig durch die Gesetze der Physik vorgegeben ist – mittels der Formeln der Quantenmechanik berechnen muss. „Der dazu benötigte Rechenaufwand wäre gigantisch“, erläutert Dr. Jürgen Cox, Leiter der Forschungsgruppe „Computational Systems Biochemistry“ am Max-Planck-Institut für Biochemie, Martinsried bei München.

Dagegen werde beim „Deep Learning“, basierend auf vielen Beispielen, in denen die Proteinstruktur mit experimentellen Methoden gelöst wurde, „ein ‚Deep Neural Network‘ trainiert, welches die entscheidenden Regeln für die Bestimmung der Struktur extrahiert, und somit die Lösung der komplizierten physikalischen Gleichungen ersetzt. Trainiert wird das Netzwerk anhand von Informationen aus Protein-Datenbanken.

Wie das „Deep Neural Network“ es macht, wissen auch die Forscher nicht

Der Nachteil der Methode: Die Wissenschaftler programmieren zwar das „Deep Neural Network“, das diese Arbeit leistet, wie genau die erstaunlichen Ergebnisse zustande kommen, wissen aber auch die Forscher nicht. „AlphaFold ist im Grunde, wie eine Person zu kennen, die innerhalb weniger Stunden eine Proteinstruktur experimentell bestimmen kann, uns aber nicht sagt, wie sie das macht“, zieht Prof. Dr. Gunnar Schröder, Leiter der Forschungsgruppe Computational Structural Biology am Forschungszentrum Jülich, einen anschaulichen Vergleich.

 
AlphaFold ist im Grunde, wie eine Person zu kennen, die innerhalb weniger Stunden eine Proteinstruktur experimentell bestimmen kann, uns aber nicht sagt, wie sie das macht. Prof. Dr. Gunnar Schröder
 

Er zeigt sich zwar ebenfalls begeistert, ist aber auch noch kritisch: „Es ist fantastisch und von großem wissenschaftlichem Wert, eine Methode zu haben, die so erfolgreich atomare Modelle produziert. Den ‚Code der Proteinfaltung‘ halte ich allerdings nicht wirklich für geknackt“, wendet er ein.

Und auch andere Kollegen gießen Wasser in den Wein: „Proteine nehmen in der Regel nicht eine einzige Faltung an, sondern verändern sich als Reaktion auf die Umgebung, bei der Bindung an andere Proteine, bei der Durchführung enzymatischer Reaktionen oder bei der Bindung von Medikamenten oder therapeutischen Antikörpern. Es scheint, dass AlphaFold diese Veränderungen noch nicht vorhersagen kann“, gibt Dr. Jan Kosinski, Gruppenleiter am Europäischen Laboratorium für Molekularbiologie (EMBL) in Hamburg, zu bedenken.

Große Chancen für die Medikamenten-Entwicklung

Derzeit verändere sich das Feld aber rasant. Schröder verspricht sich viel, etwa für die Medikamenten-Entwicklung. „Proteinstrukturen sind auch direkt für die Entwicklung von Medikamenten wichtig. Proteine sind häufig das Ziel von Wirkstoffen, mit denen die Proteine zum Beispiel inhibiert werden sollen. Wenn wir ein genaues atomares Modell eines Zielproteins haben, kann dieses benutzt werden, um gezielt einen Wirkstoff zu entwickeln“, sagt er und sieht noch weitere Zukunftsperspektiven: „Das schnell wachsende Gebiet der personalisierten Medizin könnte damit sogar zur personalisierten molekularen Medizin werden, bei der wir Wirkstoffe und Therapie in Zukunft auf die persönlichen Proteinstrukturen eines einzigen Patienten zuschneiden.“

 
Wenn wir ein genaues atomares Modell eines Zielproteins haben, kann dieses benutzt werden, um gezielt einen Wirkstoff zu entwickeln. Prof. Dr. Gunnar Schröder
 

Auch Meiler sieht einen „tollen Erfolg, der sicherlich die strukturbasierte Entwicklung von Medikamenten für Krankheiten ermöglichen wird. Zum Beispiel die Entwicklung von Therapeutika für neurologische Krankheiten wie Alzheimer, Schizophrenie, Demenz kann profitieren, wenn die Struktur bestimmter Rezeptoren im Gehirn nun berechnet werden kann“, hofft er.

Ebenso sieht Cox „ungeahnte Möglichkeiten für das Verständnis von Krankheiten und ihrer Heilung“. Er sagt: „Viele Krankheiten basieren auf der Störung der regulären Funktionsweise von Proteinen. Die Beziehung zwischen der DNA und der Funktionsweise von Proteinen, Zellen, Geweben, Organen und dem ganzen Körper wird durch die Strukturvorhersage ein enormes Stück weiter zusammengeführt.“

Es bleibt aber auch noch vieles weiter zu erforschen

Doch blieben nach wie vor noch viele Fragen unbeantwortet. Cox erinnert daran, dass es „noch eine Nummer schwieriger ist, basierend auf der Vorhersage der Proteinstrukturen zu erschließen, wie diese Proteine zusammenarbeiten und welche Proteinkomplexe gebildet werden“. Zudem gebe es vielfältige Interaktionen der Proteine mit DNA, RNA und kleineren Molekülen – und fast jedes Protein weise „Modifikationen wie Phosphorylierungen auf, die einen wichtigen Einfluss auf Struktur, Funktion und Wechselwirkung mit anderen Biomolekülen haben“. All dies werde derzeit von AlphaFold noch nicht beantwortet.

Prof. Dr. Alexander Schug, Leiter der Forschungsgruppe „Multiscale Biomolecular Simulation“ am Karlsruher Institut für Technologie (KIT), bringt auch noch eine „gesellschaftliche Perspektive“ des Durchbruchs ins Spiel. So haben neben vielen wissenschaftlichen Forschungsgruppen und dem Google-Ableger DeepMind in diesem Jahr auch Microsoft und die chinesische Technologiefirma Tencent an CASP14 teilgenommen.

Schug gibt zu bedenken: „Wollen wir als Gesellschaft, dass große internationale Technologie-Unternehmen Forschung zu KI so wesentlich vorantreiben oder wollen wir in der öffentlichen Forschung an Universitäten und Forschungseinrichtungen unabhängige Kompetenz in der Schlüsseltechnologie KI halten?“

 
Wollen wir als Gesellschaft, dass große internationale Technologie-Unternehmen Forschung zu KI so wesentlich vorantreiben? Prof. Dr. Alexander Schug
 

Jedoch hat DeepMind angekündigt, demnächst ein Methodenpaper zu veröffentlichen und mit dem Vorhersagemodell eine beschleunigte Proteinstrukturanalyse für alle „Forschende mit berechtigtem Interesse“ ermöglichen zu wollen. Einige Wissenschaftler monieren jedoch, dass das Methodenpapier zu CASP13 vor 2 Jahren erst kürzlich publiziert wurde – und nun längst überholt ist, da die DeepMind-Wissenschaftler ihr neuronales Netzwerk inzwischen komplett überarbeitet haben.

Trotz allem ist in der wissenschaftlichen Gemeinde die Freude und Begeisterung über den Erfolg groß. „Ich hatte nicht geglaubt, dass ich es noch erlebe, wie das Proteinfaltungsproblem gelöst wird“, zitiert Nature Prof. Dr. Janet Thornton, Strukturbiologin am European Molecular Biology Laboratory-European Bioinformatics Institute in Hinxton, UK. 

 

Kommentar

3090D553-9492-4563-8681-AD288FA52ACE
Wir bitten darum, Diskussionen höflich und sachlich zu halten. Beiträge werden vor der Veröffentlichung nicht überprüft, jedoch werden Kommentare, die unsere Community-Regeln verletzen, gelöscht.

wird bearbeitet....