GenAI läutet eine neue Ära der Arzneimittelforschung ein

Von Emmanuel Barraud

Der Einsatz generativer künstlicher Intelligenz im Proteindesign könnte die Entwicklung neuer Medikamente revolutionieren. Die EPFL hat vor, ein Konsortium zusammenzustellen, um diesen Ansatz weiter zu erforschen.

Alle Lebewesen bestehen aus Proteinen. Sie spielen eine Schlüsselrolle bei der Zellstruktur, Ernährung und Gesundheit sowie bei der Wechselwirkung zwischen Medikamenten und ihrem Körper.

Jüngste Fortschritte im Proteindesign könnten eine neue Ära der Arzneimittelforschung einläuten. An der Spitze dieser Revolution steht die generative künstliche Intelligenz (GenAI), die in der Lage ist, völlig neue Arten von Proteinen zu entwickeln. Neue Bildgebungsverfahren wie die Röntgenkristallographie und die kryogene Elektronenmikroskopie spielen ebenfalls eine Schlüsselrolle, da sie es Wissenschaftlern ermöglichen, die Zusammensetzung realer Proteine ​​mit beispielloser Präzision zu beobachten. Die Kombination dieser neuen Technologien könnte den Weg für neuartige Prozesse ebnen, mit denen Forscher unter anderem innovative biologische Medikamente, oft Biologika genannt, entwickeln können.

Biomoleküle aus der Nähe betrachtet

Unser heutiges Verständnis der Interaktion zwischen Proteinen und Zellen beruht auf empirischen Daten, die wir im Laufe jahrelanger biomedizinischer Forschung gesammelt haben. Um nur ein Beispiel zu nennen: Wir wissen genau, welche Rolle Insulin im Glukosestoffwechsel spielt. Doch zahllose andere Interaktionen zwischen Proteinen und Zellen bleiben ein Rätsel – ebenso wie die Gründe und Mechanismen krankheitsverursachender Proteinfehlfunktionen.

Durch das Aufkommen neuer Methoden und Technologien wächst der wissenschaftliche Wissensschatz exponentiell. Mithilfe der kryogenen Elektronenmikroskopie – einer Methode, die am Dubochet Center for Imaging der EPFL-UNIL praktiziert und entwickelt wird – konnten Forscher in vitro beobachten , wie das Spike-Protein der Omikron-Variante von SARS-CoV-2 mit Rezeptoren auf der Oberfläche menschlicher Zellen interagierte. Dies bietet Einblicke sowohl in die schnelle Ausbreitung des Virus im Körper als auch in seine Immunität gegen Impfstoffe, die für frühere Varianten entwickelt wurden.

Das Spike-Protein

Image: © Emphase / EPFL

Das Spike-Protein ist als Speerspitze bekannt, die es dem SARS-CoV-2-Virus ermöglicht, in menschliche Zellen einzudringen. Es erlangte während der Pandemie Berühmtheit. Das Spike-Protein bindet an ACE2-Proteine ​​auf bestimmten Zellmembranen (einschließlich derer in unserem Atmungssystem) und öffnet so die Tür für den Eintritt des Virus. Es besteht aus drei identischen Ketten, die aus der Virushülle herausragen. Das Spike-Protein ist ein Glykoprotein – das heißt, es ist mit Zuckern beschichtet, die zufällig menschlichen Ursprungs sind. Wenn die Zuckerbeschichtung dick genug ist, fungiert sie als „unsichtbarer Umhang“, wodurch das Virus für unser Immunsystem unsichtbar wird.
Das Spike-Protein ist ein Hauptziel für unser Immunsystem bei der Bekämpfung einer Infektion – und Impfstoffe sind ein mächtiger Verbündeter in diesem Kampf. Wissenschaftler verwendeten eine Vielzahl von Methoden, um SARS-CoV-2-Impfstoffe zu entwickeln. Eine davon bestand darin, das Spike-Protein des Virus zu synthetisieren und anschließend zu reinigen, das dann auf Nanopartikel aufgebracht und durch subkutane Injektionen verabreicht wurde. Der Impfstoff veranlasst das Immunsystem des Empfängers, Antikörper zu produzieren, da das Spike-Protein als Fremdkörper erkannt wird. Bei mRNA-Impfstoffen wird nicht eine Nachbildung des Spike-Proteins verabreicht, sondern sein „Bauplan“ in Form von mRNA. Dadurch können die körpereigenen Zellen des Empfängers das Spike-Protein synthetisieren, gegen das das Immunsystem spezifische Antikörper entwickelt.

Deep Learning im Leben anwenden

Ähnlich schnelle Fortschritte werden auch auf einem anderen Gebiet erzielt: bei der Anwendung des maschinellen Lernens in den Biowissenschaften. Den Nobelpreis für Chemie 2024 erhalten David Baker, ein amerikanischer Pionier der Computerbiologie, sowie Demis Hassabis – Träger des Ehrendoktortitels der EPFL – und John M. Jumper, die gemeinsam AlphaFold entwickelten, ein mehrfach preisgekröntes KI-Benchmark-Modell zur Vorhersage der Struktur von Molekülen.

Entwicklung neuer Biomoleküle

Auch im Bereich Proteindesign ist die EPFL sehr aktiv. Seit mehr als fünf Jahren nutzt das von Bruno Correia geleitete Labor für Proteindesign und Immunoengineering der Fakultät maschinelles Lernen, um das Interaktionspotenzial zwischen Proteinen und ihren Rezeptoren vorherzusagen. „Der Einsatz von Deep Learning in der Biotechnik eröffnet spannende neue Möglichkeiten“, sagt Correia.

Diese bahnbrechende Arbeit erweitert nicht nur unser Verständnis der Funktionsweise lebender Organismen, sondern markiert auch den Ausgangspunkt für eine Revolution in der Arzneimittelforschung. Denn wenn GenAI-Programme wie ChatGPT anhand von Protein- und molekularen Interaktionsdaten trainiert werden, die von Forschern und Modellen wie AlphaFold generiert werden, können die Programme völlig neue Molekültypen in unzähligen Formen entwerfen und modellieren und ihre Interaktionen mit Zellen simulieren. Und die Programme können Milliarden solcher Berechnungen pro Sekunde durchführen, bis sie Moleküle finden, die für die Arzneimittelentwicklung theoretisch relevant sind. „Dieser neue Ansatz wird nichts weniger als einen Paradigmenwechsel für das gesamte Feld der Biotechnologie bedeuten“, fügt Correia hinzu.

Von der Planung zur Realität

Es gibt jedoch verschiedene Möglichkeiten, bestehende oder bisher unbekannte Proteine ​​auf Anfrage herzustellen. Dies tun Florence Pojer und ihre Forschungsgruppe an der Protein Production and Structure Core Facility (PTPSP) der EPFL, wo Flaschen mit rötlichen Flüssigkeiten stundenlang in Glasschränken geschüttelt werden. „Diese Flaschen enthalten beispielsweise humane embryonale Nierenzellen (HEK-Zellen), die seit Jahrzehnten immortalisiert und kultiviert werden“, sagt Pojer. „Wir verwenden sie, um Proteine ​​wie Antikörper herzustellen, nachdem wir die Zellen zunächst mit Plasmiden transfiziert haben, die die gewünschte Sequenz enthalten.“

Wissenschaftler am PTPSP erstellen auch andere Arten von Zell- und Bakterienmischungen, je nachdem, welche Ergebnisse sie erzielen möchten. Die endgültige Lösung wird dann gereinigt, um die Zielproteine ​​zu isolieren. „Theoretisch ist es möglich, jedes Protein aus seiner genetischen Sequenz herzustellen“, fügt sie hinzu. „Aber nach aktuellem Stand kann nur ein winziger Bruchteil der Proteine, die am Computer in silico entwickelt werden , tatsächlich in der realen Welt hergestellt werden und funktionieren. Die Idee hinter neuartigen biotechnologischen Ansätzen besteht darin, die Bandbreite dessen zu erweitern, was wir in Zukunft produzieren können.“

Ein Großteil dieser innovativen Technologie wird an der EPFL angewendet oder entwickelt – nicht nur von Correia und seiner Forschungsgruppe, sondern auch im Labor von Sebastian Maerkl, wo die Forscher sich nicht auf biologische Prozesse in lebenden Zellen konzentrieren, sondern auf In-vitro -Forschung mit den rund 30 Enzymen, die tatsächlich für die Proteinproduktion benötigt werden. Unterdessen untersucht die Forschungsgruppe von Matteo Dal Peraro mittels Beobachtung, Modellierung und Simulation große makromolekulare Systeme und ihre Handlungsmöglichkeiten, die durch ihre Struktur und Zusammensetzung bestimmt werden.

Ein riesiges Konsortium ist im Entstehen

Derzeit laufen an Schulen und Universitäten in der ganzen Schweiz verschiedene ergänzende Forschungsprojekte. An der EPFL bauen Correia und Beat Fierz ein Konsortium auf, um eine neue Ära der Arzneimittelforschung einzuläuten – eine Ära, die auf maschinellem Lernen basiert. Die Zusammenführung dieser Projekte unter einem Dach würde nicht nur die Position des Landes als Exzellenzzentrum auf diesem Gebiet festigen, sondern auch die rasche Entwicklung neuer wirksamer Proteine ​​für klinische Anwendungen fördern. Die Idee ist, die Entwicklung von KI-gestützter Moleküldesigntechnologie zu fördern, neue Arten der Arzneimittel-Zell-Interaktion zu erforschen, neue Datenbanken zu erstellen, um die Leistung von Designsoftware weiter zu verbessern, und Nachwuchswissenschaftler darauf vorzubereiten, neue Forschungs- und Technologietransfermöglichkeiten zu nutzen. Es ist ein ehrgeiziges Unterfangen, das Wissenschaftler künftiger Generationen mit Sicherheit faszinieren wird.

AlphaFold, das zu Google DeepMind gehört, ist ein KI-Modell, das die Aminosäuresequenz eines Proteins verwendet, um die Art und Weise vorherzusagen, wie es gefaltet ist – ein struktureller Faktor, der sowohl seine Funktion als auch seine Fähigkeit bestimmt, mit seiner Umgebung zu interagieren. AlphaFold 3, die neueste Version, die im Mai 2024 veröffentlicht wurde, kann sogar die Struktur und Interaktionen von DNA- und RNA-Strängen modellieren, sodass Forscher die genauen zellulären Mechanismen identifizieren können, die bei der Entwicklung neuer Medikamente eine Schlüsselrolle spielen. Es wurde als Open-Source-Modell veröffentlicht, sodass Wissenschaftler auf der ganzen Welt damit neue therapeutische Verbindungen entwickeln können.

Autor: Emmanuel Barraud

Quelle (engl.): EPFL

Dieser Inhalt wird unter einer Creative Commons CC BY-SA 4.0-Lizenz verbreitet. Sie dürfen die darin enthaltenen Texte, Videos und Bilder frei reproduzieren, sofern Sie den Namen des Autors angeben und keine Einschränkungen für die spätere Verwendung des Inhalts festlegen. Wenn Sie eine Abbildung reproduzieren möchten, die den CC BY-SA-Hinweis nicht enthält, müssen Sie die Genehmigung des Autors einholen