Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Biologie# Bioinformatik

Proteine entwerfen für bessere Behandlungsergebnisse

Neue Techniken zielen darauf ab, Immunreaktionen bei therapeutischen Proteinen zu reduzieren.

― 9 min Lesedauer


Reduzierung vonReduzierung vonImmunreaktionen imProtein-Designtherapeutischen Proteinen zudie Immunvisibilität beiInnovative Methoden zielen darauf ab,
Inhaltsverzeichnis

Protein-Design ist ein wichtiges Feld in der Biotechnologie, besonders wenn's darum geht, neue Behandlungen für Krankheiten zu entwickeln. Wissenschaftler nutzen mittlerweile ausgeklügelte Methoden, um die Sequenzen von Aminosäuren (AAs), die Proteine bilden, basierend auf ihren dreidimensionalen (3D) Strukturen vorherzusagen. Ein beliebtes Tool dafür heisst ProteinMPNN. Dieses Tool hilft, die besten Aminosäuresequenzen vorherzusagen, die sich zu einer bestimmten Proteinform falten.

Allerdings ist es entscheidend, beim Erstellen neuer Proteine, insbesondere für medizinische Zwecke, zu berücksichtigen, wie das menschliche Immunsystem auf diese Proteine reagiert. Das Immunsystem kann Proteine erkennen, die fremd für den Körper sind, was zu weniger effektiven Behandlungen oder sogar schädlichen Nebenwirkungen führen kann. Das gilt besonders für therapeutische Proteine, die zur Behandlung von Erkrankungen gedacht sind, aber vom Immunsystem als Bedrohungen wahrgenommen werden können. Wenn der Körper diese Proteine als nicht-eigen erkennt, kann er eine Immunreaktion gegen sie auslösen, was ihre Wirksamkeit reduzieren oder Autoimmunreaktionen hervorrufen kann.

Wenn wir überlegen, wie ein therapeutisches Protein mit dem Immunsystem interagiert, ist es wichtig, sich darauf zu konzentrieren, wie das Protein in den Körper eingeführt wird und wo es wirken soll. Bei Proteinen, die ausserhalb von Zellen agieren, wird die Immunreaktion spezifische Arten der Immunerkennung umfassen. Einige Proteine müssen jedoch innerhalb menschlicher Zellen produziert werden, wie RNA-Behandlungen, die Probleme auf zellulärer Ebene angehen. In diesen Fällen kann die Immunreaktion aus verschiedenen Wegen stammen.

In dieser Diskussion konzentrieren wir uns darauf, wie Proteine so gestaltet werden können, dass die Wahrscheinlichkeit, vom Immunsystem erkannt zu werden, reduziert ist, insbesondere durch einen Mechanismus namens MHC-Klasse-I-Weg. Dieser Weg ist entscheidend, um bestimmte Immunzellen, bekannt als zytotoxische T-Lymphozyten (CTLs), auf die Präsenz potenziell schädlicher Proteine innerhalb von Zellen aufmerksam zu machen.

Überblick über den MHC-I-Weg

Der MHC-I-Weg spielt eine entscheidende Rolle in der Fähigkeit des Immunsystems, abnormale oder fremde Proteine innerhalb von Zellen zu erkennen. Dieses System ermöglicht es unseren Immunzellen, die Gesundheit von Zellen zu überwachen, indem sie kleine Stücke von Proteinen (sogenannte Peptide) auf ihrer Oberfläche präsentieren. Wenn ein CTL auf ein Peptid trifft, das es als fremd erkennt, kann es die Zerstörung der Zelle, die dieses Peptid anzeigt, auslösen.

Für therapeutische Proteine, die innerhalb von Zellen exprimiert werden, ist es besonders wichtig zu berücksichtigen, wie diese Proteine über den MHC-I-Weg auf der Zelloberfläche präsentiert werden können. Um Proteine für therapeutische Zwecke besser zu gestalten, können wir unsere Protein-Design-Tools so anpassen, dass sie Sequenzen erzeugen, die weniger wahrscheinlich vom Immunsystem erkannt werden.

Integration von Immunüberlegungen in das Protein-Design

Eine Möglichkeit, unseren Designansatz zu verbessern, ist die Verwendung einer Abstimmungstechnik, die als Direct Preference Optimization (DPO) bekannt ist. Diese Methode ermöglicht es uns, das ProteinMPNN-Tool so zu modifizieren, dass es Sequenzen erzeugt, die für das Immunsystem weniger sichtbar sind, während die gewünschte Qualität des Proteins erhalten bleibt.

Das neu angepasste Modell, genannt CAPE-MPNN, hat die gleiche Struktur wie ProteinMPNN, was die Integration in bestehende Workflows erleichtert. Der Schlüssel zu seinem Erfolg liegt darin, ein Gleichgewicht zwischen der Reduzierung der Immunerkennung und der Sicherstellung der funktionalen Qualität der gestalteten Proteine zu finden.

Hintergrund zum Protein-Falten und Design

Proteine falten sich zu komplexen 3D-Formen basierend auf der Sequenz der Aminosäuren, aus denen sie bestehen. Dieser Faltungsprozess ist entscheidend für die Funktion des Proteins. In den letzten Jahren gab es bedeutende Fortschritte bei der Vorhersage von Proteinstrukturen, mit bemerkenswerten Modellen wie AlphaFold, die für ihre Fähigkeiten in den Schlagzeilen waren. Das hat auch zu einem erneuten Interesse am Protein-Design geführt, bei dem neue Proteinsequenzen erstellt werden, die sich korrekt in die gewünschten Formen falten.

Traditionell basierte das Protein-Design auf physikbasierten Ansätzen, wie denen, die den Rosetta-Packer verwenden, um vorherzusagen, wie sich Proteine falten würden. Allerdings hat der jüngste Anstieg von maschinellem Lernen eine Welle datengestützter Methoden hervorgebracht. Tools wie ProteinMPNN sind entstanden, die riesige Datensätze nutzen, um neue Aminosäuresequenzen basierend auf bekannten Proteinstrukturen zu erstellen.

Der Workflow des Protein-Designs

Ein allgemeiner Protein-Design-Workflow beginnt mit der Generierung einer Rückgratstruktur mithilfe von Modellen wie RFdiffusion oder FoldingDiff. Sobald das Rückgrat festgelegt ist, kann ProteinMPNN dann Kandidat-Aminosäuresequenzen erzeugen, die sich in die gewünschte Struktur falten können. Ein alternativer Ansatz besteht darin, mit einer bestehenden Proteinsequenz zu beginnen und diese zu modifizieren, um andere Sequenzen mit ähnlichen Funktionen, aber möglicherweise weniger Sichtbarkeit für das Immunsystem zu erstellen.

Der maschinelle Lernaspekt dieses Prozesses ist entscheidend. Er schlägt eine Reihe von Kandidatdesigns vor, die dann durch bioinformatische Methoden bewertet werden, um zu sehen, wie wahrscheinlich es ist, dass sie sich korrekt falten und wie gewünscht funktionieren. Diese Bewertung kann rechenintensiv sein, insbesondere wenn Simulationen im Spiel sind. Daher besteht das Ziel darin, einen Satz von Kandidaten zu generieren, die bereits wahrscheinlich die gewünschten Kriterien erfüllen, in diesem Fall, um die Sichtbarkeit für das Immunsystem zu reduzieren.

Verständnis des MHC-Klasse-I-Wegs

Der MHC-I-Weg spielt eine wichtige Rolle dabei, wie das Immunsystem den Körper schützt. Für intrazelluläre Proteine ermöglicht dieser Weg den Zellen, zu kommunizieren, was in ihnen vor sich geht. Das geschieht, indem kurze Sequenzen von Proteinen auf der Zelloberfläche präsentiert werden. Wenn eine dieser Sequenzen von CTLs als nicht-eigen erkannt wird, kann das Immunsystem die betroffene Zelle eliminieren, um die Ausbreitung potenzieller Bedrohungen zu verhindern.

RNA-Therapeutika, die innerhalb von Zellen exprimiert werden, werden ebenfalls über den MHC-I-Weg auf der Zelloberfläche präsentiert. Daher ist es beim Designen von Proteinen wichtig, diese Sichtbarkeit zu berücksichtigen, um die Wahrscheinlichkeit einer Immunreaktion zu verringern.

Anpassung von ProteinMPNN mit DPO

Um den Bedarf an weniger Immun-Sichtbarkeit zu decken, können wir ProteinMPNN mit DPO abstimmen. Diese Methode ermöglicht es uns, die Sequenzen, die es generiert, so zu modifizieren, dass sie besser mit unserem Ziel der reduzierten Sichtbarkeit übereinstimmen. Der Prozess beginnt mit dem Sammeln von Daten, die unsere Vorlieben widerspiegeln, und der Nutzung dieser Daten, um die Ausgabe des Modells anzupassen.

Der Präferenzdatensatz besteht aus Beispielen, die eine Rückgratstruktur, zwei potenzielle generierte Antworten und welche dieser Antworten bevorzugt wird, umfassen. Dieser Datensatz bildet die Basis für die Feinabstimmung des Modells durch mehrere Trainingszyklen.

Erstellung eines Präferenzdatensatzes

Um unseren Präferenzdatensatz zu erstellen, nutzen wir die vorhandenen Daten, die in ProteinMPNN verwendet werden. Die Daten bestehen aus Proteinstrukturen, die aus dem Protein-Datenbank stammen, wobei jedes Beispiel mit spezifischen Proteinsequenzen verknüpft ist. Dieser Datensatz enthält viele Proteinketten, die basierend auf ihrer Ähnlichkeit gruppiert werden können. Durch die Auswahl zufälliger Proteine und die Bewertung ihrer Designs können wir feststellen, welche Sequenzen eine niedrigere Immun-Sichtbarkeit aufweisen.

In der Praxis generieren wir Proteindesigns aus dem angepassten CAPE-MPNN-Modell und vergleichen diese mit den ursprünglichen ProteinMPNN-Ausgaben. Jedes Design wird auf seine Sichtbarkeit und Qualität bewertet. Das Ziel ist es, herauszufinden, welche Sequenzen eine gewünschte Reduzierung der Sichtbarkeit erreichen können, während sie dennoch ein hohes Qualitätsniveau aufrechterhalten.

Bewertung der Auswirkungen von DPO auf das Protein-Design

Während das Hauptziel darin besteht, die Immun-Sichtbarkeit durch DPO zu reduzieren, ist es auch wichtig sicherzustellen, dass wir die funktionale Qualität der gestalteten Proteine nicht gefährden. Durch Bewertungsmethoden können wir beurteilen, wie sich die Anpassungen unter DPO auf die Leistungsfähigkeit der Proteine auswirken.

Um den Erfolg unseres Ansatzes zu messen, können wir verschiedene Faktoren betrachten, wie den TM-Score, der die strukturelle Ähnlichkeit zwischen dem gestalteten Protein und der ursprünglichen Sequenz angibt. Die Sichtbarkeit wird basierend auf der Anzahl der Peptide bewertet, die über den MHC-I-Weg präsentiert werden können. Durch den Vergleich dieser Metriken können wir die Auswirkungen von DPO sowohl auf die Sichtbarkeit als auch auf die Qualität der generierten Proteine analysieren.

Kompromisse im Protein-Design

Durch diesen Prozess wird offensichtlich, dass es Kompromisse gibt, die mit der Gestaltung von Proteinen mit reduzierter Sichtbarkeit verbunden sind. Zum Beispiel, während wir niedrigere Sichtbarkeitswerte erreichen können, kann dies auf Kosten der Sequenzwiederherstellung oder strukturellen Integrität gehen.

Die Analyse der Kompromisse zeigt, dass verschiedene Hyperparameter, die in DPO verwendet werden, die Position eines Modells entlang des Sichtbarkeits-Qualitäts-Spektrums verschieben können. Hohe Werte für bestimmte Parameter können zu Instabilität führen, während andere die Gesamtergebnisse des Designs verbessern oder beeinträchtigen können.

Leistungsevaluation spezifischer Proteine

Um die Effektivität unseres Ansatzes weiter zu bewerten, wenden wir das abgestimmte CAPE-MPNN-Modell auf spezifische Proteine an und beurteilen deren Leistung. Diese spezifischen Proteine werden aus der Protein-Datenbank ausgewählt und stammen aus den Tests der Wirksamkeit unserer Methoden.

Durch die Analyse, wie gut die Designs von CAPE-MPNN im Vergleich zu denen von ProteinMPNN abschneiden, können wir feststellen, ob die Anpassungen, die mit DPO vorgenommen wurden, zu zufriedenstellenden Ergebnissen in Bezug auf Sichtbarkeit und Qualität geführt haben.

Fazit und zukünftige Richtungen

Die Integration von Immunüberlegungen in das Protein-Design stellt eine aufregende Grenze in der Biotechnologie dar. Durch den Einsatz von Techniken wie DPO können wir unsere Fähigkeit verbessern, therapeutische Proteine zu schaffen, die weniger wahrscheinlich unerwünschte Immunreaktionen hervorrufen.

Obwohl unsere Ergebnisse das Potenzial der Anpassung von Modellen wie ProteinMPNN hervorheben, zeigen sie auch die Grenzen auf, die volle Eliminierung der Immun-Sichtbarkeit zu erreichen. Zukünftige Arbeiten werden darin bestehen, diese Techniken weiter zu verfeinern und die komplexe Beziehung zwischen Proteinstruktur, Funktion und Immunreaktion zu verstehen.

Während die Forschung in diesem Bereich weiterhin fortschreitet, könnten wir neue Möglichkeiten für sicherere und effektivere therapeutische Proteine erschliessen, die die Ergebnisse für Patienten in der Zukunft erheblich verbessern können.

Originalquelle

Titel: Integrating MHC Class I visibility targets into the ProteinMPNN protein design process

Zusammenfassung: ProteinMPNN is crucial in many protein design pipelines, identifying amino acid (AA) sequences that fold into given 3D protein backbone structures. We explore ProteinMPNN in the context of designing therapeutic proteins that need to avoid triggering unwanted immune reactions. More specifically, we focus on intra-cellular proteins that face the challenge of evading detection by Cytotoxic T-lymphocytes (CTLs) that detect their presence via the MHC Class I (MHC-I) pathway. To reduce visibility of the designed proteins to this immune-system component, we develop a framework that uses the large language model (LLM) tuning method, Direct Preference Optimization (DPO), to guide ProteinMPNN in minimizing the number of predicted MHC-I epitopes in its designs. Our goal is to design proteins with low MHC-I immune-visibility while preserving the original structure and function. For our assessment, we first use AlphaFold to predict the 3D structures of designed protein sequences. We then use TM-score, that measures the structural alignment between the predicted design and original protein, to evaluate fidelity to the original protein structure. We find our LLM-based tuning method for constraining MHC-I visibility is able to effectively reduce visibility without compromising structural similarity to the original protein.

Autoren: Hans-Christof Gasser, D. A. Oyarzun, J. A. Alfaro, A. Rajan

Letzte Aktualisierung: 2024-06-05 00:00:00

Sprache: English

Quell-URL: https://www.biorxiv.org/content/10.1101/2024.06.04.597365

Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.06.04.597365.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel