Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Quantitative Biologie# Biomoleküle# Künstliche Intelligenz# Maschinelles Lernen

Neues Modell verbessert Vorhersagen zur Stabilität von Proteinen

Forscher entwickeln ein Modell, um besser vorherzusagen, wie sich die Stabilität von Proteinen durch Aminosäure-Mutationen verändert.

― 6 min Lesedauer


Vorhersage derVorhersage derProtein-Stabilität mit KIStabilität von Proteinen.Verständnis von Veränderungen in derEin neues Modell verbessert das
Inhaltsverzeichnis

Die Stabilität von Proteinen ist ein wichtiger Teil davon, wie Proteine funktionieren und sich entwickeln. Sie beeinflusst viele gesundheitliche Probleme beim Menschen und ist entscheidend für die Schaffung neuer Proteine für verschiedene Anwendungen. Wenn Proteine ihre Bausteine, die Aminosäuren, verändern, kann das ihre Stabilität beeinträchtigen. Ein stabiles Protein ist eines, das sich richtig faltet und seine Struktur unter verschiedenen Bedingungen behält. Wenn sich die Stabilität eines Proteins aufgrund von einer oder mehreren Aminosäureänderungen verändert, kann das zu ernsthaften Problemen, einschliesslich Krankheiten, führen.

In dieser Studie wollten die Forscher die Methoden verbessern, um vorherzusagen, wie diese Änderungen in den Aminosäuren die Protein-Stabilität beeinflussen. Sie haben fortschrittliche Technologien verwendet, um Proteine auf einer tieferen Ebene zu analysieren. Durch den Einsatz einer Art von Künstlicher Intelligenz, die als Graph-Neuronale Netzwerke bekannt ist, konnten die Forscher die Beziehungen zwischen den Aminosäuren besser berücksichtigen als es frühere Methoden konnten.

Bedeutung der Protein-Stabilität

Die Protein-Stabilität kann als das Gleichgewicht zwischen einem gefalteten und einem entfalteten Zustand eines Proteins betrachtet werden. Ein Protein kann in zwei Hauptformen existieren: gefaltet, was seinen aktiven Zustand darstellt, und entfaltet, was seinen inaktiven Zustand ist. Das Ziel ist, eine negative Änderung der freien Energie zu haben, wenn sich ein Protein faltet. Je stabiler ein Protein ist, desto leichter kann es seine Form beibehalten und richtig funktionieren. Bestimmte Mutationen können ein Protein instabiler machen, indem sie seine gefaltete Struktur stören.

Zum Beispiel wurde ein Wechsel von Threonin zu Methionin in einem bestimmten Enzym mit Herzkrankheiten in Verbindung gebracht. Diese Änderung stört die stabilisierenden Kräfte innerhalb des Proteins, was zu einer weniger stabilen Struktur und reduzierter Funktion führt.

Aktuelle Methoden zur Messung der Protein-Stabilität

Traditionell messen Wissenschaftler, wie Mutationen die Stabilität von Proteinen beeinflussen, indem sie Experimente durchführen. Eine gängige Methode besteht darin, Proteine zu erhitzen und zu beobachten, wie sie sich entfalten. Durch den Vergleich der Entfaltungstemperaturen des ursprünglichen Proteins und seiner mutierten Gegenstücke können Wissenschaftler auf die Stabilitätsänderungen schliessen. Diese Experimente können jedoch zeitaufwändig und teuer sein.

Um diesen Prozess zu beschleunigen, haben die Forscher auf Computermodelle zurückgegriffen. Einige Modelle verwenden bekannte physikalische Prinzipien, um Stabilitätsänderungen abzuschätzen. Zum Beispiel simulieren sie die physikalischen Interaktionen zwischen Atomen in Proteinen, um vorherzusagen, wie stabil ein Protein nach Mutationen sein wird. Während diese Modelle Einblicke bieten können, erfordern sie oft erhebliche Rechenressourcen und Zeit, was sie weniger praktisch für grosse Datensätze macht.

Fortschritte durch Maschinelles Lernen

Mit dem raschen Wachstum der verfügbaren Daten über Proteine ist maschinelles Lernen zu einem mächtigen Werkzeug zur Vorhersage der Protein-Stabilität geworden. Neuere Methoden konzentrieren sich darauf, Techniken des maschinellen Lernens zu verwenden, um Sequenzen von Aminosäuren und deren evolutionäre Geschichte zu analysieren. Diese Modelle können Vorhersagen basierend auf den Sequenzdaten allein machen, aber ihnen fehlt oft detaillierte Informationen über die dreidimensionale Struktur des Proteins.

Um diese Vorhersagen zu verbessern, kombinierten die Forscher in dieser Studie Sequenzdaten mit strukturellen Informationen. Sie entwickelten ein System, das die Veränderungen von Proteinen genauer bewerten konnte, indem es zwei verschiedene Skalen verwendete: die atomare und die Restebene. Die atomare Skala betrachtet einzelne Atome, während die Restebene Gruppen von Aminosäuren untersucht.

Der neue Ansatz mit Graph-Neuronalen Netzwerken

Die Forscher entwarfen ein neues Modell mit Graph-Neuronalen Netzwerken (GNNs), um eine detailliertere und flexiblere Darstellung von Proteinen zu erstellen. Indem sie Proteine als Graphen betrachteten, in denen Aminosäuren Knoten und ihre Verbindungen Kanten sind, konnte das Modell die komplexen Beziehungen zwischen verschiedenen Teilen des Proteins berücksichtigen.

Sie trainierten das Modell mit einem neuen grossen Datensatz, der viele Proteinvarianten enthielt. Dieser Datensatz, genannt Mega-Skala, wurde durch Hochdurchsatz-Experimente gesammelt und enthielt umfassende Informationen über Änderungen der Protein-Stabilität. Mit über 600.000 Datenpunkten bot er eine solide Basis für das Training des Modells.

Die Forscher richteten zwei Hauptaufgaben für ihr Modell ein. Die erste Aufgabe bestand darin, die atomare Umgebung um die Aminosäuren zu identifizieren. Die zweite bestand darin, die Stabilitätsänderungen zu bewerten, die durch Mutationen verursacht werden. Der Einsatz von Graph-Neuronalen Netzwerken ermöglichte es den Forschern, verschiedene Beziehungen und Wirkungen von unterschiedlichen Aminosäureänderungen in einem einzigen Modell zu betrachten.

Ergebnisse und Bewertung

Bei der Bewertung zeigte das Modell vielversprechende Ergebnisse. Es war in der Lage, Veränderungen in der Protein-Stabilität genau vorherzusagen, selbst für Kombinationen von Mutationen, auf die es nicht direkt trainiert worden war. Diese Flexibilität ist eine bedeutende Verbesserung gegenüber früheren Modellen, die nur mit einzelnen oder festen Zahlen von Mutationen umgehen konnten.

Das Team verglich auch ihre Ergebnisse mit traditionellen Methoden und anderen Modellen des maschinellen Lernens und stellte fest, dass ihr Ansatz wettbewerbsfähige Ergebnisse lieferte, obwohl er einige Einschränkungen hatte. Zum Beispiel hatte das Modell gelegentlich Schwierigkeiten mit Überanpassung an den Mega-Skala-Datensatz, was seine Generalisierbarkeit auf neue Proteinsequenzen verringern könnte.

Zukünftige Richtungen

Die Forscher räumten ein, dass, obwohl ihr Ansatz grosses Potenzial zeigt, es noch Bereiche gibt, die verbessert werden müssen. Zum Beispiel arbeiten sie daran, die Distanzschwellen zu verfeinern, die zur Definition von Verbindungen zwischen Aminosäuren verwendet werden, was die Genauigkeit des Modells verbessern könnte. Darüber hinaus könnte die Einbeziehung anderer Methoden und Datensätze weitere Einblicke in das Verhalten von Proteinen unter verschiedenen Bedingungen bieten.

Indem sie ihr Modell kontinuierlich verfeinern und neue Daten erkunden, hoffen die Forscher, ein zuverlässiges Werkzeug zu entwickeln, das bei der Protein-Design und -Engineering helfen kann. Das könnte zu bedeutenden Fortschritten in der Medizin, Biotechnologie und unserem Verständnis von proteinbezogenen Krankheiten führen.

Fazit

Diese Studie stellt einen bedeutenden Schritt nach vorn dar, um vorherzusagen, wie Änderungen der Aminosäuren die Protein-Stabilität beeinflussen. Durch den Einsatz fortschrittlicher Techniken des maschinellen Lernens und die Kombination von Daten aus mehreren Quellen haben die Forscher ein Modell geschaffen, das die Komplexität der Proteinstrukturen berücksichtigen kann. Während das wissenschaftliche Verständnis von Proteinen weiterentwickelt wird, werden Werkzeuge wie dieses entscheidend sein, um neue Möglichkeiten in der Proteinforschung und -entwicklung zu erschliessen.

Originalquelle

Titel: Predicting protein stability changes under multiple amino acid substitutions using equivariant graph neural networks

Zusammenfassung: The accurate prediction of changes in protein stability under multiple amino acid substitutions is essential for realising true in-silico protein re-design. To this purpose, we propose improvements to state-of-the-art Deep learning (DL) protein stability prediction models, enabling first-of-a-kind predictions for variable numbers of amino acid substitutions, on structural representations, by decoupling the atomic and residue scales of protein representations. This was achieved using E(3)-equivariant graph neural networks (EGNNs) for both atomic environment (AE) embedding and residue-level scoring tasks. Our AE embedder was used to featurise a residue-level graph, then trained to score mutant stability ($\Delta\Delta G$). To achieve effective training of this predictive EGNN we have leveraged the unprecedented scale of a new high-throughput protein stability experimental data-set, Mega-scale. Finally, we demonstrate the immediately promising results of this procedure, discuss the current shortcomings, and highlight potential future strategies.

Autoren: Sebastien Boyer, Sam Money-Kyrle, Oliver Bent

Letzte Aktualisierung: 2023-05-30 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2305.19801

Quell-PDF: https://arxiv.org/pdf/2305.19801

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel