Fortschritte in der Proteiningenieurwissenschaft mit Hilfe von Maschinenlernen
Maschinelles Lernen verbessert die Proteinengineering, optimiert Enzyme und erweitert die Anwendungen.
― 6 min Lesedauer
Inhaltsverzeichnis
- Phasen der Proteingenieurwissenschaft
- Traditionelle Techniken zur Proteinoptimierung
- Ein neuer Ansatz: Maschinelles Lernen in der Protein-Engineering
- Vergleichsstudien: Maschinelles Lernen vs. gerichtete Evolution
- Anwendung: Ingenieurwissenschaft des NucB-Enzyms
- Wie maschinelles Lernen das NucB-Design verbessert hat
- Ergebnisse: Verbesserte NucB-Varianten
- Zero-Shot-Modell: Eine neue Grenze
- Fazit: Die Zukunft der Protein-Engineering
- Originalquelle
- Referenz Links
Protein-Engineering ist ein Bereich, der sich darauf konzentriert, Proteine zu modifizieren, um deren Funktionen zu verbessern. Diese Änderungen können für verschiedene Branchen von Vorteil sein, wie z.B. Medizin und Biotechnologie. Das Hauptziel ist in der Regel, Proteine zu schaffen, die unter bestimmten Bedingungen besser arbeiten oder neue Aufgaben übernehmen können.
Phasen der Proteingenieurwissenschaft
Der Prozess der Protein-Engineering umfasst oft zwei Hauptphasen: Entdeckung und Optimierung.
Entdeckungsphase
In der Entdeckungsphase suchen Forscher nach einem Kandidatenprotein, das eine bestimmte Aufgabe erfüllen kann, auch wenn das nicht perfekt ist. Zum Beispiel könnten sie ein Protein finden, das an ein bestimmtes Ziel binden oder eine chemische Reaktion durchführen kann, auch wenn das nur mit geringer Effizienz geschieht.
Optimierungsphase
Sobald ein Kandidat gefunden ist, erfolgt der nächste Schritt, die Optimierung. In dieser Phase geht es darum, die Fähigkeiten des Proteins zu verbessern, wie gut es an sein Ziel bindet oder wie stabil es bei Hitze bleibt. Zum Beispiel könnten Wissenschaftler versuchen, ein Enzym zu entwickeln, das bei hohen Temperaturen oder einem bestimmten pH-Wert besser funktioniert.
Traditionelle Techniken zur Proteinoptimierung
Eine gängige Methode zur Optimierung von Proteinen ist die gerichtete Evolution. Bei dieser Technik wird eine grosse Vielzahl von Proteinversionen durch zufällige Änderungen im genetischen Code erzeugt. Forscher wählen dann die besten Versionen aus und verfeinern sie durch wiederholte Zyklen von Mutation und Selektion.
Allerdings hat die gerichtete Evolution einige Einschränkungen. Manchmal kann es schwierig sein, signifikante Verbesserungen zu erzielen, weil die Änderungen zu Proteinen führen können, die überhaupt nicht gut funktionieren. Ausserdem kann es problematisch sein, wenn die Vielfalt der Proteine nicht gross genug ist, denn dann kann der Prozess stagnieren und es wird schwierig, bessere Versionen zu finden.
Maschinelles Lernen in der Protein-Engineering
Ein neuer Ansatz:Um die Herausforderungen der gerichteten Evolution zu bewältigen, haben die Forscher begonnen, Techniken des maschinellen Lernens in der Protein-Engineering zu verwenden. Maschinelles Lernen, eine Form von künstlicher Intelligenz, beinhaltet das Trainieren von Computermodellen zur Erkennung von Mustern in Daten. Im Kontext der Protein-Engineering bedeutet das, Daten aus früheren Experimenten zu nutzen, um neue Proteine zu entwerfen.
So funktioniert maschinelles Lernen in diesem Kontext
Maschinelles Lernen-gestützte gerichtete Evolution kombiniert traditionelle Methoden mit Datenanalyse. Der Prozess beginnt damit, Informationen über verschiedene Proteine und deren Funktionen zu sammeln. Diese Informationen werden dann verwendet, um Modelle des maschinellen Lernens zu trainieren. Diese Modelle können vorhersagen, welche Änderungen an der Struktur eines Proteins zu Verbesserungen führen könnten.
Forscher nutzen diese Vorhersagen, um neue Protein-Designs zu generieren und die besten Kandidaten für weitere Tests auszuwählen.
Vergleichsstudien: Maschinelles Lernen vs. gerichtete Evolution
Es ist wichtig zu vergleichen, wie effektiv maschinelles Lernen-gestützte Methoden im Vergleich zur traditionellen gerichteten Evolution sind. Während beide Ansätze darauf abzielen, bessere Proteine zu schaffen, verwenden sie unterschiedliche Strategien.
Techniken des maschinellen Lernens
Maschinelles Lernen kann grosse Datenmengen schnell analysieren und Muster erkennen, die für Menschen möglicherweise nicht offensichtlich sind. Dadurch kann es neue Designs vorschlagen, die möglicherweise besser funktionierende Proteine hervorbringen als das, was nur durch zufällige Mutationen entdeckt werden könnte.
Einschränkungen der gerichteten Evolution
Die gerichtete Evolution kann zwar in einigen Fällen effektiv sein, ist aber möglicherweise weniger effizient, wenn es um komplexe Proteinfunktionen geht. Die Vielfalt in der Proteinbibliothek kann den Erfolg begrenzen, was es schwieriger macht, Verbesserungen zu finden.
Anwendung: Ingenieurwissenschaft des NucB-Enzyms
Eine interessante Anwendung dieser Techniken war die Entwicklung des NucB-Enzyms. Dieses Enzym, das von einem bestimmten Bakterium produziert wird, kann DNA abbauen. Wissenschaftler wollten seine Wirksamkeit insbesondere bei neutralen pH-Werten verbessern, was für verschiedene biomedizinische Anwendungen wichtig ist.
Die Herausforderung mit NucB
Unter neutralen pH-Bedingungen sinkt die Aktivität von NucB erheblich. Ziel des Projekts war es, nicht nur die ursprüngliche Funktion wiederherzustellen, sondern sie auch zu verbessern, damit sie nützlich in der Praxis werden kann, etwa zur Behandlung chronischer Wunden oder zur Verhinderung von Biofilmbildung.
Wie maschinelles Lernen das NucB-Design verbessert hat
Durch den Ansatz des maschinellen Lernens konnten Wissenschaftler eine Bibliothek von NucB-Varianten erstellen, die aktiver waren als die, die durch traditionelle Methoden entwickelt wurden.
Erstellung der Proteinbibliothek
Der Prozess begann mit der Erstellung einer Bibliothek verschiedener NucB-Versionen. Die Forscher setzten maschinelles Lernen ein, um verschiedene Proteinsequenzen zu analysieren und vorherzusagen, welche Mutationen NucB effektiver machen könnten.
Screening-Prozess
Als Nächstes screened man diese Varianten mit einer Hochdurchsatzmethode, die es ermöglicht, viele Proben gleichzeitig zu testen. Man mass, wie gut jede NucB-Version unter den gewünschten Bedingungen, insbesondere bei neutralem pH, funktionierte.
Ergebnisse: Verbesserte NucB-Varianten
Die neue Technik zeigte vielversprechende Ergebnisse. Die durch maschinelles Lernen gestützten Varianten übertrafen nicht nur die aus der gerichteten Evolution, sondern wiesen auch eine grössere Vielfalt in ihren Strukturen auf.
Finde die besten Varianten
Durch verschiedene Screening-Runden stachen einige Varianten als besonders effektiv hervor. Diese Proteine konnten Biofilme deutlich besser abbauen als das ursprüngliche NucB-Enzym.
Biofilmabbau
In Tests entfernte die beste Variante über 70% des Biofilms, verglichen mit nur 13% für das Wildtyp-Enzym, als beide bei derselben Konzentration angewendet wurden. Diese Erkenntnis hob das potenzielle Potenzial der Nutzung von maschinellem Lernen in der Protein-Engineering hervor.
Zero-Shot-Modell: Eine neue Grenze
Ein neuartiger Ansatz namens Zero-Shot-Design wurde in diesem Projekt untersucht. Anstatt sich auf frühere Daten aus Experimenten zu stützen, trainierten die Forscher Modelle nur auf Basis natürlicher Proteinsequenzen.
Die Vorteile des Zero-Shot-Designs
Die Zero-Shot-Methode zeigte Potenzial, indem sie vielfältige und effektive Anfangsbibliotheken erzeugte. Diese Technik könnte einen Weg bieten, funktionale Proteine zu schaffen, ohne umfangreiche vorherige Daten zu benötigen.
Leistung im Vergleich zu traditionellen Methoden
Im Vergleich von Zero-Shot-Designs mit traditionellen Methoden wie fehleranfälliger PCR stellten die Forscher fest, dass die Zero-Shot-Modelle einen höheren Anteil aktiver Varianten lieferten. Das deutet darauf hin, dass sie effektiv vielversprechende Sequenzen identifizieren können.
Fazit: Die Zukunft der Protein-Engineering
Die Kombination aus maschinellem Lernen und traditionellen Protein-Engineering-Methoden stellt einen bedeutenden Fortschritt in diesem Bereich dar. Mit Techniken wie maschinellem Lernen können Wissenschaftler ein breiteres Spektrum an Möglichkeiten erkunden, was zur Entwicklung von Proteinen führt, die nicht nur effizienter, sondern auch vielfältiger sind.
Breitere Implikationen
Während sich die Methoden zur Protein-Engineering weiterentwickeln, stehen viele Möglichkeiten bevor. Diese Fortschritte können zu neuen Behandlungen in der Medizin, verbesserten industriellen Prozessen und innovativen Lösungen für komplexe biologische Probleme führen.
Innovation annehmen
Der Erfolg in Projekten wie der Engineering des NucB zeigt, wie wichtig es ist, Technologie mit biologischer Forschung zu integrieren. Eine fortgesetzte Zusammenarbeit zwischen Disziplinen wird entscheidend sein, um das volle Potenzial der Protein-Engineering zu erschliessen.
Diese vereinfachte Übersicht fasst die wesentlichen Punkte über Protein-Engineering, die Vorteile des maschinellen Lernens in diesem Bereich und die vielversprechenden Ergebnisse aus aktuellen Studien zusammen. Dieser Fortschritt in der Wissenschaft öffnet Türen für verschiedene Anwendungen, die die Lebensqualität verbessern und reale Herausforderungen angehen können.
Titel: Engineering of highly active and diverse nuclease enzymes by combining machine learning and ultra-high-throughput screening
Zusammenfassung: Optimizing enzymes to function in novel chemical environments is a central goal of synthetic biology, but optimization is often hindered by a rugged, expansive protein search space and costly experiments. In this work, we present TeleProt, an ML framework that blends evolutionary and experimental data to design diverse protein variant libraries, and employ it to improve the catalytic activity of a nuclease enzyme that degrades biofilms that accumulate on chronic wounds. After multiple rounds of high-throughput experiments using both TeleProt and standard directed evolution (DE) approaches in parallel, we find that our approach found a significantly better top-performing enzyme variant than DE, had a better hit rate at finding diverse, high-activity variants, and was even able to design a high-performance initial library using no prior experimental data. We have released a dataset of 55K nuclease variants, one of the most extensive genotype-phenotype enzyme activity landscapes to date, to drive further progress in ML-guided design.
Autoren: Neil Thomas, D. Belanger, C. Xu, H. Lee, K. Hirano, K. Iwai, V. Polic, K. D. Nyberg, K. G. Hoff, L. Frenz, C. A. Emrich, J. W. Kim, M. Chavarha, A. Ramanan, J. J. Agresti, L. J. Colwell
Letzte Aktualisierung: 2024-06-05 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.03.21.585615
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.03.21.585615.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.