Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Biologie# Synthetische Biologie

Fortschrittliche Proteinproduktion mit KI und zellfreien Systemen

Eine Studie zeigt, wie KI den Proteinertrag in zellfreien Systemen verbessert.

― 7 min Lesedauer


KI steigert die AusbeuteKI steigert die Ausbeutean zellfreier ProteinenLaboren.Effizienz der Proteinproduktion inKI-gesteuerte Methoden steigern die
Inhaltsverzeichnis

Proteine erledigen viele wichtige Aufgaben in lebenden Zellen. Sie helfen bei Funktionen, die mit Gesundheit, Umwelt, Energie und Essen zu tun haben. In den letzten zwanzig Jahren haben Wissenschaftler Wege entwickelt, um lebende Zellen so zu verändern, dass sie bestimmte Proteine herstellen können. Dieser Prozess wird synthetische Biologie genannt. Allerdings kann die Modifikation von Zellen schwierig sein, da die Zellen dabei beschädigt werden können.

Um diese Probleme zu umgehen, haben Forscher Zellfreie Systeme entwickelt. Diese Systeme nutzen nur die Teile der Zelle, die nötig sind, um Proteine herzustellen, ohne dass die ganze Zelle lebendig ist. Das ist eine beliebte Methode geworden, und viele verschiedene Produkte können jetzt mit diesen Systemen hergestellt werden. Obwohl diese zellfreien Systeme es Wissenschaftlern erleichtern, Proteine zu erzeugen, gibt es immer noch einige Herausforderungen, um sie in Labors weit verbreitet zu nutzen.

Der Aufstieg zellfreier Systeme

Zellfreie Proteinsynthese (CFPS) Systeme sind mittlerweile gängige Plattformen zur Herstellung von Proteinen. Diese Systeme unterstützen die Produktion nicht nur einer breiten Palette von Proteinen, sondern auch einiger, die spezifische biologische Aktivitäten haben. Da immer mehr Firmen zellfreie Produkte und Materialien anbieten, wird es für Labors einfacher, diese Systeme zu übernehmen. Um sie jedoch zugänglicher zu machen, brauchen Wissenschaftler bessere Werkzeuge, um alles zu vereinfachen und zu automatisieren, wie zum Beispiel zu messen, wie viel Protein produziert wird, und herauszufinden, wie man die richtigen Zutaten mischt.

In den letzten zehn Jahren haben Wissenschaftler viele Schritte in der synthetischen Biologie automatisiert. Eine weltweite Gruppe, die Global Biofoundries Alliance, wurde gegründet, um die akademische Forschung in diesem Bereich zu unterstützen. Eine Biofoundry ist eine Forschungseinrichtung, die Wissenschaftlern hilft, ihre Projekte mithilfe fortschrittlicher Technologie zu beschleunigen. Sie erleichtern den Prozess der Entwicklung neuer Methoden in der synthetischen Biologie und machen ihn schneller. Forscher nutzen Zyklen von Design, Bau, Test und Lernen, um verschiedene genetische Setups zu bewerten und ihre Experimente zu verbessern.

Die Rolle der Automatisierung

In letzter Zeit haben die meisten Biofoundries ihre Automatisierung in den Bau- und Testphasen verbessert. Viele Firmen bieten mittlerweile integrierte Lösungen an, um verschiedene Schritte im Prozess über automatisierte Systeme abzuwickeln, was Experimente reibungsloser macht. Allerdings fehlt es bei der Automatisierung dieser Werkzeuge noch. Das bedeutet, dass Wissenschaftler oft Daten manuell von einem Werkzeug ins andere umwandeln müssen. Ausserdem verwenden nur wenige Biofoundries maschinelles Lernen, um ihre Prozesse zu optimieren.

Eine weitere Herausforderung bei der Einrichtung effektiver zellfreier Systeme ist die richtige Kombination der verschiedenen beteiligten Komponenten zu finden. Das erfordert umfassendes Wissen über die zellfreien Systeme und die einzelnen Komponenten, was auch zeitaufwendig und teuer sein kann. Da die zellfreie Technologie noch relativ neu ist, gibt es nur begrenzte öffentlich zugängliche Daten. Die Aktivität der Komponenten kann variieren, sodass Forscher oft Optimierungen für jedes spezifische System und das Protein, das sie herstellen möchten, durchführen müssen.

Um diese Herausforderungen zu überwinden, haben Wissenschaftler Methoden des maschinellen Lernens angepasst, die sich auf Aktives Lernen (AL) konzentrieren, um effizient die beste Kombination von Komponenten zu finden. Einfach gesagt, hilft aktives Lernen dabei, die nützlichsten Experimente auszuwählen, sodass Forscher mit weniger Tests bessere Ergebnisse erzielen können.

Die Kraft des maschinellen Lernens

Grosse Sprachmodelle (LLMs) haben verändert, wie wir mit Technologie interagieren, und haben grosses Potenzial gezeigt, die Code-Erstellung zu automatisieren. Diese Modelle, die in der Lage sind, menschliche Sprache zu verstehen und zu generieren, können bei Programmieraufgaben und sogar bei der Analyse bestehenden Codes helfen. Zu den Aufgaben, bei denen LLMs helfen können, gehören die Planung von Experimenten, das Durchsuchen von Dokumentationen, das Steuern von Geräten und das Lösen komplexer Probleme.

In dieser Studie haben wir einen neuen automatisierten Workflow verwendet, um die Produktion von Proteinen in einem zellfreien System zu verbessern. Dieser automatisierte Prozess war erfolgreich bei der Steigerung der Produktion von zwei antimikrobiellen Proteinen, Colicin-M und Colicin-E1. Der Code für diesen Prozess wurde komplett von ChatGPT-4, einem grossen Sprachmodell, mit einer neuen aktiven Lernmethode geschrieben, die half, die Proteinproduktion zu steigern.

Aufbau des Workflows

Der Workflow beginnt mit der Suche nach den besten Kombinationen von Komponenten für die Proteinerzeugung. Der erste Schritt besteht darin, die maximalen Volumina für jede Zutat anzugeben, und von dort aus erzeugt das System ein erstes Set von Kombinationen zum Testen. Wissenschaftler bereiten die Proben basierend auf den generierten Rezepten vor, und die Ergebnisse werden analysiert, um die nächste Testrunde anzupassen und zu verbessern.

Das System besteht aus mehreren Modulen, die in einer aktiven Lernschleife zusammenarbeiten. Jedes Modul hat eine spezifische Funktion. Das Sampling-Modul erstellt eine Vielzahl von Kombinationen zum Testen. Das Design-Modul organisiert diese Kombinationen in ein Format, das in den Experimenten verwendet werden kann. Das Anweisungsmodul übersetzt diese Informationen in Befehle, die mit Flüssigkeitshandhabungsrobotern arbeiten. Das Experiment-Modul führt tatsächlich die Tests durch und misst die Ergebnisse. Schliesslich analysiert das Lernmodul die Daten, um neue Experimente und Anpassungen vorzuschlagen.

Verbesserung der Proteinproduktion

In unserer Studie konzentrierten wir uns darauf, die Produktion von Colicinen M und E1 zu optimieren. Diese Proteine sind wichtig für die Entwicklung neuer Behandlungen gegen antibiotikaresistente Bakterien. Wir verwendeten ein zellfreies System auf Basis von E. coli, das eine schnelle und effiziente Proteinerzeugung ermöglicht.

Zu Beginn bestimmten wir die richtige Mischung der notwendigen Komponenten, einschliesslich Energiequellen, Puffern und genetischem Material. Wir führten mehrere Tests durch und variierten die Konzentrationen jeder Komponente, während wir andere konstant hielten. Durch die Analyse der Ergebnisse konnten wir die besten Bedingungen zur Maximierung der Proteinproduktion identifizieren.

Automatisierte Experimente

Nach der Vorbereitung der ersten Testmischungen nutzten wir den automatisierten Workflow, um unsere Experimente durchzuführen. Wir überwachten sorgfältig die Fluoreszenz, die von den Proteinen produziert wurde, was ein direkter Indikator für ihre Mengen ist. Die Experimente fanden über 24 Stunden statt, und wir fanden heraus, dass unsere optimierten Rezepte zu signifikanten Steigerungen der Proteinmenge führten. Konkret erzielten wir einen neunfachen Anstieg der Colicin M-Produktion und einen dreifachen Anstieg der Colicin E1-Produktion im Vergleich zu den Standardbedingungen.

Als wir fortschritten, durchliefen wir die aktiven Lernschleifen und passten die Mischungen basierend auf den vorherigen Ergebnissen an. Jede Testrunde brachte uns näher daran, die optimale Kombination von Zutaten zu finden. Der Einsatz von KI in diesem Prozess rationalisierte die Experimente und reduzierte die Zeit, die benötigt wurde, um gute Ergebnisse zu erzielen.

Das Lernmodul

Das Lernmodul spielte eine entscheidende Rolle im Workflow. Dieses Modul analysierte die Daten aus jeder Runde von Experimenten und gab Vorschläge für neue Mischungen, die ausprobiert werden könnten. Es ermöglichte dem System, aus vergangenen Leistungen zu lernen, was einen informierteren und effizienteren Ansatz für zukünftige Tests ermöglichte.

Wir verwendeten die Cluster-Margin-Methode innerhalb des aktiven Lernrahmens, um sicherzustellen, dass wir eine vielfältige Auswahl von Proben zum Testen auswählten. Das war wichtig, weil es half, mehr Boden in unserer Suche nach der idealen Mischung abzudecken und Redundanz zu vermeiden. Durch das ausgewogene Erkunden neuer Kombinationen und das Ausnutzen vielversprechender konnte wir sowohl unsere Effizienz als auch unsere Erfolgsquote maximieren.

Fazit

Wir haben gezeigt, wie die Nutzung von KI, insbesondere grossen Sprachmodellen, die Automatisierung und Optimierung der Proteinproduktion in zellfreien Systemen erheblich verbessern kann. Durch die Schaffung eines strukturierten Workflows, der aktives Lernen einsetzt, konnten wir die Ausbeute von zwei wichtigen antimikrobiellen Proteinen erheblich steigern.

Der Erfolg dieses Projekts zeigt das Potenzial der Integration von KI-Tools in die biologische Forschung und Experimente. Auch wenn wir bemerkenswerte Verbesserungen in der Ausbeute erzielt haben, gibt es noch Herausforderungen zu bewältigen, wie z.B. die Sicherstellung der Konsistenz der Ergebnisse und die weitere Automatisierung des Prozesses.

Mit dem fortschreitenden technologischen Fortschritt erwarten wir noch effizientere und robustere Systeme zur Proteinproduktion und in anderen Anwendungen der Biotechnologie. Mit fortlaufender Entwicklung und Forschung könnte die Integration von KI in biologische Experimente zu schnelleren Entdeckungen und Innovationen in mehreren Bereichen führen.

Originalquelle

Titel: Operate a Cell-Free Biofoundry using Large Language Models

Zusammenfassung: In this paper, we present a novel approach to optimizing cell-free protein synthesis (CFPS) systems using artificial intelligence (AI), specifically leveraging ChatGPT-4 for code generation and active learning (AL). This study aims to automate and enhance the process of producing antimicrobial proteins, namely colicin M and colicin E1, in CFPS systems. We developed an automated workflow that employs an iterative Design-Build-Test-Learn (DBTL) cycle, integrating a newly implemented AL method with cluster margin (CM) selection to efficiently explore experimental conditions. The workflow components, including modules for sampling, plate design, instruction generation, and data analysis, were coded using ChatGPT-4 without further human modification. By employing this automated approach, significant improvements in protein yields were achieved, with a 9-fold increase for colicin M and a 3-fold increase for colicin E1 compared to standard buffer compositions. The use of LLMs in conjunction with AL demonstrated the potential of AI-driven methodologies to accelerate the optimization of complex biological processes and reduce manual intervention. The study also discusses limitations such as variability in CFPS and suggests future improvements in automation, reproducibility, and integration of diverse liquid handling systems to further enhance the scalability and efficiency of cell-free biofoundries.

Autoren: Jean-Loup Faulon, J. Herisson, N. A. Hoang, A. El Sawah, M. Mahdy Khalil

Letzte Aktualisierung: 2024-10-28 00:00:00

Sprache: English

Quell-URL: https://www.biorxiv.org/content/10.1101/2024.10.28.619828

Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.10.28.619828.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel