Neue Erkenntnisse über Mikroben und ihren Sauerstoffverbrauch
Studie zeigt genetische Unterschiede bei Mikroben je nach Sauerstoffbedarf.
― 6 min Lesedauer
Inhaltsverzeichnis
- Unterschiede zwischen Aeroben und Anaeroben
- Die Herausforderungen bei der Klassifizierung der mikrobiellen Sauerstoffnutzung
- Ein neuer Ansatz zur Klassifizierung
- Verarbeitung von Genomen zur Klassifizierung
- Vergleich von Vorhersagemethoden
- Die Beziehung zwischen Sauerstoff und mikrobiellen Gemeinschaften
- Der chemische Zusammenhang
- Ein neues Hilfsmittel für das Umweltmonitoring
- Fazit
- Originalquelle
Sauerstoff ist ein wichtiges Molekül für das Leben auf der Erde. Es ist entscheidend für einen Prozess namens aerobe Atmung, der es Organismen ermöglicht, Energie zu produzieren. Die meisten Lebewesen, von Menschen bis zu winzigen Mikroben, sind auf diesen Prozess angewiesen. Sauerstoff ist aber auch sehr reaktiv, was bedeutet, dass er schädlich für einige Organismen sein kann. Während einige Mikroben Sauerstoff zum Wachsen brauchen (man nennt sie Aerobe), gedeihen andere ohne ihn (die nennt man Anaerobe). Interessanterweise haben viele Mikroben, egal ob sie Sauerstoff nutzen oder nicht, Enzyme, die mit Sauerstoff interagieren. Das stellt Wissenschaftler vor Herausforderungen, wenn sie herausfinden wollen, welche Organismen Sauerstoff brauchen, nur basierend auf genetischen Informationen.
Unterschiede zwischen Aeroben und Anaeroben
Aerobe und Anaerobe haben wichtige Unterschiede, die man in ihrem genetischen Aufbau sehen kann, auch wenn diese Unterschiede subtil sind. Aerobe haben normalerweise grössere Genome und besitzen mehr Enzyme, die Sauerstoff nutzen. Viele Aerobe gehören zu bestimmten Gruppen im Stammbaum des Lebens, während Anaerobe verschiedene Gärungsmethoden nutzen, um Energie in niedrigen oder fehlenden Sauerstoffbedingungen zu erzeugen. Diese genetischen Unterschiede können Forschern helfen, vorherzusagen, wie Organismen Sauerstoff nutzen, aber das erfordert oft eine Menge detaillierter Analysen.
Die Herausforderungen bei der Klassifizierung der mikrobiellen Sauerstoffnutzung
Normalerweise umfasst die Klassifizierung, wie Mikroben Sauerstoff nutzen, umfangreiche Prozesse. Das bedeutet, die Enzyme, die sie verwenden, durch Vergleiche mit anderen bekannten Sequenzen zu identifizieren oder komplette Stoffwechselwege basierend auf diesen Vergleichen zu rekonstruieren. Beide Methoden können kostspielig sein und hängen davon ab, wie viel wir über Genfunktionen wissen. Das führt zu der Frage: Können wir Mikroben basierend auf ihren genetischen Sequenzen klassifizieren, ohne all die detaillierten Schritte durchzugehen?
Ein neuer Ansatz zur Klassifizierung
Um dieses Problem anzugehen, haben Forscher eine Methode in Betracht gezogen, die DNA- und Proteinsequenzen direkt nutzt, um Mikroben basierend auf ihrer Sauerstoffnutzung zu kategorisieren. Sie konzentrierten sich auf drei Kategorien: obligate Aerobe (die Sauerstoff brauchen), obligate Anaerobe (die keinen brauchen) und fakultative Aerobe (die mit oder ohne Sauerstoff leben können). Da es begrenzte Daten gibt, überprüfen Forscher normalerweise die Genauigkeit durch eine Methode namens Kreuzvalidierung. Dabei werden wiederholt kleine Teile der Daten verwendet, um Modelle zu trainieren und deren Leistung zu testen.
In dieser Studie wurde ein gründlicherer Ansatz gewählt, bei dem etwa 3300 Genome mit bekannter Sauerstoffnutzung genutzt wurden, um Klassifizierer zu trainieren, und ein unabhängiger Datensatz zur Bewertung ihrer Genauigkeit verwendet wurde.
Verarbeitung von Genomen zur Klassifizierung
Es gibt verschiedene Möglichkeiten, Genomdaten zur Klassifizierung zu verarbeiten. Ein standardmässiger Ansatz beginnt oft damit, die protein-codierenden Teile des Genoms zu identifizieren und dann vergleichende Methoden zu verwenden, um Genfunktionen zu bestimmen. Das kann lange dauern und umfasst viele Schritte. Im Gegensatz dazu können schnellere Methoden angewendet werden, die sich auf das Zählen kurzer Sequenzen namens K-Mers konzentrieren, die kleine Strings von DNA- oder Proteinsequenzen einer bestimmten Länge sind. Einige fortgeschrittene Techniken nutzen maschinelles Lernen, um Proteinsequenzen in feste Dimensionen zu summarieren, um Klassifizierer zu trainieren.
Vergleich von Vorhersagemethoden
Als die Forscher verschiedene Methoden zur Vorhersage, wie Mikroben Sauerstoff nutzen, bewerteten, fanden sie heraus, dass die besten Modelle umfangreiche Genomanmerkungen beinhalteten. Diese Methode erreichte etwa 74 % Genauigkeit bei der Vorhersage der Sauerstoffnutzung. Einige einfachere Modelle, die sich nur auf das Zählen von Aminosäuretriplets stützten, schnitten ebenfalls gut ab und erreichten etwa 70 % Genauigkeit.
Das Zählen von Aminosäuretriplets ist viel schneller, als Genome gründlich zu verarbeiten, was es den Forschern erlaubte, eine grosse Anzahl von Genomen aus Umweltnahmeproben zu analysieren. Sie erwarteten, dass Umgebungen, die für niedrige Sauerstofflevel bekannt sind, eine höhere Anzahl von anaeroben Organismen zeigen würden, und diese Erwartung wurde bestätigt.
Die Beziehung zwischen Sauerstoff und mikrobiellen Gemeinschaften
Forschungen zeigten, dass Sauerstoff die genetische Zusammensetzung mikrobieller Gemeinschaften in verschiedenen Umgebungen erheblich prägt. Proben aus Gebieten mit niedrigem Sauerstoff, wie den Därmen bestimmter Tiere oder anaeroben Zersetzern, wiesen einen hohen Anteil an anaeroben Mikroben auf. Im Gegensatz dazu hatten Umgebungen mit mehr Sauerstoff, wie Süsswasserseen, hauptsächlich aerobe Mikroben.
Eine spezifische Fallstudie betrachtete das Schwarze Meer, ein gut untersuchtes Gebiet, das für seine geschichtete Wasserstruktur und den Sauerstoffgradienten bekannt ist. Die Forscher beobachteten Veränderungen sowohl bei Sauerstoff- als auch bei Wasserstoffsulfidwerten in unterschiedlichen Tiefen. Mit ihren Modellen fanden sie heraus, dass aerobe Mikroben in der Nähe der Oberfläche, wo die Sauerstoffwerte höher waren, häufiger vorkamen, während Anaerobe in tieferen, anoxischen Gewässern dominierten.
Der chemische Zusammenhang
Forscher untersuchten weiter, wie lokale chemische Bedingungen, insbesondere Sauerstofflevel, mit der Häufigkeit von aeroben und anaeroben Organismen korrelierten. Im Schwarzen Meer korrelierte das Verhältnis von Sauerstoff zu Wasserstoffsulfid stark mit dem vorhergesagten Verhältnis von aeroben zu anaeroben Mikroben. Das deutete darauf hin, dass durch das Studium der DNA-Sequenzen in diesen Umgebungen Wissenschaftler wichtige chemische Konzentrationen, wie Sauerstofflevel, schätzen könnten.
Ein neues Hilfsmittel für das Umweltmonitoring
Die Ergebnisse dieser Forschung implizieren, dass die Sequenzierung von DNA als praktisches Werkzeug für die Überwachung verschiedener chemischer Bedingungen in natürlichen Umgebungen dienen könnte. Traditionelle Methoden zur Untersuchung der Umweltchemie sind oft herausfordernd und kostspielig. Allerdings könnte die genetische Analyse eine skalierbare Lösung bieten, um die Chemie von Ökosystemen besser zu verstehen und zu verfolgen.
Die Forscher sind begeistert von dem Potenzial dieses Ansatzes. Durch den Einsatz schneller DNA-Sequenzierungsmethoden können sie wichtige Einblicke in die natürliche Welt und in die Interaktionen von Mikroorganismen mit ihrer Umgebung bieten.
Fazit
Zusammenfassend spielt Sauerstoff eine entscheidende Rolle im Überleben vieler Organismen. Diese Studie hebt die Unterschiede zwischen Aeroben und Anaeroben hervor und betont die Bedeutung, ihre Sauerstoffbedürfnisse zu verstehen. Die Forscher entdecken, dass einfachere Methoden, die sich auf die Analyse genetischer Sequenzen konzentrieren, anstatt auf detaillierte Anmerkungen zu setzen, genauso effektiv sein können, um vorherzusagen, wie Organismen Sauerstoff nutzen. Das Potenzial, DNA-Sequenzierung zur Überwachung von Umweltbedingungen zu nutzen, stellt einen spannenden Fortschritt in diesem Forschungsfeld dar.
Während die Wissenschaftler weiterhin diese Methoden verfeinern, könnten sie weitere Geheimnisse des mikrobielle Lebens entschlüsseln und neue Strategien zur Verwaltung und zum Schutz unserer natürlichen Ökosysteme entwickeln.
Titel: Annotation-free prediction of microbial dioxygen utilization
Zusammenfassung: Aerobes require dioxygen (O2) to grow; anaerobes do not. But nearly all microbes -- aerobes, anaerobes, and facultative organisms alike -- express enzymes whose substrates include O2, if only for detoxification. This presents a challenge when trying to assess which organisms are aerobic from genomic data alone. This challenge can be overcome by noting that O2 utilization has wide-ranging effects on microbes: aerobes typically have larger genomes, encode more O2-utilizing enzymes, and tend to use different amino acids in their proteins. Here we show that these effects permit high-quality prediction of O2 utilization from genome sequences, with several models displaying >70% balanced accuracy on a ternary classification task wherein blind guessing is only 33.3% accurate. Since genome annotation is compute-intensive and relies on many assumptions, we asked if annotation-free methods also perform well. We discovered that simple and efficient models based entirely on genome sequence content -- e.g. triplets of amino acids -- perform about as well as intensive annotation-based algorithms, enabling the rapid processing of global-scale sequence data to predict aerobic physiology. To demonstrate the utility of efficient physiological predictions we estimated the prevalence of aerobes and anaerobes along a well-studied O2 gradient in the Black Sea, finding strong quantitative correspondence between local chemistry (O2:sulfide concentration ratio) and the composition of microbial communities. We therefore suggest that statistical methods like ours can be used to estimate, or "sense," pivotal features of the environment from DNA sequencing data. ImportanceWe now have access to sequence data from a wide variety of natural environments. These data document a bewildering diversity of microbes, many known only from their genomes. Physiology -- an organisms capacity to engage metabolically with its environment -- may provide a more useful lens than taxonomy for understanding microbial communities. As an example of this broader principle, we developed algorithms that accurately predict microbial dioxygen utilization directly from genome sequences without first annotating genes, e.g. by considering only the amino acids in protein sequences. Annotation-free algorithms enabled rapid characterization of natural samples, demonstrating a quantitative correspondence between sequences and local O2 levels. These results suggest that DNA sequencing can be repurposed as a multi-pronged chemical sensor, estimating concentrations of O2 and other key facets of complex natural settings.
Autoren: Dianne K. Newman, A. I. Flamholz, J. E. Goldford, E. M. Larsson, A. Jinich, W. W. Fischer
Letzte Aktualisierung: 2024-01-16 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.01.16.575888
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.01.16.575888.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.