Fortschrittliche mikrobielle Sequenzierung mit CycloneSEQ
Eine neue Plattform verbessert das Langmessen von Sequenzen für die mikrobielle Genomforschung.
― 6 min Lesedauer
Inhaltsverzeichnis
- Kurzlesesequenzierung
- Herausforderungen bei der Kurzlesesequenzierung
- Langlesesequenzierung
- Die Bedeutung vollständiger Genome
- Einführung von CycloneSEQ
- Bewertung der CycloneSEQ-Leistung
- Methodologie
- Ergebnisse der Assemblierung
- Weitere Evaluierung der Assembly-Leistung
- Die Rolle des Datenvolumens
- Bedeutung der Genauigkeit
- Metagenomische Sequenzierung
- Fazit
- Zukünftige Richtungen
- Originalquelle
Mikrobielle Sequenzierung ist eine Methode, um das genetische Material von Mikroorganismen zu identifizieren und zu analysieren. Dieser Prozess hilft Wissenschaftlern zu verstehen, welche Rolle diese Organismen in verschiedenen Umgebungen spielen, wie Boden, Ozean und im menschlichen Körper. Es gibt mehrere Technologien zur Sequenzierung von Mikroben, aber zwei wichtige Methoden sind Kurzlese- und Langlesesequenzierung.
Kurzlesesequenzierung
Die Kurzlesesequenzierung ist eine beliebte Methode zur Analyse der mikrobiellen DNA. Sie ist bekannt dafür, kostengünstig und sehr genau zu sein. Diese Art der Sequenzierung produziert kurze DNA-Stücke, die als Reads bezeichnet werden und unterschiedlich lang sein können. Obwohl die Kurzlesesequenzierung viele Entwurfsgenome erstellt hat, sind diese Genome oft in mehrere Abschnitte, die Contigs genannt werden, fragmentiert. Diese Fragmentierung macht es schwierig zu verstehen, wie ein bestimmter Mikroba funktioniert, da wichtige Teile seiner genetischen Information fehlen könnten. Trotz dieser Einschränkungen wurde die Kurzlesesequenzierung in vielen Studien zur mikrobiellen Vielfalt weit verbreitet.
Herausforderungen bei der Kurzlesesequenzierung
Eine grosse Herausforderung bei der Kurzlesesequenzierung ist, dass sie typischerweise zu unvollständigen Genomen führt. Das bedeutet, dass Forscher, wenn sie versuchen, den genetischen Code eines Mikroben zusammenzusetzen, oft auf viele Lücken stossen. Diese Lücken nur mit Kurzlesungen zu füllen, kann sehr schwierig sein, was die Fähigkeit der Forscher einschränkt, das vollständige genetische Profil der untersuchten Mikroorganismen zu verstehen.
Langlesesequenzierung
Um die Herausforderungen der Kurzlesesequenzierung anzugehen, haben Wissenschaftler die Langlesesequenzierung entwickelt. Diese Methode gibt es seit fast zwei Jahrzehnten und ermöglicht es Forschern, längere DNA-Stücke zu erfassen. Die Langlesesequenzierung kann die Vollständigkeit eines Genoms erheblich verbessern und die Anzahl der kreisförmigen Genome erhöhen, die zusammengefügt werden können. Allerdings ist die Langlesesequenzierung in der Regel teurer als die Kurzlesesequenzierung, was ihre Nutzung, insbesondere in grossangelegten Studien, einschränken kann.
Die Bedeutung vollständiger Genome
Vollständige bakterielle Genome sind aus mehreren Gründen entscheidend. Sie geben wertvolle Einblicke, wie Mikroorganismen mit ihrer Umgebung interagieren, tragen zur Entdeckung neuer Gene bei und verbessern unser Verständnis der mikrobiellen Evolution. Vollständige Genome können auch funktionelle Genkodierungen aufzeigen und Wissenschaftlern helfen, wie diese Mikroben in Biotechnologie oder Medizin genutzt werden könnten.
Einführung von CycloneSEQ
Um die Langlesesequenzierung voranzutreiben, wurde eine neue Plattform namens CycloneSEQ entwickelt. Diese innovative Plattform nutzt Nanopore-Technologie zur Durchführung von Langlesesequenzierungen. Obwohl CycloneSEQ grosses Potenzial bei der Sequenzierung einzelner bakterieller Genome gezeigt hat, wurde die umfassende Bewertung ihrer Leistung bei verschiedenen mikrobiellen Arten nicht ausführlich durchgeführt.
Bewertung der CycloneSEQ-Leistung
In einer aktuellen Studie wollten Forscher bewerten, wie gut CycloneSEQ für die Sequenzierung von Mikroben funktioniert. Sie verglichen Daten, die mit CycloneSEQ generiert wurden, mit Daten der etablierten DNBSEQ-Kurzlesesequenzierungsmethode. Durch die Kombination beider Datentypen in einer hybriden Assemblierung wollten die Forscher herausfinden, ob sie vollständige kreisförmige Genome effektiver zusammenstellen konnten.
Methodologie
Die Forscher konzentrierten sich auf einen bestimmten Bakterienstamm namens Akkermansia muciniphila und führten detaillierte Sequenzierungen mit sowohl CycloneSEQ als auch DNBSEQ durch. Sie sammelten eine beträchtliche Menge an Sequenzierungsdaten, wobei die langen Reads im Durchschnitt 11.659,2 Basenpaare und die kurzen Reads im Durchschnitt 99,9 Basenpaare betrugen. Die Qualität der Reads wurde ebenfalls bewertet, um die Genauigkeit sicherzustellen.
Ergebnisse der Assemblierung
Als die Daten analysiert wurden, zeigten die Ergebnisse einen bemerkenswerten Unterschied in den Assembly-Ergebnissen. Die Assemblierungen, die nur auf Kurzlesedaten basierten, führten zu vielen fragmentierten Abschnitten, während Assemblierungen mit langen Reads oder einer Kombination beider mehr vollständige kreisförmige Genome produzierten. Die Forscher bemerkten auch, dass die Kombination von Kurz- und Langlesesequenzierung die Genauigkeit der zusammengebauten Genome verbesserte.
Weitere Evaluierung der Assembly-Leistung
Um ihr Verständnis zu vertiefen, testeten die Forscher die Leistung von CycloneSEQ an zehn verschiedenen Stämmen aus verschiedenen bakteriellen Arten. Sie fanden heraus, dass hybride Assemblierungen konsistent kreisförmige Genome produzierten, was die Wirksamkeit der Kombination aus langen und kurzen Reads demonstriert. In vielen Fällen führte der hybride Assemblierungsansatz zu einer signifikanten Erhöhung der Anzahl der kodierenden Sequenzen, ribosomalen RNA- und Transfer-RNA-Gene im Vergleich zu Entwurfsassemblierungen, die nur mit Kurzreads erstellt wurden.
Die Rolle des Datenvolumens
Die Menge der verwendeten Sequenzierungsdaten spielte ebenfalls eine entscheidende Rolle für den Erfolg des Assemblierungsprozesses. Die Forscher reduzierten systematisch die Menge an Kurzlesedaten, während sie verschiedene Kombinationen von Langlesedaten testeten. Sie fanden heraus, dass die Verwendung von mindestens 1000 Mbp Kurzlesedaten in Kombination mit mindestens 100 Mbp Langlesedaten die Wahrscheinlichkeit erheblich erhöhte, vollständige Genomassemblierungen zu erreichen.
Bedeutung der Genauigkeit
Genauigkeit bei der genomischen Assemblierung ist entscheidend für zuverlässige Ergebnisse. Die Studie zeigte, dass selbst wenn die Kurzlesedaten reduziert wurden, die hohe Genauigkeit erhalten blieb, solange genügend Daten bereitgestellt wurden. Allerdings führte eine Verringerung der Menge an Kurzlesedaten zu mehr Fehlern in den zusammengebauten Genomen. Das zeigt, dass ein sorgfältiges Gleichgewicht zwischen den beiden Sequenzierungsmethoden notwendig ist, um hochwertige Ergebnisse zu erzielen.
Metagenomische Sequenzierung
Ein weiteres Interessengebiet in der mikrobiellen Forschung ist die Metagenomik, die das genetische Material untersucht, das direkt aus Umweltproben gewonnen wird. Die Forscher bewerteten die Leistung von CycloneSEQ bei der Assemblierung gemischter mikrobieller Gemeinschaften und verwendeten eine Standard-Gut-Mikrobiomprobe. Dies half zu beurteilen, wie gut hybride Assemblierungsmethoden die Vielfalt des mikrobiellen Lebens in komplexen Umgebungen erfassen konnten.
Fazit
Die Studie hebt die Stärken der CycloneSEQ-Plattform hervor und ihr Potenzial zur Verbesserung der mikrobiellen genomischen Forschung. Durch die Kombination von Kurzlesedaten von DNBSEQ mit Langlesedaten von CycloneSEQ haben die Forscher eine effektivere Methode entwickelt, um vollständige und genaue Genome zusammenzustellen. Dieser Ansatz verbessert nicht nur unser Verständnis mikrobieller Funktionen, sondern eröffnet auch neue Möglichkeiten, die vielfältige Welt der Mikroorganismen zu erforschen.
Zukünftige Richtungen
In Zukunft ist es wichtig, dass die Forscher umfangreichere Tests durchführen, darunter verschiedene reale Proben, um diese Ergebnisse weiter zu validieren. Indem sie das Gleichgewicht zwischen Kurzlesedaten und Langlesedaten optimieren, wächst das Potenzial, die Qualität und Effizienz der Assemblierung in mikrobiellen Studien zu verbessern. Die CycloneSEQ-Plattform könnte eine bedeutende Rolle bei der Förderung der metagenomischen Forschung und der Erweiterung unseres Wissens über Mikroorganismen spielen.
Titel: Efficiently Constructing Complete Genomes with CycloneSEQ to Fill Gaps in Bacterial Draft Assemblies
Zusammenfassung: BackgroundCurrent microbial sequencing relies on short-read platforms like Illumina and DNBSEQ, favored for their low cost and high accuracy. However, these methods often produce fragmented draft genomes, hindering comprehensive bacterial function analysis. CycloneSEQ, a novel long-read sequencing platform developed by BGI-Research, its sequencing performance and assembly improvements has been evaluated. FindingsUsing CycloneSEQ long-read sequencing, the type strain produced long reads with an average length of 11.6 kbp and an average quality score of 14.4. After hybrid assembly with short reads data, the assembled genome exhibited an error rate of only 0.04 mismatches and 0.08 indels per 100 kbp compared to the reference genome. This method was validated across 9 diverse species, successfully assembling complete circular genomes. Hybrid assembly significantly enhances genome completeness by using long reads to fill gaps and accurately assemble multi-copy rRNA genes, which unable be achieved by short reads solely. Through data subsampling, we found that over 500 Mbp of short-read data combined with 100 Mbp of long-read data can result in a high-quality circular assembly. Additionally, using CycloneSEQ long reads effectively improves the assembly of circular complete genomes from mixed microbial communities. ConclusionsCycloneSEQs read length is sufficient for circular bacterial genomes, but its base quality needs improvement. Integrating DNBSEQ short reads improved accuracy, resulting in complete and accurate assemblies. This efficient approach can be widely applied in microbial sequencing.
Autoren: Liang Xiao, H. Liang, M. Wang, T. Hu, H. Wang, W. He, Y. Ju, R. Guo, J. Chen, F. Guo, T. Zeng, Y. Dong, B. Wang, C. Liu, X. Jin, W. Zhang, Y. Zou, X. Xu
Letzte Aktualisierung: 2024-09-07 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.09.05.611410
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.09.05.611410.full.pdf
Lizenz: https://creativecommons.org/licenses/by-nc/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.