Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

Nuovo metodo rivoluziona il rilevamento delle varianti strutturali nei genomi microbici

Rhea propone un modo nuovo di studiare le varianti strutturali nelle comunità microbiche.

― 7 leggere min


Rhea: Un Vero CambiamentoRhea: Un Vero Cambiamentoper i Genomi Microbicivarianti strutturali nei microrganismi.Un metodo potente per identificare
Indice

Le Varianti Strutturali (SV) sono dei cambiamenti nel DNA di un organismo. Questi cambiamenti di solito sono lunghi 10 coppie di basi o più e possono influenzare come i batteri crescono e si adattano. I genomi batterici cambiano nel tempo, il che può influenzare non solo i singoli batteri, ma anche l'intera comunità microbica di cui fanno parte e persino gli organismi che li ospitano.

Quando gli scienziati studiano i singoli genomi batterici, si concentrano nel trovare questi cambiamenti lunghi nel DNA rispetto a un genoma di riferimento standard. Questi cambiamenti possono essere classificati in vari modi: come inserzioni (pezzi aggiunti), cancellazioni (pezzi rimossi), inversioni (pezzi girati), duplicazioni (pezzi ripetuti) o traslocazioni (pezzi spostati). Tuttavia, quando si studiano insieme molti batteri, o metagenomica, le cose si complicano. Questo perché potrebbe non esserci sempre un genoma di riferimento chiaro, e possono esistere molte ceppi simili allo stesso tempo.

Metodi per Rilevare Varianti Strutturali

Ci sono vari metodi per rilevare le varianti strutturali, che possono essere raggruppati in tre tipi principali: approcci basati sulla mappatura, approcci basati sull'assemblaggio e approcci basati sui modelli.

Approcci Basati sulla Mappatura

Nei metodi basati sulla mappatura, le sequenze di DNA (chiamate letture) vengono allineate direttamente a un genoma di riferimento. Il modo in cui queste letture si allineano rivela schemi inaspettati, che possono indicare la presenza di varianti strutturali.

Approcci Basati sull'Assemblaggio

I metodi basati sull'assemblaggio coinvolgono la messa insieme di queste letture in sequenze più lunghe, chiamate contig. Una volta assemblati, questi contig vengono confrontati con un riferimento per trovare eventuali differenze su larga scala.

Approcci Basati sui Modelli

Nei metodi basati sui modelli, i ricercatori cercano schemi specifici definiti in anticipo. Ricercano questi schemi all'interno delle letture di sequenziamento.

Un metodo di mappatura notevole è stato sviluppato per studiare le varianti strutturali nel microbioma intestinale umano. È stato creato un database speciale di microbi noti, e un algoritmo dettagliato è stato impiegato per analizzare le letture di sequenziamento. Questo algoritmo ha aiutato a identificare aree del genoma con copertura inaspettata, che potevano indicare cancellazioni o duplicazioni. Anche se questo metodo si è dimostrato efficace nell'identificare varianti legate a determinate condizioni di salute, dipende pesantemente da un database ben definito di genomi di riferimento, che potrebbe non esistere per tutte le comunità.

Sfide negli Studi Metagenomici

Rilevare varianti strutturali in contesti metagenomici è complicato. Poiché i genomi di riferimento potrebbero non essere noti e molte ceppi simili possono esistere all'interno di una comunità, identificare queste varianti diventa difficile. Di conseguenza, i metodi di rilevamento possono essere limitati e potrebbero non cogliere cambiamenti importanti nei genomi di queste ceppi.

Nuovi Approcci per la Rilevazione delle Varianti Strutturali

Per affrontare queste sfide, sono stati sviluppati nuovi approcci per migliorare la rilevazione delle varianti strutturali. Uno di questi metodi, chiamato MetaSVs, combina letture di sequenze sia lunghe che corte. Assemblea queste letture per creare e classificare i genomi assemblati da metagenomi (MAG). Questo metodo cerca di rilevare più di semplici cancellazioni e duplicazioni, puntando a scoprire una gamma più ampia di varianti strutturali.

Un altro metodo chiamato MetaCHIP si concentra su eventi recenti di trasferimento genico orizzontale (HGT), dove il materiale genetico viene condiviso tra diversi organismi. Cerca specificamente sequenze geniche che sono più simili ad altri organismi che a se stesse, indicando possibili trasferimenti genici recenti. Tuttavia, è limitato all'identificazione di geni che si abbinano strettamente a quelli trovati in altre ceppi.

Per bypassare completamente la necessità di genomi di riferimento, sono stati creati due metodi basati sui modelli. Il primo, PhaseFinder, punta a rilevare inversioni nei genomi batterici. Il secondo, DIVE, identifica sequenze genetiche che circondano aree di diversità, come elementi genetici mobili. Sebbene promettenti, entrambi questi approcci hanno le loro limitazioni, concentrandosi solo su schemi specifici.

Un Nuovo Approccio: Rhea

Rhea è un nuovo metodo sviluppato per identificare varianti strutturali nelle comunità microbiche senza la necessità di genomi di riferimento o di creazione di MAG. Invece, Rhea utilizza un approccio combinato per analizzare l'intero insieme di sequenze metagenomiche. Crea un grafico di coassemblaggio da tutte le letture e studia come cambia la copertura di queste sequenze nel tempo.

Come Funziona Rhea

Per utilizzare Rhea, i ricercatori prima raccolgono dati metagenomici da campioni nel tempo. Creano un grafico di coassemblaggio che unisce tutte le letture dai campioni, e ogni campione viene poi allineato di nuovo a questo grafico collettivo. Il cambiamento nella copertura tra i campioni viene analizzato per identificare varianti strutturali.

Ad esempio, se una parte del grafico mostra un aumento o una diminuzione significativa nella copertura, potrebbe indicare un'inserzione o una Cancellazione di materiale genetico. In questo modo, Rhea è in grado di rilevare non solo varianti strutturali semplici ma anche variazioni complesse.

Tipi di Varianti Strutturali Rilevate da Rhea

Rhea può identificare diversi tipi di varianti strutturali:

  • Inserzioni: Nuovo materiale genetico aggiunto al genoma esistente.
  • Cancellazioni: Materiale genetico che è stato rimosso.
  • Duplicazioni in Tandem: Una sequenza di DNA che è stata ripetuta in fila.
  • Indel Complessi: Un mix di inserzioni e cancellazioni che si verificano nello stesso luogo.

Rhea rileva queste varianti in base ai cambiamenti nell'abbondanza delle sequenze, consentendo agli scienziati di ottenere informazioni sui vantaggi evolutivi che potrebbero conferire.

Applicazioni negli Studi Reali

Rhea è stata applicata in diversi studi reali per analizzare comunità microbiche in diverse condizioni.

Studio sulla Maturazione della Crosta del Formaggio

In uno studio, Rhea è stata utilizzata per analizzare le comunità microbiche presenti nelle croste del formaggio nel tempo. Esaminando campioni presi in diverse fasi di maturazione, i ricercatori hanno potuto osservare come le popolazioni microbiche cambiavano e si adattavano con l'invecchiamento del formaggio. Il metodo ha rivelato varianti strutturali che si correlavano con i modelli evolutivi dei batteri.

Manti Microbici di Sorgenti Termali

Un'altra applicazione di Rhea è stata nello studio dei manti microbici provenienti da sorgenti termali. I risultati hanno mostrato un numero incredibile di varianti strutturali, con la quantità di complessità che aumentava con i cambiamenti di temperatura. Questi risultati suggeriscono che le comunità microbiche in ambienti così estremi sono altamente dinamiche e potrebbero subire un'evoluzione rapida.

Trasferimento Genico Orizzontale Simulato

Rhea è stata testata anche su dati simulati che coinvolgevano il trasferimento genico orizzontale, dove il materiale genetico viene condiviso tra diversi ceppi di batteri. I risultati di questa simulazione hanno dimostrato l'efficacia di Rhea nell'identificare trasferimenti di geni, mostrando il suo potenziale utilizzo nella comprensione della composizione genetica delle comunità microbiche.

Vantaggi dell'Utilizzo di Rhea

Rhea offre diversi vantaggi rispetto ai metodi tradizionali:

  1. Nessun Bisogno di Genomi di Riferimento: Rhea può operare senza richiedere un genoma di riferimento predefinito, rendendola adattabile a una varietà di comunità microbiche.
  2. Inclusione di Tutte le Letture Sequenziate: Rhea analizza tutte le letture, consentendo una panoramica completa delle variazioni genetiche, particolarmente utile in ambienti di studio con microbi sconosciuti o non caratterizzati.
  3. Rilevazione di Varianti a Bassa Abbondanza: Rhea può rilevare varianti strutturali anche in ceppi a bassa abbondanza, che potrebbero essere trascurati da altri metodi.

Direzioni Future

Sebbene Rhea abbia capacità uniche, c'è anche margine di miglioramento. Le ricerche future potrebbero concentrarsi sull'espansione dei tipi di varianti strutturali che Rhea può rilevare, come inversioni e traslocazioni. Inoltre, potrebbero essere esplorati metodi per migliorare la sensibilità nella rilevazione delle varianti.

La metodologia di Rhea potrebbe anche essere applicata in vari contesti oltre agli studi sul microbioma, inclusi studi comparativi tra diverse comunità.

Conclusione

Rhea rappresenta un significativo avanzamento nello studio della genetica microbica. Offrendo un nuovo modo di rilevare varianti strutturali nei dati metagenomici, apre nuove strade per la ricerca. Questo metodo non solo migliora la nostra comprensione della diversità microbica e dell'evoluzione, ma fornisce anche spunti che potrebbero portare a applicazioni pratiche nella salute, nell'agricoltura e nella scienza ambientale.

Con l'aumento della nostra conoscenza delle comunità microbiche, strumenti come Rhea saranno fondamentali per svelare le complessità di questi ecosistemi e comprendere come interagiscono tra loro e con i loro ambienti.

Fonte originale

Titolo: Reference-free Structural Variant Detection inMicrobiomes via Long-read Coassembly Graphs

Estratto: Bacterial genome dynamics are vital for understanding the mechanisms underlying microbial adaptation, growth, and their broader impact on host phenotype. Structural variants (SVs), genomic alterations of 10 base pairs or more, play a pivotal role in driving evolutionary processes and maintaining genomic heterogeneity within bacterial populations. While SV detection in isolate genomes is relatively straightforward, metagenomes present broader challenges due to absence of clear reference genomes and presence of mixed strains. In response, our proposed method rhea, forgoes reference genomes and metagenome-assembled genomes (MAGs) by encompassing a single metagenome coassembly graph constructed from all samples in a series. The log fold change in graph coverage between subsequent samples is then calculated to call SVs that are thriving or declining throughout the series. We show rhea to outperform existing methods for SV and horizontal gene transfer (HGT) detection in two simulated mock metagenomes, which is particularly noticeable as the simulated reads diverge from reference genomes and an increase in strain diversity is incorporated. We additionally demonstrate use cases for rhea on series metagenomic data of environmental and fermented food microbiomes to detect specific sequence alterations between subsequent time and temperature samples, suggesting host advantage. Our innovative approach leverages raw read patterns rather than references or MAGs to include all sequencing reads in analysis, and thus provide versatility in studying SVs across diverse and poorly characterized microbial communities for more comprehensive insights into microbial genome dynamics.

Autori: Kristen D. Curry, F. B. Yu, S. E. Vance, S. Segarra, D. Bhaya, R. Chikhi, E. P. C. Rocha, T. J. Treangen

Ultimo aggiornamento: 2024-01-30 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.01.25.577285

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.25.577285.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili