Intuizioni genetiche sui batteri Streptomyces
Un'analisi completa che rivela la diversità genetica negli Streptomyces e le sue potenziali applicazioni.
― 7 leggere min
Indice
- Diversità Genetica di Streptomyces
- Avanzamenti nella Ricerca Batterica
- Studio del Pangenoma di Streptomyces
- Obiettivo di Questo Studio
- Dataset dei Genomi di Streptomyces
- Suddivisione del Dataset di Streptomyces
- Caratteristiche dei Genomi di Streptomyces
- Tipi di Cluster Genetici Identificati
- Cluster Genetici Noti
- Clustering Basato su MASH di Streptomyces
- Risultati Chiave dall'Analisi MASH
- Confronto tra Cluster MASH e Alberi Evolutivi
- Esplorazione della Diversità e Funzione dei BGC
- Distribuzione dei GCF tra i Cluster
- Analisi della Synteny Cromosomica
- Importanza dell'Ereditarietà Verticale nell'Evoluzione dei BGC
- Riepilogo dei Risultati della Ricerca
- Implicazioni per la Ricerca Futura
- Conclusione
- Fonte originale
- Link di riferimento
Streptomyces è un tipo di batteri che si trova nel terreno e può creare tante sostanze utili, soprattutto in medicina e biotecnologia. Questi batteri hanno strutture genetiche complesse che permettono loro di produrre una grande varietà di composti che possono avere ruoli importanti nella salute e nell'industria. Però, i ricercatori hanno scoperto che non comprendiamo ancora completamente tutte le sostanze diverse che questi batteri possono creare o come le producono.
Diversità Genetica di Streptomyces
Studi hanno dimostrato che c'è molta diversità genetica tra i diversi tipi di batteri Streptomyces. Questa diversità apre la porta alla scoperta di tanti nuovi prodotti naturali, ma rende anche complicato confrontare diverse specie e ceppi. Per affrontare questo problema, i scienziati stanno cercando di raggruppare gli Streptomyces in categorie specifiche. Questa classificazione aiuterà i ricercatori a confrontare e studiare meglio le differenze genetiche e lo sviluppo di questi batteri nel tempo.
Avanzamenti nella Ricerca Batterica
Recenti miglioramenti nella tecnologia di sequenziamento del DNA e negli strumenti per analizzare i genomi hanno reso più facile per i ricercatori scoprire prodotti naturali. Strumenti come antiSMASH e altri hanno dimostrato che molte specie batteriche possiedono un potenziale genetico che prima non era riconosciuto. Anche se questi strumenti hanno fatto avanzare la nostra conoscenza, ci sono dei limiti. Alcuni strumenti potrebbero non definire accuratamente i confini genetici, e i database su cui i ricercatori si basano potrebbero non essere completi. Combinare i risultati di diversi strumenti può aiutare a risolvere alcuni di questi problemi.
Studio del Pangenoma di Streptomyces
Grandi studi che analizzano il materiale genetico completo di Streptomyces sono stati utili per comprendere come questi batteri sviluppano le loro caratteristiche genetiche. Ricerche precedenti hanno esaminato centinaia di genomi di Streptomyces e hanno rivelato che questi batteri sono altamente diversificati, con solo un numero ridotto di geni fondamentali condivisi tra loro. Con l'aumento del numero di sequenze di DNA di alta qualità disponibili, c'è un forte bisogno di rivedere la nostra comprensione della composizione genetica di Streptomyces e delle sostanze che possono produrre.
Obiettivo di Questo Studio
In questo studio, ci siamo proposti di condurre l'analisi più estesa finora del materiale genetico dei batteri Streptomyces. Utilizzando vari strumenti di ricerca e organizzando i batteri in gruppi specifici, il nostro obiettivo è di ampliare la nostra conoscenza delle sostanze che possono creare e di come le loro caratteristiche genetiche siano evolute.
Dataset dei Genomi di Streptomyces
Abbiamo raccolto un grande dataset di genomi di Streptomyces da database pubblici e dalle nostre recenti ricerche. A partire dal 30 giugno 2023, abbiamo identificato quasi 3.000 genomi di Streptomyces da un database. Inoltre, abbiamo incluso oltre 900 genomi recentemente sequenziati, portando il totale a circa 3.840 genomi.
Suddivisione del Dataset di Streptomyces
Abbiamo categorizzato i genomi in base alla loro qualità in tre gruppi: alta qualità (HQ), qualità media (MQ) e bassa qualità (LQ). Dopo un'analisi attenta, abbiamo determinato che c'erano circa 2.371 genomi di qualità sufficiente per ulteriori ricerche. Abbiamo anche classificato questi genomi per specie, identificando un totale di 608 specie, molte delle quali potrebbero essere nuove specie non presenti nei database esistenti.
Caratteristiche dei Genomi di Streptomyces
I genomi di Streptomyces che abbiamo studiato variavano in dimensioni e contenuto genetico. La dimensione dei genomi variava da poco meno di 5 milioni a oltre 13 milioni di coppie di basi. La dimensione media del genoma era di circa 8,5 milioni di coppie di basi. Abbiamo osservato che i genomi con dimensioni più piccole appartenevano principalmente a certe specie patogene, mentre genomi più grandi si trovavano spesso in altre specie.
Tipi di Cluster Genetici Identificati
Utilizzando strumenti per identificare cluster genetici, abbiamo trovato un numero sostanziale di questi cluster nel nostro dataset. I tipi di cluster identificati includevano quelli responsabili della creazione di composti diversi come terpeni, peptidi non ribosomiali e vari altri composti. Ogni tipo di cluster genetico ha una funzione specifica e può produrre sostanze diverse, contribuendo alla capacità dei batteri di prosperare in vari ambienti.
Cluster Genetici Noti
Confrontando i nostri cluster genetici con un database noto di cluster genetici, abbiamo trovato che un numero significativo corrispondeva a cluster esistenti noti per produrre composti preziosi. Tuttavia, abbiamo anche notato che molti cluster non assomigliano da vicino a nessun cluster noto, indicando un potenziale inesplorato per nuove scoperte.
Clustering Basato su MASH di Streptomyces
Per dare senso al grande dataset, abbiamo usato un metodo di clustering chiamato MASH per analizzare la similarità genetica tra i diversi genomi di Streptomyces. Questo metodo ci ha permesso di raggruppare i genomi in cluster primari e secondari, rivelando sette gruppi principali di genomi strettamente correlati e ulteriori sotto-gruppi.
Risultati Chiave dall'Analisi MASH
Nella nostra analisi, abbiamo trovato che alcuni cluster erano particolarmente degni di nota. Uno dei cluster più grandi includeva molte specie ben note. Esaminando le relazioni tra questi cluster e costruendo un albero dei genomi, siamo stati in grado di identificare connessioni tra diverse specie e come si relazionano tra loro attraverso l'evoluzione.
Confronto tra Cluster MASH e Alberi Evolutivi
Per convalidare i nostri risultati di clustering, abbiamo costruito alberi evolutivi utilizzando vari metodi. Un confronto ha rivelato un accordo generale tra i nostri cluster definiti da MASH e i cluster formati da metodi tradizionali. Tuttavia, sono emerse alcune discrepanze, suggerendo che è necessaria un'ulteriore analisi per affinare la nostra comprensione di queste relazioni.
Esplorazione della Diversità e Funzione dei BGC
Per comprendere il potenziale di Streptomyces nella produzione di sostanze preziose, abbiamo raggruppato i cluster genetici in famiglie di cluster genici (GCF). Tenendo conto di altri strumenti genetici, abbiamo ridotto efficacemente il numero di GCF previsti. I nostri risultati hanno indicato che diversi tipi di cluster genetici mostravano livelli variabili di somiglianza con composti noti.
Distribuzione dei GCF tra i Cluster
Ulteriori esami dei GCF hanno rivelato schemi su come questi cluster erano distribuiti tra i diversi cluster MASH. Alcuni GCF erano unici per certi cluster, mentre altri erano condivisi tra più cluster. Queste informazioni ci aiutano a identificare quali ceppi sono probabilmente in grado di produrre composti specifici e possono indirizzare futuri sforzi di ricerca.
Analisi della Synteny Cromosomica
Un aspetto unico del nostro studio ha coinvolto l'esame dell'arrangiamento dei cluster genetici lungo i cromosomi di Streptomyces. Questa analisi della synteny-l'ordine dei geni sui cromosomi-ha rivelato che alcuni arrangiamenti erano conservati tra diversi ceppi. Tali risultati suggeriscono che c'è un metodo di ereditarietà genetica che influenza come questi cluster evolvono nel tempo.
Importanza dell'Ereditarietà Verticale nell'Evoluzione dei BGC
Mentre indagavamo i modelli di ereditarietà genetica, è diventato chiaro che la discendenza verticale dei geni gioca un ruolo essenziale nel plasmare la diversità e la funzionalità dei cluster genetici. Questa comprensione è in linea con le ricerche esistenti su come i tratti genetici vengono trasmessi attraverso le generazioni di batteri.
Riepilogo dei Risultati della Ricerca
In sintesi, questo studio presenta un'indagine approfondita sulla diversità genetica e il potenziale dei batteri Streptomyces. Utilizzando strumenti avanzati per analizzare quasi 2.400 genomi, abbiamo evidenziato intuizioni chiave sulle caratteristiche dei cluster genetici, l'evoluzione di questi organismi e la loro capacità di produrre sostanze utili.
Implicazioni per la Ricerca Futura
I risultati di questo lavoro forniscono una solida base per future esplorazioni di Streptomyces e delle loro capacità metaboliche. Affinando la nostra comprensione di come questi batteri producono sostanze preziose e identificando potenziali nuove specie, possiamo aprire nuove strade per la ricerca che potrebbero portare a scoperte in medicina, biotecnologia e scienze ambientali.
Conclusione
La nostra analisi del pangenoma di Streptomyces ha rivelato un quadro complesso di diversità genetica e potenziale. Lo studio sottolinea l'importanza di integrare vari strumenti e metodi di ricerca per generare una comprensione sfumata di questi prolifici batteri, che giocano un ruolo cruciale in molti processi industriali e ambientali. Man mano che la nostra conoscenza continua ad evolversi, gli Streptomyces rimarranno senza dubbio un focus di interesse scientifico ed esplorazione.
Titolo: Pangenome mining of the Streptomyces genus redefines their biosynthetic potential
Estratto: BackgroundStreptomyces is a highly diverse genus known for the production of secondary or specialized metabolites with a wide range of applications in the medical and agricultural industries. Several thousand complete or nearly-complete Streptomyces genome sequences are now available, affording the opportunity to deeply investigate the biosynthetic potential within these organisms and to advance natural product discovery initiatives. ResultWe performed pangenome analysis on 2,371 Streptomyces genomes, including approximately 1,200 complete assemblies. Employing a data-driven approach based on genome similarities, the Streptomyces genus was classified into 7 primary and 42 secondary MASH-clusters, forming the basis for a comprehensive pangenome mining. A refined workflow for grouping biosynthetic gene clusters (BGCs) redefined their diversity across different MASH-clusters. This workflow also reassigned 2,729 known BGC families to only 440 families, a reduction caused by inaccuracies in BGC boundary detections. When the genomic location of BGCs is included in the analysis, a conserved genomic structure (synteny) among BGCs becomes apparent within species and MASH-clusters. This synteny suggests that vertical inheritance is a major factor in the acquisition of new BGCs. ConclusionOur analysis of a genomic dataset at a scale of thousands of genomes refined predictions of BGC diversity using MASH-clusters as a basis for pangenome analysis. The observed conservation in the order of BGCs genomic locations showed that the BGCs are vertically inherited. The presented workflow and the in-depth analysis pave the way for large-scale pangenome investigations and enhance our understanding of the biosynthetic potential of the Streptomyces genus.
Autori: Bernhard O Palsson, O. S. Mohie, T. S. Jorgensen, T. J. Booth, P. Charusanti, P. V. Phaneuf, T. Weber
Ultimo aggiornamento: 2024-02-22 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.02.20.581055
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.02.20.581055.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.