Simple Science

La science de pointe expliquée simplement

# Biologie# Génomique

Comprendre les répétitions d'ADN chez les bactéries de la tuberculose

Une étude révèle des motifs de répétition d'ADN dans Mycobacterium tuberculosis et leurs effets sur la variation génétique.

― 7 min lire


Répétitions d'ADN dansRépétitions d'ADN dansles bactéries de latuberculoseMycobacterium tuberculosis.Révéler les variations génétiques dans
Table des matières

Les répétitions d'ADN sont des parties du matériel génétique qui apparaissent plusieurs fois. Elles peuvent varier en taille et en complexité. Certaines sont de courtes séquences qui se répètent, tandis que d'autres peuvent être de plus longs segments qui peuvent se déplacer dans l'ADN. Ces répétitions jouent un rôle dans l'évolution des organismes, mais peuvent aussi poser des problèmes pour la stabilité du génome, entraînant des variations comme des Duplications ou des suppressions de matériel génétique.

L'Importance du Séquençage Complet du Génome

Le séquençage complet du génome est une méthode qui permet aux scientifiques de lire la séquence d'ADN entière d'un organisme. Ça a montré que les variations liées aux répétitions sont courantes chez de nombreux organismes. Souvent, lors de l'assemblage des génomes, les répétitions peuvent poser des soucis. Les courtes séquences peuvent ne pas être assez longues pour couvrir les répétitions, ce qui mène à des cartes d'ADN incomplètes ou confuses. Ça peut rendre difficile l'identification de tous les types de mutations présentes chez un organisme.

Focus sur Mycobacterium tuberculosis

Un domaine d'étude important avec le séquençage des génomes est de comprendre les pathogènes bactériens, notamment Mycobacterium tuberculosis, la bactérie qui cause la tuberculose (TB). Cette bactérie est souvent notée pour sa faible diversité génétique, ce qui signifie qu'elle ne montre pas beaucoup de variations entre différentes souches. Ça soulève des questions sur comment une bactérie aussi uniforme peut être si efficace pour causer des maladies.

Objectifs et Méthodes de l'Étude

Cette étude s'est concentrée sur 16 souches de Mycobacterium tuberculosis d'une épidémie à Berne, en Suisse. L'objectif était de mieux comprendre les types de variations d'ADN présentes dans ces souches. En utilisant une méthode de séquençage spécifique appelée séquençage HiFi de Pacific Biosciences, les chercheurs ont voulu répondre à trois questions principales :

  1. Quelle est l'exactitude des génomes assemblés ?
  2. À quoi ressemble la structure des répétitions dans ces bactéries ?
  3. Quels types de variations d'ADN existent et qu'est-ce qui les cause ?

Exactitude de l'Assemblage des Génomes

Au total, 16 souches ont été séquencées, et la plupart ont été assemblées avec succès en génomes complets. Les chercheurs ont vérifié la précision de ces assemblages en comparant les données de séquençage originales avec les génomes assemblés. Ils ont trouvé seulement quelques incohérences, ce qui suggère que la méthode utilisée était largement efficace pour créer des représentations précises des génomes.

Comprendre le Paysage des Répétitions

Ensuite, les chercheurs ont étudié les types de répétitions présentes dans l'un des nouveaux génomes assemblés. Ils ont trouvé plusieurs types de répétitions, y compris :

  • Homopolymères : Ce sont des séquences composées d'un même nucléotide répété.
  • Répétitions de Séquences Courtes (SSR) : Ce sont des motifs courts d'ADN qui se répètent.
  • Répétitions Tandem (TR) : Ce sont des motifs plus longs qui se répètent plusieurs fois.
  • Séquences d'Insertion : Ce sont des segments qui peuvent se déplacer dans le génome.

Les homopolymères étaient les types de répétitions les plus courants. La recherche a également identifié de nombreux segments à travers le génome qui partagent des similitudes, ce qui peut indiquer où des changements génétiques pourraient se produire.

Types et Fréquences des Variants

À partir de l'analyse des génomes assemblés, un total de 110 variants différents ont été identifiés. Cela incluait des changements de nucléotides uniques, ainsi que des variations impliquant plusieurs nucléotides, des suppressions et des insertions. La plupart de ces variants étaient uniques à une seule souche, tandis que certains étaient partagés entre plusieurs souches.

Fait intéressant, beaucoup des variants étaient associés à des régions d'ADN contenant des répétitions. Ça suggère que ces types de mutations pourraient être influencés par la nature répétitive des séquences.

Conversion génétique et Son Rôle

L'étude a également examiné de près les modèles de conversion génique, qui est un processus où une séquence d'ADN remplace une séquence similaire dans une autre partie du génome. Il a été trouvé que la conversion génique pourrait être assez courante dans cette bactérie. Des groupes de variants ont été identifiés qui sont probablement issus de ce processus, surtout dans certaines familles de gènes qui sont importantes pour la façon dont la bactérie interagit avec l'hôte.

Événements de Duplication dans le Génome

Un résultat marquant était un événement de duplication dans l'une des souches, qui n'a pas été complètement résolu dans l'assemblage du génome. Cette duplication impliquait une longueur significative d'ADN qui comprenait plusieurs gènes importants. Les preuves suggèrent que cette duplication a probablement eu lieu par un processus de recombinaison homologue, qui est une méthode d'échange génétique pouvant mener à de nouvelles variations génétiques.

Implications des Résultats

Les résultats de cette étude ont des implications importantes. Ils suggèrent qu même avec une faible diversité génétique, Mycobacterium tuberculosis peut générer des variations génétiques à travers des processus comme la conversion génique et la duplication. Cette variation génétique pourrait influencer la façon dont les bactéries réagissent aux traitements et la manière dont la maladie se propage.

De plus, l'étude met en lumière l'importance d'utiliser des technologies de séquençage avancées pour mieux comprendre la composition génétique des pathogènes. De meilleurs assemblages de génomes peuvent aider à mieux comprendre la dynamique des organismes causant des maladies et à suivre les épidémies.

Utiliser le Repeatome dans les Recherches Futures

Les chercheurs soulignent la nécessité de prendre en compte les régions de répétition dans les futures études sur les génomes bactériens. En comprenant le paysage des répétitions et son effet sur la variation génétique, les scientifiques peuvent améliorer la résolution des analyses génétiques. Ça peut mener à de meilleures compréhensions des chaînes de transmission des maladies et des facteurs qui contribuent à leur persistance dans les populations humaines.

Conclusion

En résumé, les répétitions d'ADN sont des composants significatifs des génomes, surtout dans le contexte des pathogènes bactériens comme Mycobacterium tuberculosis. Le séquençage avancé a permis une exploration détaillée de ces répétitions, révélant leurs rôles dans la variation génétique et la stabilité du génome. Ce savoir est crucial pour comprendre comment de tels pathogènes s'adaptent et survivent, posant des défis pour les réponses de santé publique. Les recherches futures devraient continuer à se concentrer sur ces régions de répétition pour ouvrir de nouvelles perspectives sur notre compréhension de la diversité génétique et des dynamiques des maladies.

Source originale

Titre: Large contribution of repeats to genetic variation in a transmission cluster of Mycobacterium tuberculosis

Résumé: Repeats are the most diverse and dynamic, but also the least well understood component of microbial genomes. For all we know, repeat-associated mutations such as duplications, deletions, inversions, and gene conversion might be as common as point mutations, but because of short-read myopia and methodological bias they have received much less attention. Long-read sequencing opens the perspective of resolving repeats and systematically investigating the mutations they induce. For this study, we assembled the genomes of 16 closely related strains of the bacterial pathogen Mycobacterium tuberculosis from PacBio HiFi reads, with the aim of characterizing the full spectrum of DNA polymorphisms. We find that complete and accurate genomes can be assembled from HiFi reads, with read size being the main limitation in the presence of duplications. By combining a reference-free pangenome graph with extensive repeat annotation, we identified 110 variants, 58 of which can be assigned to repeat-associated mutational mechanisms such as strand slippage and homologous recombination. While recombination events are less frequent than point mutations, they can affect large regions and introduce multiple variants at once, as shown by three gene conversion events and a duplication of 7.3 kb that involve ppe18 and ppe57, two genes possibly involved in immune subversion. Our study shows that the contribution of repeat-associated mechanisms of mutation can be similar to that of point mutations at the microevolutionary scale of an outbreak. A large reservoir of unstudied genetic variation in this "monomorphic" bacterial pathogen awaits investigation.

Auteurs: Christoph Stritt, M. Reitsma, G. A. Goig, A. Dötsch, S. Borrell, C. Beisel, D. Brites, S. Gagneux

Dernière mise à jour: 2024-03-08 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.03.08.584093

Source PDF: https://www.biorxiv.org/content/10.1101/2024.03.08.584093.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires