Simple Science

La science de pointe expliquée simplement

# Biologie# Bioinformatique

Un nouvel outil REPORTH met en lumière les séquences d'ADN

REPORTH offre de nouvelles façons d'analyser les séquences d'ADN répétitives chez les bactéries.

― 8 min lire


REPORTH et DNA InsightsREPORTH et DNA Insightsgénétiques bactériennes avec REPORTH.Nouvelles infos sur les séquences
Table des matières

Les séquences répétitives sont des parties de l'ADN qui se répètent et se trouvent souvent dans le matériel génétique de plein de vivants. Chez les organismes avec des cellules complexes, comme les plantes et les animaux, une bonne partie de leur ADN est constituée de ces séquences répétitives. C'est surtout à cause de l'activité d'éléments qui peuvent bouger dans le génome. Chez des organismes plus simples comme les bactéries, les séquences répétitives sont moins courantes mais elles existent toujours sous différentes formes.

Types de séquences répétitives

Il y a deux grandes catégories de séquences répétitives. La première, c'est les mutualistes, qui profitent à la fois à la séquence et à l'organisme. Par exemple, certaines répétitions d’ADN qui sont importantes pour réaliser des fonctions essentielles. La deuxième catégorie, ce sont les éléments génétiques égoïstes, qui agissent dans leur propre intérêt, comme les Séquences d'insertion qui peuvent se glisser dans de nouvelles positions dans l'ADN.

Les REPINs, un type de courte séquence répétitive qu'on trouve dans les bactéries, sont connus pour leur manière unique de transmettre l'information génétique à travers les générations. Contrairement aux autres séquences répétitives, les REPINs sont hérités verticalement, ce qui veut dire qu'ils passent des parents aux descendants plutôt que de bouger entre différents organismes.

L'importance d'étudier les REPINs

Comprendre les REPINs peut donner des idées sur comment les bactéries évoluent et s'adaptent à leur environnement. En étudiant ces séquences, les scientifiques peuvent estimer des choses comme la fréquence à laquelle les REPINs se dupliquent et à quelle vitesse ils peuvent changer au fil du temps. Toutefois, déterminer ces taux a été compliqué car ça repose sur l'idée que les mutations dans les REPINs se produisent à des taux constants. Pour améliorer la précision, les chercheurs cherchent des méthodes alternatives qui ne dépendent pas uniquement de l'analyse de l'ADN lui-même.

Séquences d'insertion : une approche différente

Les séquences d'insertion sont une autre forme d'élément répétitif qu'on trouve dans les Génomes bactériens. Contrairement aux REPINs, celles-ci peuvent se déplacer plus librement entre différentes bactéries. Elles ont été étudiées beaucoup plus en profondeur, permettant aux scientifiques de mesurer les Taux de duplication dans des conditions de laboratoire contrôlées.

Étudier comment les séquences d'insertion se répandent peut aider les chercheurs à en apprendre plus sur leur rôle dans l'évolution. Ils peuvent analyser si ces séquences s'insèrent aux mêmes endroits de manière répétitive ou si elles se transmettent à travers les générations de manière cohérente.

Défis dans les relations entre gènes

Même quand on examine des gènes qui ne se répètent pas, déterminer les relations entre différents gènes peut être compliqué. Les chercheurs utilisent diverses méthodes pour identifier si les gènes chez différents organismes viennent d'un ancêtre commun ou s'ils se sont éloignés les uns des autres à cause d'événements de duplication.

Reconnaître les différences entre ces types de relations génétiques est crucial. Les gènes qui viennent d'un ancêtre commun effectuent généralement des tâches similaires, tandis que ceux dérivés de la duplication ont peut-être évolué pour assumer des fonctions différentes.

Présentation de REPORTH : un nouvel outil

Pour mieux étudier les séquences répétitives, un nouvel outil appelé REPORTH a été créé. REPORTH aide à trouver les emplacements des séquences répétitives chez des souches bactériennes similaires en analysant les gènes qui les entourent. Il fait ça en comparant les séquences autour des éléments répétitifs pour voir si elles sont similaires à travers différents génomes.

Par exemple, REPORTH a été testé sur 42 souches d'une bactérie spécifique. En identifiant les séquences répétitives dans ces bactéries, les chercheurs peuvent comprendre comment ces séquences ont changé au fil du temps et comment elles se relient entre elles.

Comment fonctionne REPORTH

Pour utiliser REPORTH, les chercheurs ont besoin de génomes bactériens étroitement liés et des emplacements des séquences répétitives qu'ils souhaitent analyser. Ils peuvent fournir ces informations sous plusieurs formats, y compris une sortie spécifique d'un autre programme conçu pour identifier ces séquences.

Lorsque REPORTH reçoit ces informations, il examine les séquences entourant chaque élément répétitif pour trouver des connexions entre elles. Il regroupe ensuite les séquences qui montrent de fortes similarités en fonction de leur environnement. Cela permet aux chercheurs de voir quelles séquences sont liées même à travers différentes souches de bactéries.

La preuve de principe avec Pseudomonas chlororaphis

REPORTH a été appliqué pour analyser les séquences répétitives trouvées dans 42 souches de la bactérie Pseudomonas chlororaphis. Dans ces génomes, un nombre important de REPINs a été identifié, soulignant que beaucoup de ces séquences se trouvent à des emplacements spécifiques dans l'ADN. Cependant, tous les génomes n'ont pas les mêmes répétitions, ce qui suggère des changements dans la composition génétique au fil du temps.

En appliquant REPORTH, les chercheurs ont découvert qu'il y a beaucoup de clusters de REPINs, indiquant leur présence à des endroits similaires entre différentes souches. Cela permet une meilleure compréhension de la façon dont ces séquences peuvent changer et s'adapter avec chaque génération.

Comprendre les Séquences flanquantes

Chaque séquence répétitive est souvent entourée d'autres gènes, appelés séquences flanquantes. En étudiant ces séquences flanquantes, les chercheurs peuvent obtenir des informations sur la distribution des séquences répétitives et comment elles évoluent au fil du temps.

Dans les génomes analysés, il a été constaté que les séquences flanquantes sont très similaires parmi les groupes orthologues. Ce niveau élevé de similarité soutient l'idée que les REPINs existent à des emplacements conservés, malgré les variations entre les différentes souches. Cela renforce la méthode utilisée par REPORTH pour regrouper ces séquences répétitives avec précision.

Cas rares de regroupement incorrect

Bien que REPORTH montre un haut niveau de précision dans le regroupement des séquences répétitives, il y a toujours une chance de mal identifier les relations entre les gènes, surtout en ce qui concerne les séquences paralogues. Cependant, les preuves suggèrent que l'outil reste fiable, car seule une petite fraction des clusters pourrait potentiellement être affectée par de telles erreurs.

Directions futures pour REPORTH

Le potentiel de REPORTH pour fournir des aperçus précieux ne s'arrête pas aux REPINs seulement. Les chercheurs prévoient également d'explorer son utilisation pour étudier d'autres formes de séquences répétitives, comme les séquences d'insertion. En examinant comment ces séquences se comportent à travers différents génomes, les scientifiques espèrent découvrir divers schémas évolutifs.

Bien que REPORTH fonctionne actuellement mieux avec des bactéries étroitement liées, il y a un besoin d'outils similaires capables d'analyser des génomes plus distants. De tels outils pourraient accroître notre compréhension des séquences hautement conservées, comme celles trouvées dans les gènes d'ARN ribosomal, menant à de nouvelles découvertes dans le domaine de la génétique.

Conclusion : La valeur de REPORTH

REPORTH représente un progrès significatif dans l'étude des séquences répétitives dans les génomes bactériens. En permettant aux chercheurs d'identifier et d'analyser ces séquences à travers des souches étroitement liées, cela ouvre de nouvelles voies pour comprendre leur évolution. La capacité de l'outil à fournir des informations détaillées sur les relations entre les séquences répétitives a le potentiel de combler des lacunes dans notre compréhension de la génétique bactérienne. Avec la poursuite des recherches, REPORTH promet d'être une ressource précieuse pour percer les mystères cachés dans les séquences génomiques.

Source originale

Titre: REPORTH: Determining orthologous locations of repetitive sequences between genomes

Résumé: Repetitive sequences are a common feature of bacterial genomes. Some repetitive sequences such as REPINs are mobile within the genome but inherited only vertically from mother to daughter across bacterial genomes. Selfish elements in contrast are mobile within the genome but also travel horizontally from genome to genome. Yet, no matter the nature of the association between the repetitive elements and the host, it is difficult to study the evolutionary dynamics of repetitive sequences across genomes. If it is unclear whether two sequences in two different genomes are in orthologous positions, it is difficult to infer parameters like the replication rate, horizontal transfer rate and rate of loss. Here we present a tool to facilitate these analyses called REPORTH. REPORTH determines whether repetitive sequences in different but closely related bacterial genomes occur in orthologous genomic positions. Whether a position is orthologous or not depends on the orthology of flanking sequences. Flanking sequences are deemed orthologous if they are bidirectional best hits. All repetitive sequences that are found in orthologous positions across different genomes are grouped together. Analyses of these groups can be used to study the evolutionary dynamics of selfish repetitive elements such as insertion sequences, but also for mutualistic repetitive elements such as REPINs.

Auteurs: Frederic Bertels, P. V. Bharadwaj, B. van Dijk

Dernière mise à jour: 2024-10-17 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.10.14.618302

Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.14.618302.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires