Simple Science

La science de pointe expliquée simplement

# Biologie# Génomique

Découvrir les fonctions cachées des régions uniques de l'ADN

Des scientifiques dévoilent les rôles importants de régions d'ADN uniques dans le développement des mammifères.

― 7 min lire


Régions d'ADN uniquesRégions d'ADN uniqueschez les mammifèresdans le développement des mammifères.Une étude révèle des rôles essentiels
Table des matières

Les Transposons sont des segments d'ADN qui peuvent bouger à l'intérieur du génome. Ils ont été découverts pour la première fois dans les années 1940. Peu après, les scientifiques ont découvert la structure de l'ADN. Cette structure montre une séquence de blocs de construction, qu'on appelle les nucléotides. La découverte des transposons suggère que cette séquence peut changer.

Une scientifique appelée Barbara McClintock a étudié les transposons et a remarqué qu'ils deviennent souvent actifs après certains événements, comme quand une cellule est endommagée ou infectée. Elle a appris que cette activité peut modifier le fonctionnement des gènes dans les cellules.

Quand les scientifiques ont publié le génome humain, ils ont découvert qu'environ la moitié provient des transposons. Ils ont noté que certains groupes de gènes, appelés clusters Hox, avaient très peu de transposons par rapport à d'autres parties du génome. Les clusters Hox sont importants car ils aident à déterminer la structure corporelle de base d'un organisme. Pour les mammifères, il y a quatre clusters Hox. Les chercheurs pensaient que le manque de transposons dans ces zones était dû à la nécessité de garder la régulation des gènes stable.

Cela a suscité un vif intérêt pour l'étude des zones d'ADN qui n'ont pas de transposons. Ces zones sont connues sous le nom de régions sans transposons, ou TFRs. Les TFRs ne contiennent également pas d'ADN satellite, et seule une petite partie d'elles est similaire à d'autres parties du génome. Les chercheurs ont trouvé de nombreuses de ces régions chez les humains et les souris, dont la plupart ne codent pas pour des protéines.

Importance des TFRs

Les scientifiques ont déterminé que les TFRs sont riches en gènes importants pour le Développement. Cela signifie que ces régions pourraient avoir des rôles critiques dans la façon dont les organismes grandissent et se développent. Deux façons de comprendre comment les TFRs pourraient être maintenues sont par exclusion, c'est-à-dire qu'elles gardent les transposons à l'écart, et par sélection, où seules les meilleures régions subsistent au fil du temps. Il semble que la deuxième option soit plus probable.

Peu après l'étude des TFRs, les chercheurs ont découvert des zones uniques dans le génome qui semblaient également avoir des fonctions importantes. Ces régions, appelées régions uniques (URs), ne se chevauchent pas avec des séquences de gènes connues. Les chercheurs ont commencé à étudier ces zones pour voir comment elles étaient liées aux Fonctions des gènes.

Méthodes d'analyse des régions uniques

Pour détecter les URs, les chercheurs utilisent un programme appelé Macle. Ce programme analyse la complexité des correspondances dans les séquences d'ADN. Il est conçu pour identifier rapidement les zones qui se distinguent par leur unicité, c'est-à-dire qui ne correspondent pas étroitement à d'autres parties du génome.

Un autre programme, RepeatMasker, est souvent utilisé pour trouver les transposons. Il recherche des séquences répétées connues dans le génome. Macle, étant plus rapide, permet aux scientifiques d'identifier les régions uniques beaucoup plus efficacement. Cependant, il peut manquer certains anciens transposons qui ont changé au fil du temps.

Les chercheurs ont comparé ces programmes en les exécutant sur des séquences simulant des changements dans le génome. Ils ont observé comment chaque programme se comportait en fonction des différents taux de mutation. Les résultats ont montré que Macle pouvait rapidement trouver des zones uniques, tandis que RepeatMasker avait un temps de traitement plus long.

Analyse de 18 génomes de mammifères

Pour étendre leur recherche, les scientifiques ont étudié 18 génomes de mammifères différents provenant de neuf ordres, qui comprenaient à la fois des mammifères placentaires et marsupiaux. Ils voulaient trouver des URs dans ces génomes et voir si elles étaient riches en gènes associés au développement.

Pour ce faire, ils ont d'abord rassemblé les données génomiques et les ont annotées. En utilisant une méthode connue sous le nom de test de Monte Carlo, les scientifiques ont évalué la signification de leurs résultats. Ils ont découvert que les URs dans toutes les espèces de mammifères étudiées étaient en effet enrichies en gènes de développement.

Cette découverte a soutenu l'idée que les URs pourraient avoir des rôles cruciaux dans les processus de développement chez les mammifères.

Effets de la taille de la fenêtre sur les régions uniques

Les chercheurs ont également examiné comment le changement de la taille de la fenêtre utilisée dans leur analyse affectait le nombre d'URs trouvées. Ils ont constaté qu’en utilisant des fenêtres plus petites, il y avait un pourcentage plus élevé de régions uniques. À mesure que la taille des fenêtres augmentait, le nombre d'URs trouvées diminuait.

Par exemple, avec une fenêtre de 1 kb, une portion significative du génome a été identifiée comme unique, tandis que des fenêtres plus grandes ont révélé beaucoup moins de zones uniques. Cela a du sens, car de plus grandes sections d'ADN sont plus susceptibles de contenir des séquences répétées ou des transposons qui se sont insérés au fil du temps.

Les chercheurs ont également trouvé que la proportion de régions uniques qui se chevauchaient avec des promoteurs de gènes connus changeait avec des tailles de fenêtres variables. Des fenêtres plus petites avaient tendance à avoir un plus grand chevauchement avec des fonctions de gènes connus, tandis que des fenêtres plus grandes n’avaient pas.

Enrichissement des fonctions des gènes

En analysant les régions uniques, les chercheurs se sont concentrés sur les fonctions spécifiques qui étaient enrichies dans ces zones. Ils ont découvert que beaucoup des fonctions de gènes enrichies étaient liées au développement. Cette tendance était cohérente à travers toutes les espèces de mammifères qu’ils ont analysées.

Les résultats indiquaient une forte connexion entre ces zones uniques d'ADN et les gènes responsables du développement des plans corporels de ces animaux.

Exploration des régions uniques anonymes

En plus de leur étude des gènes connus, les chercheurs ont également examiné des URs anonymes. Ces régions ne se chevauchaient avec aucune séquence de gènes ou annotation connus. Les chercheurs voulaient déterminer si ces zones avaient une signification biologique.

Pour vérifier le contenu fonctionnel de ces régions anonymes, ils les ont comparées à une base de données de protéines. Étonnamment, ils ont trouvé quelques correspondances, incluant un gène qui joue un rôle dans la signalisation cellulaire. Cette découverte indique que ces régions négligées pourraient contenir des gènes importants qui n'ont pas encore été complètement annotés dans certains génomes.

Conclusion

L'étude des transposons, des régions uniques et de leurs fonctions dans les génomes de divers mammifères a fourni d'importants aperçus sur le rôle de l'ADN dans les processus biologiques. Bien que beaucoup de choses soient connues sur les transposons et leurs mouvements dans le génome, les régions uniques n'ont pas reçu autant d'attention jusqu'à récemment.

L'utilisation d'outils comme Macle et RepeatMasker a facilité l'identification et l'analyse des régions uniques. Ces régions sont importantes pour comprendre comment les gènes fonctionnent et comment ils contribuent au développement d'un organisme. Cette recherche souligne l'importance des régions uniques dans le contexte plus large de la génomique et invite à une exploration plus poussée de leurs rôles dans l'évolution et la biologie.

Source originale

Titre: Detection and Annotation of Unique Regions in Mammalian Genomes

Résumé: Long unique genomic regions have been reported to be highly enriched for developmental genes in mice and humans. In this paper we identify unique genomic regions using a highly efficient method based on fast string matching. We quantify the resource consumption and accuracy of this method before applying it to the genomes of 18 mammals. We annotate their unique regions of at least 10 kb and find that they are strongly enriched for developmental genes across the board. When investigating the subset of unique regions that lack annotations, we found in the tasmanian devil the gene encoding iniositol polyphosphate-5-phosphatase A, which is an essential part of intracellular signaling. This implies that unique regions might be given priority when annotating mammalian genomes. Our documented pipeline for annotating unique regions in any mammalian genome is available from the repository github.com/evolbioinf/auger; additional data for this study is available from the data-verse at doi.org/10.17617/3.4IKQAG.

Auteurs: Bernhard Haubold, B. Vieira Mourato

Dernière mise à jour: 2024-10-13 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.10.11.617789

Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.11.617789.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires