Simple Science

La science de pointe expliquée simplement

# Biologie# Génomique

Nouvelles avancées dans la recherche sur le génome des souris

La recherche améliore la compréhension de la génétique des souris et comble des lacunes dans le génome.

Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams

― 10 min lire


Percée dans le génome dePercée dans le génome dela sourisla structure de l'ADN de la souris.Gros progrès dans la compréhension de
Table des matières

Les souris font partie intégrante de la recherche scientifique depuis plus d'un siècle. Elles aident les scientifiques à comprendre les maladies humaines, à trouver des traitements et à saisir comment nos corps fonctionnent. Parmi les découvertes importantes faites grâce aux souris, on trouve le rôle de certains gènes dans notre système immunitaire et la création de cellules souches spéciales qui peuvent se transformer en différents types de cellules.

En 2002, les scientifiques ont terminé le premier génome complet d'une souris, plus précisément de la souche C57BL/6J. Le génome est l'ensemble complet de l'ADN d'un organisme. Le génome de la souris contient 19 paires de chromosomes et un chromosome X, tandis que le chromosome Y est différent car il a une structure unique. Certaines parties du génome de la souris sont difficiles à étudier à cause de la façon dont ses chromosomes sont construits. Le génome actuel de la souris est incomplet, avec environ 281 lacunes. Ces lacunes sont présentes dans chaque chromosome, et des zones importantes comme les Télomères et les Centromères restent non résolues.

L'Importance des Télomères et des Centromères

Les télomères sont les extrémités protectrices des chromosomes qui aident à prévenir les dommages. Les centromères jouent un rôle important pendant la division cellulaire, aidant à séparer correctement les chromosomes. Le génome actuel de la souris ne reflète pas ces parties importantes des chromosomes de manière précise.

Les avancées récentes dans la technologie de séquençage de l'ADN offrent un moyen de créer des génomes de souris plus complets. Cette étude a utilisé une méthode qui permet aux scientifiques de lire de très longues séquences d'ADN, offrant une occasion de combler les lacunes en génétique murine.

Création des Génomes de Souris T2T

Les chercheurs ont produit les premiers génomes complets de souris pour les souches C57BL/6J et CAST/EiJ. Ces génomes complets, appelés T2T (Telomère-à-Télomère), contiennent toutes les structures précédemment manquantes, y compris des télomères et des centromères complets. Les nouveaux génomes sont plus complets que les anciennes versions, élargissant considérablement la compréhension de la génétique des souris.

L'ADN a été obtenu à partir de cellules souches embryonnaires d'un mélange des deux souches de souris. Les scientifiques ont utilisé des méthodes de séquençage à lecture longue et courte pour assembler les génomes. Ils ont créé six assemblages de génomes différents et les ont comparés, sélectionnant le meilleur basé sur un ensemble de critères de qualité.

Trouver les Parties Manquantes du Génome

Certains chromosomes étaient encore incomplets, manquant de séquences télomériques à leurs extrémités. Pour trouver ces parties manquantes, les chercheurs ont cherché des séquences répétées spécifiques dans les fragments d'ADN non placés. Ils ont également utilisé une méthode appelée Hi-C à longue portée pour aider à assigner les séquences restantes aux bons chromosomes.

En comparant les nouveaux génomes à la version précédente, il est devenu clair que les nouvelles versions avaient une séquence plus longue. Par exemple, le génome C57BL/6J T2T a ajouté 208 mégabases (Mbp) de séquence par rapport à l'ancienne version.

Précision Structurale

Pour vérifier la précision des nouveaux assemblages de génomes, les chercheurs ont examiné les structures dans les chromosomes. Ils ont constaté que le génome T2T avait moins de variantes structurelles (SVs) par rapport au génome plus ancien. Moins d'insertion, de suppressions, de duplications et d'Inversions ont été observées dans la nouvelle version, indiquant une structure plus stable.

Comprendre la Structure des Chromosomes

Les nouveaux génomes ont permis une comparaison entre la structure des chromosomes. Il a été noté que les nouveaux génomes contenaient des représentations complètes des télomères et des centromères sur tous les chromosomes. Les lacunes dans l'assemblage précédent ont été comblées avec de nouvelles données, révélant des différences à grande échelle entre les deux souches de souris.

Les chercheurs ont découvert que les télomères et les centromères avaient été mal représentés dans l'ancien génome, et les nouveaux assemblages ont considérablement amélioré cette représentation. Les nouveaux génomes montrent des augmentations substantielles des séquences satellites, qui sont importantes pour la structure et la fonction des chromosomes.

Annotation des gènes et Nouveaux Gènes

L'annotation des gènes a été réalisée en utilisant le séquençage d'ARN à partir de différents types de tissus. Le nombre de gènes codant pour des protéines trouvés dans les nouveaux génomes était comparable à celui du génome de référence précédent. Cependant, les chercheurs ont identifié de nouveaux gènes qui n'avaient pas été observés auparavant.

L'étude a trouvé plusieurs gènes novateurs dans les deux souches. Ces nouveaux gènes variaient en taille et contenaient de nombreux exons, qui sont des parties de gènes codant pour des protéines. Certains de ces nouveaux gènes se sont avérés similaires à des protéines connues, ce qui laisse entrevoir leurs fonctions potentielles.

Augmentation du Nombre de Copies des Gènes

Les chercheurs ont également trouvé un certain nombre de gènes dont le nombre de copies avait augmenté dans les génomes T2T par rapport à la version précédente. Cela signifie que certains gènes étaient présents en plus grande quantité dans les nouveaux génomes. Ces gènes appartenaient à différentes catégories, y compris celles liées au système immunitaire. Des différences dans le nombre de copies de certains gènes ont également été notées entre les deux souches.

Structure des Télomères et Centromères

Les télomères et les centromères jouent des rôles vitaux dans la stabilité des chromosomes. Les nouveaux génomes ont montré une amélioration significative de la représentation de ces régions. Les génomes C57BL/6J et CAST/EiJ T2T avaient des télomères beaucoup plus longs que le génome de référence précédent.

Les chercheurs ont constaté que les longueurs des télomères étaient généralement plus longues chez les souris par rapport aux humains. L'étude a détaillé la taille et la structure des télomères et des centromères, mettant en évidence les différences entre les deux souches de souris.

Les centromères des souris étaient constitués de types spécifiques d'ADN satellite, qui avaient été mal caractérisés dans les études précédentes. Les nouveaux génomes ont permis une compréhension plus claire des régions centromériques, révélant leur complexité structurelle.

Comparaison des Extrémités Chromosomiques Télocentriques

Les chromosomes de souris sont uniques en ce sens qu'ils ont leurs centromères situés à l'extrémité des chromosomes, une structure connue sous le nom de télocentrique. Les chercheurs ont comparé les structures télocentriques dans les deux souches de souris, révélant des différences dans leur agencement de séquences répétées.

Les souches C57BL/6J ont montré une organisation de répétitions distincte, tandis que CAST/EiJ avait une organisation plus variable. Cela souligne la diversité des structures chromosomiques entre les deux souches.

Compléter le Génome de Référence des Souris

Malgré les tentatives précédentes, le génome de référence des souris reste incomplet. L'assemblage T2T C57BL/6J a réussi à combler de nombreuses lacunes, ajoutant une quantité significative de séquences au génome de la souris. Le travail a révélé un total de 301 gènes codant des protéines dans les régions précédemment manquantes.

Les chercheurs ont mis en évidence des régions d'intérêt spécifiques, telles que celles liées à la réponse immunitaire, permettant de futures études sur leur fonction. Cette approche exhaustive pour combler les lacunes améliore considérablement la qualité globale du génome de la souris.

Régions Pseudoautosomiques

L'étude s'est également concentrée sur une région appelée région pseudoautosomique (PAR), qui est partagée entre les chromosomes X et Y. Les nouveaux assemblages ont amélioré la compréhension du PAR et révélé de nombreux nouveaux gènes et caractéristiques structurelles.

En comparant le PAR entre les deux souches de souris, les chercheurs ont noté des différences dans le contenu en gènes et la structure, indiquant que même de petites régions du génome peuvent présenter des variations significatives.

Inversions dans le Génome de la Souris

Les inversions sont des réarrangements dans le génome qui peuvent impacter la fonction et la régulation des gènes. Cette étude a identifié de nombreuses inversions entre les deux souches de souris, éclairant leurs origines et le rôle des séquences répétées dans la création de ces changements structurels.

Les chercheurs ont découvert que de nombreuses inversions étaient associées à de grands segments répétés, suggérant que ces segments pourraient jouer un rôle dans l'évolution et la fonction du génome.

Protéines à Doigt de Zinc KRAB

Les protéines à doigt de zinc KRAB (KZFPs) sont cruciales pour réguler l'expression génique. Les nouveaux assemblages ont considérablement amélioré la couverture de ces protéines, permettant une meilleure compréhension de leurs rôles dans le génome. Des différences dans le nombre et l'agencement des familles de KZFP ont été trouvées entre les deux souches, indiquant que ces régions sont soumises à des changements évolutifs.

Conclusion

Cette étude représente une avancée significative en génétique murine. En créant des génomes plus complets pour deux souches clés, les chercheurs ont ouvert la voie à de nouvelles investigations sur la génétique et les maladies. Ces génomes améliorés donnent une image plus claire des régions précédemment manquantes, enrichissant notre compréhension de la façon dont ces régions fonctionnent et évoluent.

Le travail offre une base pour de futures études qui exploreront les variations génétiques et leurs implications pour la santé et la maladie. Alors que les chercheurs continuent de s'appuyer sur ce travail, de nouvelles révélations sur les complexités de la génétique émergeront, bénéficiant finalement à notre compréhension des processus biologiques et du potentiel de développement de traitements pour les maladies.

Source originale

Titre: The structural diversity of telomeres and centromeres across mouse subspecies revealed by complete assemblies

Résumé: It is over twenty years since the publication of the C57BL/6J mouse reference genome, which has been a key catalyst for understanding mammalian disease biology. However, the mouse reference genome still lacks telomeres and centromeres, contains 281 chromosomal sequence gaps, and only partially represents many biomedically relevant loci. We present the first T2T mouse genomes for two key inbred strains, C57BL/6J and CAST/EiJ. These T2T genomes reveal significant variability in telomere and centromere sizes and structural organisation. We add an additional 213 Mbp of novel sequence to the reference genome containing 517 protein-coding genes. We examined two important but incomplete loci in the mouse genome - the pseudoautosomal region (PAR) on the sex chromosomes and KRAB zinc finger proteins (KZFPs) loci. We identified distant locations of the PAR boundary, different copy number and sizes of segmental duplications, and a multitude of amino acid substitution mutations in PAR genes.

Auteurs: Thomas M. Keane, B. Francis, L. Gozashti, K. Costello, T. Kasahara, O. S. Harringmeyer, J. Lilue, M. Helmy, T. Kato, A. Czechanski, M. Quail, I. Bonner, E. Dawson, A. F. Smith, L. Reinholdt, D. J. Adams

Dernière mise à jour: 2024-10-26 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.10.24.619615

Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.24.619615.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires

BioinformatiqueLa bibliothèque de médicaments GNPS : une nouvelle ressource pour la recherche sur les médicaments

Une bibliothèque complète vise à améliorer l'analyse de l'exposition aux médicaments et la compréhension de la santé.

Pieter C. Dorrestein, H. N. Zhao, K. E. Kvitne

― 11 min lire