Lier des variants génétiques à l'activité des gènes
Cette étude montre comment les variants génétiques interagissent avec les gènes via des mécanismes régulatoires.
― 9 min lire
Table des matières
- L'Importance des Éléments Régulateurs
- Une Étude sur les eQTL et leurs Connexions
- Identification d'une Petite Portion d'EQTLs Importants
- Influence de la Chromatine et Expression Génétique
- L'Impact des Éléments Régulateurs
- Insights sur les Fonctions Spécifiques aux Tissus
- Validation des Résultats
- Exploration des eQTLs Non-Physiques
- Une Nouvelle Méthode de Prédiction
- Conclusion
- Source originale
Les études d'association à l'échelle du génome (GWAS) regardent comment différentes variantes génétiques sont liées à divers traits et maladies. Souvent, ces études trouvent plein de changements génétiques qui pourraient être en rapport avec des conditions complexes. Mais souvent, c'est pas clair quelles de ces variations sont directement responsables des traits ou des maladies. Ce manque de compréhension rend difficile de voir comment ces changements génétiques impactent les fonctions biologiques et mènent à des problèmes de santé.
Beaucoup de variantes génétiques sont souvent proches les unes des autres sur la chaîne d'ADN, ce qui peut embrouiller les chercheurs. Ils pourraient penser à tort que plusieurs variantes influencent un trait juste parce qu'elles sont toutes près de la vraie variante qui affecte le trait. La plupart de ces variantes ont juste de petits effets toutes seules, rendant difficile l'identification des vraies variantes clés qui jouent le rôle le plus important dans une condition.
Des méthodes statistiques peuvent aider à réduire le nombre de variantes qui pourraient être responsables d'un trait, mais ces méthodes ont besoin de données énormes pour être efficaces. Même avec des études de grande taille, les chercheurs ne peuvent généralement pas résoudre les effets à des variantes individuelles. Une grande majorité de ces changements génétiques se trouvent dans des zones non codantes de l'ADN, qui ne codent pas directement pour des protéines mais peuvent tout de même influencer l'activité des gènes. Ça rend difficile de pointer du doigt les gènes spécifiques qui sont touchés par ces variantes.
Des expériences en laboratoire peuvent montrer comment des variantes génétiques liées à des éléments régulateurs impactent des gènes cibles, mais ce genre d'expériences ne traite souvent que de petits échantillons. Des approches plus complètes sont nécessaires pour découvrir les relations fonctionnelles entre les variantes génétiques et les maladies auxquelles elles peuvent contribuer.
L'Importance des Éléments Régulateurs
Des recherches ont montré que beaucoup de variantes liées au risque de maladie se trouvent dans des éléments régulateurs qui ne fonctionnent que dans des types cellulaires spécifiques. Ça met en avant le rôle important que ces variantes non codantes jouent en génétique. Toutefois, lier ces éléments régulateurs à leurs gènes cibles est toujours délicat, car certains éléments peuvent affecter des gènes éloignés, rendant souvent les méthodes simples de cartographie inefficaces.
Des techniques récentes ont révélé que des éléments non codants liés aux maladies peuvent se connecter à leurs gènes cibles à travers des interactions à longue distance dans la structure de l'ADN. Ça suggère que des variantes dans des régions non codantes peuvent influencer l'activité des gènes de manière complexe qui nécessite des cartes détaillées de ces interactions pour être comprises pleinement.
Bien que certaines analyses puissent montrer des connexions entre les variations génétiques et les gènes cibles, elles ratent souvent beaucoup d'interactions à travers le génome. Combiner ces différentes approches peut donner une vue plus complète de comment les variantes génétiques affectent l'activité des gènes en montrant les connexions physiques dans l'ADN.
Une Étude sur les eQTL et leurs Connexions
Dans cette étude, les chercheurs ont développé une nouvelle méthode pour joindre les données génétiques avec des données d'interaction physique pour lier des variantes génétiques à leurs gènes cibles. Ils se sont concentrés sur des variantes qui montraient à la fois des interactions génétiques et physiques, car celles-ci sont susceptibles d'être fonctionnellement importantes. Leurs résultats indiquent que les variantes fortement connectées à leurs gènes cibles ont tendance à se trouver dans les mêmes régions d'ADN, renforçant leur rôle en tant qu'éléments régulateurs significatifs.
L'analyse fonctionnelle a montré que ces variantes prioritaires se trouvent souvent dans des régions régulatrices actives, qui sont enrichies en sites de liaison spécifiques pour les Facteurs de transcription importants pour des fonctions spécifiques aux tissus. De plus, ces variantes sont significativement plus communes dans des variantes causales déjà identifiées, qui sont liées à des maladies dans d'autres études, ce qui indique leur pertinence dans la compréhension des contributions génétiques aux maladies.
En plus, des expériences en laboratoire utilisant des méthodes avancées de CRISPR ont confirmé les connexions faites par ce nouveau pipeline computationnel, soutenant l'exactitude des prédictions sur les relations variante-gène.
EQTLs Importants
Identification d'une Petite Portion d'Les chercheurs ont examiné des données provenant de divers tissus pour identifier des associations entre des variantes génétiques et leurs gènes correspondants. Ils ont découvert qu'un segment relativement petit de ces variantes était impliqué dans des Interactions physiques directes avec leurs gènes cibles. Cette portion représentait environ 11 % à 16 % de toutes les interactions identifiées entre variantes et gènes, mettant en avant le défi d'identifier celles qui sont vraiment influentes dans l'ensemble.
Parmi celles qui étaient impliquées, il y avait une préférence notable pour qu'elles résident dans les mêmes domaines structurels d'ADN. C'est crucial parce que les éléments qui fonctionnent ensemble le font généralement dans des zones confinées qui renforcent leurs interactions.
Influence de la Chromatine et Expression Génétique
L'étude a aussi exploré comment les interactions physiques entre les eQTL et leurs gènes associés se rapportent aux états de la chromatine, qui indiquent l'accessibilité de l'ADN pour les processus régulateurs. Les chercheurs ont trouvé que les eGènes fortement associés à des eQTLs physiques avaient des niveaux d'expression significativement plus élevés, particulièrement lorsque l'eQTL était dans un état de chromatine actif.
Ça suggère que l'arrangement structurel de l'ADN joue un rôle essentiel dans la détermination des niveaux d'expression des gènes. Une expression accrue était liée à des eQTLs qui se trouvent dans des zones avec des caractéristiques régulatrices actives, tandis que des eQTLs non impliqués dans des interactions physiques n'ont pas montré le même niveau d'influence sur l'expression des gènes.
L'Impact des Éléments Régulateurs
Étant donné que les eQTLs physiques étaient enrichis dans une chromatine active, les chercheurs voulaient comprendre s'ils pouvaient perturber des sites régulatoires importants. Ils ont examiné si ces eQTLs étaient plus susceptibles de chevaucher des régions indiquant une chromatine ouverte et des activateurs actifs. Leur analyse a montré que les eQTLs avaient effectivement une plus grande présence dans ces zones actives comparées à celles qui n'avaient pas d'interactions physiques avec les gènes cibles.
Ils ont également regardé les sites de liaison des protéines qui régulent l'ADN, comme les facteurs de transcription, pour voir si les eQTLs affectaient ces sites. Les chercheurs ont trouvé que les eQTLs interagissant avec des protéines liant l'ADN pourraient potentiellement perturber les mécanismes régulatoires d'une manière qui pourrait entraîner des changements dans l'expression des gènes.
Insights sur les Fonctions Spécifiques aux Tissus
L'étude a montré que les eQTLs ont souvent des motifs spécifiques liés à des facteurs de transcription qui sont uniques à certains tissus. En comparant ces motifs à travers différents tissus, les chercheurs pouvaient voir comment les eQTLs pourraient influencer l'expression des gènes de manière unique dans chaque type de tissu.
Par exemple, ils ont identifié des motifs significatifs dans des tissus liés au sang qui étaient associés à des fonctions immunitaires, tandis que des motifs distincts dans le tissu pulmonaire étaient liés à des processus de développement pertinents pour ces cellules. Ça suggère que les eQTLs peuvent guider l'expression des gènes d'une manière qui est critique pour des fonctions biologiques spécifiques dans différents tissus.
Validation des Résultats
Pour s'assurer de l'exactitude de leurs prédictions, les chercheurs ont utilisé des données expérimentales provenant d'études CRISPR pour valider leurs découvertes. Ils ont pointé des cas où les eQTLs qu'ils avaient identifiés comme interagissant physiquement avec des gènes spécifiques étaient cohérents avec des données expérimentales réelles. Cette couche supplémentaire de confirmation a renforcé la confiance dans leurs prédictions.
Exploration des eQTLs Non-Physiques
L'étude visait aussi à découvrir ce qui se passe avec les eQTLs qui n'ont pas d'interactions physiques directes avec leurs gènes associés. Ils ont proposé que ces eQTLs pourraient tout de même influencer l'expression des gènes par des voies alternatives. Leur analyse a révélé qu'un nombre significatif de ces eQTLs avait des interactions potentielles avec d'autres régions régulatrices, ouvrant ainsi de nouvelles avenues pour explorer leurs effets sur la régulation des gènes.
Une Nouvelle Méthode de Prédiction
Les chercheurs ont mentionné leur nouvelle méthode, qui utilise les interactions découvertes grâce à leur approche, pour prédire comment les activateurs et les gènes se connectent. Ils ont comparé cette nouvelle méthode à des modèles traditionnels et ont trouvé que leur approche était plus efficace, particulièrement pour prédire des interactions à longue distance.
Conclusion
En résumé, cette étude offre des aperçus précieux sur comment les variantes génétiques se lient à leurs gènes cibles à travers des mécanismes régulateurs. En intégrant des données génétiques avec des données d'interaction chromatine et en utilisant des méthodes computationnelles novatrices, les chercheurs ont pu dévoiler les complexités de la régulation génétique. Leurs résultats non seulement enrichissent la compréhension de l'expression des gènes, mais ouvrent également de nouvelles possibilités pour explorer la base génétique des maladies.
Titre: A New Approach for Discovering Functional Links Connecting Non-Coding Regulatory Variants to Gene Targets
Résumé: Genome-wide association studies (GWAS) have linked thousands of genetic variants to various complex traits or diseases. However, most identified variants have weak individual effects, are correlated with nearby polymorphisms due to linkage disequilibrium (LD), and are located in non-coding cis-regulatory elements (CREs). These characteristics complicate the assessment of the direct impact of each variant on tissue specific gene expression and phenotype. To address this challenge, we have developed a novel algorithm that leverages polymer folding and 3D chromatin interactions to prioritize and identify putative causal variants and their target genes. From the millions of eQTL-Gene pairs identified by GTEx in human somatic tissues, we classify only [~]10-20% as putative functional eQTL-Gene pairs supported by phenotypic associations confirmed through CRISPR deletion experiments. Our findings show that unlike most variants, functional eQTL-Gene pairs predominantly reside within the same topologically associating domain (TAD) and have strong associations with cell-type specific cis-regulatory elements (CREs), enriched for binding sites of tissue-specific transcription factors. Unlike most approaches that rely on linear distance or other chromatin features (histone code, accessibility), our algorithm emphasizes the importance of physical interactions and 3D chromatin folding in gene regulation, as the identified eQTL-Gene pairs are all among the small fraction of physical chromatin interactions sufficient for chromatin locus folding. Overall, our algorithm reduces false positive associations between DNA variants and genes identified by eQTL analysis and uncovers novel variant-gene pair associations. These findings suggest a mechanism where a small number of regulatory variants control tissue specific gene expression via their physical association with target genes confined within the same TAD. Our approach provides new insights into the molecular mechanisms driving GWAS phenotypes.
Auteurs: Jie Liang, H. Farooq, L. Du, P. Delafrouz, W. Jiang, C. Chronis
Dernière mise à jour: 2024-06-14 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.06.13.598913
Source PDF: https://www.biorxiv.org/content/10.1101/2024.06.13.598913.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.