Nouvelles perspectives sur la régulation des gènes et sa complexité
Des recherches montrent les doubles rôles des éléments régulateurs de gènes dans la santé et la maladie.
― 7 min lire
Table des matières
- Le Rôle des Facteurs de Transcription
- Avancées dans les Techniques de Recherche
- Prédiction des CRMs et de Leurs Fonctions
- Résultats Clés sur les Amplificateurs et Silencieux
- Importance des Marques Épigénétiques
- CRMs à Fonctionnalité Double
- L'Avenir de la Recherche Génomique
- Source originale
- Liens de référence
La plupart des génomes humains sont presque identiques, avec seulement une petite fraction montrant des différences. Ces petites différences dans notre ADN peuvent mener à des traits et des conditions de santé variés. Beaucoup de ces variations se trouvent dans des régions non codantes du génome, qui ne codent pas directement pour des protéines mais jouent un rôle essentiel dans la régulation des gènes.
Des études ont montré qu'un grand pourcentage de ces variations sont liées à des maladies ou des traits complexes. Les régions non codantes sont cruciales pour influencer comment les gènes sont activés ou désactivés. Cette régulation est généralement effectuée par des protéines appelées Facteurs de transcription qui se lient à des sites spécifiques dans ces régions, agissant comme des interrupteurs pour l'activité des gènes.
Le Rôle des Facteurs de Transcription
Les facteurs de transcription sont essentiels pour contrôler l'expression des gènes. Ils se lient à ce qu'on appelle des sites de liaison des facteurs de transcription (TFBS) dans des régions régulatrices du génome connues sous le nom de modules cis-régulateurs (CRMS). Les CRMs peuvent fonctionner comme des amplificateurs, des Silencieux, des promoteurs et des isolateurs, chacun ayant un rôle différent dans la régulation des gènes. Les amplificateurs augmentent l'expression des gènes, tandis que les silencieux l'empêchent.
Ces éléments régulateurs peuvent se comporter différemment selon le type de cellule ou les tissus spécifiques examinés. Par exemple, une région qui agit comme un amplificateur dans un type de cellule peut servir de silencieux dans un autre. Cette double fonctionnalité ajoute une couche de complexité à la façon dont les gènes s'expriment dans notre corps.
Avancées dans les Techniques de Recherche
Traditionnellement, les chercheurs étudiaient ces régions régulatrices en utilisant des méthodes laborieuses. Cependant, avec l'avènement des techniques modernes, il est devenu beaucoup plus facile d'examiner le génome dans son ensemble. Certaines de ces méthodes avancées incluent :
- ChIP-seq : Cette technique aide à identifier où les facteurs de transcription se lient à l'ADN.
- DNase-seq et ATAC-seq : Elles sont utilisées pour examiner comment différentes régions de l'ADN sont accessibles, ce qui indique où l'activité régulatrice se produit.
- Hi-C : Cette technologie aide les scientifiques à voir comment les parties du génome sont physiquement organisées et comment elles interagissent entre elles.
- RNA-seq : Cette méthode est utilisée pour mesurer l'activité de différents gènes en regardant l'ARN qu'ils produisent.
Ces méthodes génèrent une quantité énorme de données, permettant aux chercheurs de prédire où ces CRMs sont situés et leurs fonctions potentielles.
Prédiction des CRMs et de Leurs Fonctions
La plupart des méthodes actuelles pour prédire les emplacements et les fonctions des amplificateurs se concentrent sur l'intégration de plusieurs types de données, ce qui peut parfois entraîner de nombreux faux positifs. Cela signifie que les chercheurs pourraient identifier ce qui ressemble à des amplificateurs ou des silencieux qui ne fonctionnent pas réellement comme tels.
Des recherches récentes ont suggéré que, dans de nombreux cas, le lien des facteurs de transcription à leurs sites fournit des indications plus précises sur l'emplacement des CRMs que de se fier uniquement à l'accessibilité de la chromatine ou aux modifications des histones (qui sont des marqueurs d'activité dans le génome).
À la lumière de cela, une méthode a été développée pour prédire les CRMs en deux étapes. La première consiste à identifier où les CRMs sont situés dans le génome, créant ainsi une carte détaillée de ces régions. La seconde étape prédit leurs états fonctionnels (qu'ils soient actifs ou inactifs) en se basant sur quelques marqueurs clés.
Résultats Clés sur les Amplificateurs et Silencieux
Dans des analyses récentes, il a été découvert que les silencieux sont plus courants que ce que l'on pensait auparavant. Certaines régions peuvent agir comme des amplificateurs dans un contexte et comme des silencieux dans un autre. Une nouvelle approche a été utilisée pour prédire les états fonctionnels des CRMs, en prenant en compte la présence de marqueurs épigénétiques spécifiques.
Les résultats ont indiqué que de nombreuses régions sont actives comme amplificateurs ou silencieux, avec la possibilité que certaines régions puissent même remplir les deux fonctions dans différents contextes.
Pour valider davantage ces prédictions, les chercheurs ont comparé leurs résultats avec des bases de données connues de "silencieux validés". Il s'avère que beaucoup de ces silencieux validés chevauchent les régions prédites, renforçant la fiabilité des nouvelles méthodes de prédiction.
Marques Épigénétiques
Importance desLes marques épigénétiques jouent un rôle crucial dans la détermination des états d'activité des gènes. Différentes combinaisons de ces marques peuvent fournir des indices sur la probabilité qu'un élément régulateur agisse en tant qu'amplificateur ou silencieux. Dans la recherche, des marqueurs spécifiques ont été observés comme étant plus efficaces pour prédire ces états.
Dans une étude, il est devenu clair que certaines marques épigénétiques pouvaient prédire avec précision les états fonctionnels de silencieux putatifs. Un modèle de régression logistique a été utilisé pour évaluer ces prédictions, avec l'exactitude de ce modèle montrant des résultats prometteurs.
CRMs à Fonctionnalité Double
Fait intéressant, une part significative des CRMs a été identifiée comme ayant une fonctionnalité double, ce qui signifie qu'elles peuvent agir comme des amplificateurs ou des silencieux selon le contexte cellulaire. Parmi les CRMs prédites, un nombre notable fonctionnait activement dans au moins l'un des types cellulaires examinés.
Cette fonctionnalité double suggère une architecture régulatrice complexe dans le génome. De nombreux CRMs, lorsqu'ils sont analysés, présentaient des propriétés d'amplificateur et de silencieux qui se chevauchent. Les résultats suggèrent que ces CRMs à fonctionnalité double pourraient jouer des rôles critiques dans l'ajustement de l'expression des gènes à travers divers tissus et conditions.
L'Avenir de la Recherche Génomique
À mesure que la technologie progresse, plus de données seront disponibles provenant de divers types cellulaires. L'approche en deux étapes développée devrait révéler une carte encore plus détaillée des CRMs dans le génome. En utilisant les états fonctionnels prédites de ces CRMs avec les données d'expression des gènes, il devient de plus en plus possible d'identifier et de comprendre les gènes cibles régulés par ces CRMs.
Dans l'ensemble, les progrès dans ce domaine offrent de grandes promesses pour améliorer notre compréhension de la régulation génétique, ce qui pourrait mener à une meilleure compréhension des maladies et potentiellement à de nouvelles stratégies thérapeutiques. La complexité de la régulation des gènes est vaste, mais avec la recherche continue, nous pouvons continuer à dévoiler les mécanismes complexes de nos génomes.
Titre: Simultaneous Prediction of Functional States and Types of cis-regulatory Modules Reveals Their Prevalent Dual Uses as Enhancers and Silencers
Résumé: Our understanding of the precise locations of cis-regulatory elements (CRMs) in the genomes, as well as their functional types (enhancer or silencer), states (active or inactive) and target genes in various cell/tissue types of organisms remains limited, despite recent progresses. To address these challenges, we have recently developed a two-step strategy that first predicts a more complete map of CRMs in the genome, and then predicts the functional states of the CRMs. However, our initial approach lacked the ability to differentiate between the functional types of CRMs. Therefore, we utilized distinct features to simultaneously predict the functional types and states of the CRMs. Applying our method to 107 cell/tissue types with the minimum of required data available, we predicted 868,948 (73.8%) of the CRMs to be active as enhancers or silencers in at least one of these cell/tissue types. In 56 cell/tissue types with required data available for both enhancers and silencers, we predicted that 117,646 (14.8%) and 227,211 (28.6%) CRMs only functioned as enhancers (enhancer-predominant) and silencers (silencer-predominant), respectively, while 83,985 (10.6%) functioned both as enhancers and silencers (dual functional). Thus, both dual functional CRMs and silencers might be more prevalent than previously assumed. Most dual functional CRMs function either as enhancers or silencers in different cell/tissue types (Type I), while some have dual functions regulating different genes in the same cell/tissue types (Type II). Different types of CRMs display different lengths and TFBS densities, reflecting the complexity of their functions. Our two-step approach can accurately predict the functional types and states of CRMs using data of only five epigenetic marks in a cell/tissue type. Author SummaryCRMs function as enhancers and/or silencers to promote and repress, respectively, the transcription of genes in a spatiotemporal manner, thereby playing critical roles in virtually all biological processes. However, despite recent progress, the understanding of CRMs remains limited. Most existing methods are aimed to simultaneously predict the locations and functional states of enhancers in a given cell/tissue type, however, the accuracy of these one-step methods is low. We have recently developed a two-step strategy that first predicts locations of CRMs in the genome, and then predicts their functional states as enhancers in cell/tissue types with high accuracy. However, our initial approach was unable to differentiate between enhancers and silencers. Therefore, in this study, we employ two machine-learning models, so that we can simultaneously predict the functional states and types of our previously predicted 1.2M CRMs in various cell/tissue types. Applying the method to cell/tissue types with the data available, we categorize the CRMs into four types with distinct properties reflecting their functional complexity. Our results indicate that silencers and dual functional CRMs might be more prevalent than previously assumed. The precise prediction of CRM types and states provides opportunities to pinpoint their target genes, thus opening new avenues for research.
Auteurs: Zhengchang Su, S. Yuan, P. Ni
Dernière mise à jour: 2024-05-10 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.05.07.592879
Source PDF: https://www.biorxiv.org/content/10.1101/2024.05.07.592879.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.