Avancées dans la recherche sur les protéines liant l'ARN
De nouvelles données améliorent notre compréhension des protéines liant l'ARN et de leurs rôles à travers les espèces.
― 6 min lire
Table des matières
Les Protéines liant l'ARN (RBP) sont des molécules importantes dans les cellules qui s'attachent à l'ARN, la molécule qui transporte l'information génétique. Elles jouent un rôle clé après la première étape de l'expression génique, aidant à contrôler ce qui arrive à l'ARN. Les RBP peuvent influencer l'épissage de l'ARN (le processus d'édition de l'ARN avant son utilisation), décider où va l'ARN dans la cellule, et déterminer s'il sera traduit en protéine ou détruit.
Les RBP reconnaissent des séquences ou des structures spécifiques dans l'ARN. Cette capacité est souvent caractérisée par des outils mathématiques appelés motifs, qui aident à prédire la probabilité qu'une certaine séquence d'ARN se lie à une RBP spécifique.
Connaissances Actuelles et Limites
La plupart de ce qu'on sait sur le fonctionnement des RBP se concentre sur un nombre limité de protéines bien étudiées et d'organismes spécifiques, principalement des mammifères et des mouches des fruits. Une très petite fraction de toutes les RBP dans des formes de vie plus complexes, comme les plantes et les champignons, dispose de données sur leur liaison à l'ARN.
Pour relier les RBP qui partagent des séquences similaires, les scientifiques utilisent des règles d'homologie. Cela signifie que les RBP avec des séquences d'acides aminés similaires dans leurs parties de liaison ont tendance à se comporter de la même manière en ce qui concerne leur liaison à l'ARN. Cependant, beaucoup de RBP moins étudiées ne partagent pas suffisamment de similitude avec une RBP pour laquelle des données de liaison sont connues.
Parmi les différents types de RBP, le motif de reconnaissance de l'ARN (RRM) est l'un des plus courants. Un autre type, le domaine K-homologie (KH), est également fréquemment trouvé. La capacité de ces domaines à s'adapter et à changer dans leur liaison est probablement une raison de leur succès au fil du temps. Cependant, il reste flou comment ces protéines ont évolué pour avoir des compétences spécifiques de liaison à l'ARN.
Améliorer les Prédictions de Liaison
Les chercheurs cherchent maintenant des moyens d'améliorer les modèles qui prédisent comment les RBP reconnaissent l'ARN. Les méthodes traditionnelles se sont appuyées sur la similarité des séquences mais ne tiennent peut-être pas pleinement compte de la complexité des interactions entre l'ARN. De nouvelles approches incluent l'utilisation de modèles de "code de reconnaissance", qui relient des parties spécifiques de la protéine à ses capacités de liaison à l'ARN.
Une nouvelle méthode en développement est l'"Emballage Conjoint Protéine-Ligand" (JPLE). Cette technique apprend des motifs en examinant de courtes séquences d'acides aminés dans les RBP et leurs profils de liaison correspondants à l'ARN. En s'entraînant sur des données de liaison existantes, JPLE vise à étendre ses prédictions à un plus large éventail de RBP, y compris celles qui n'ont pas encore été étudiées.
Générer de Nouvelles Données
Pour surmonter les limites des études précédentes, de nouvelles données ont été rassemblées pour 174 RBP provenant de divers organismes. En utilisant JPLE, les chercheurs ont développé un algorithme qui crée des modèles basés sur ces nouvelles découvertes. En combinant ces nouvelles données avec des données existantes, ils ont pu attribuer des spécificités de liaison à l'ARN à un grand nombre de RBP qui n'avaient pas été caractérisées auparavant.
En analysant des ARN d'environ 690 organismes eucaryotes, ils ont réussi à reconstruire des motifs de liaison à l'ARN pour des milliers de RBP. Cet effort a abouti à la création d'une ressource appelée EuPRI, qui contient une liste complète de motifs de liaison à l'ARN diversifiés.
Aperçus des Données de Liaison à l'ARN
La recherche a révélé que les motifs d'ARN, qui sont des séquences spécifiques que les RBP reconnaissent, ne sont pas distribués uniformément entre les espèces. Par exemple, beaucoup de motifs d'ARN sont apparus récemment chez les organismes multicellulaires, surtout dans des groupes spécifiques comme les plantes à fleurs et les nématodes. Ces résultats suggèrent que les RBP dans différents organismes peuvent évoluer rapidement selon leurs besoins environnementaux.
Prédire les Fonctions des RBP
Avec les nouvelles données, les scientifiques ont pu prédire les rôles des RBP dans la régulation de la Stabilité de l'ARN chez les plantes, en particulier chez Arabidopsis thaliana, un organisme modèle pour les études sur les plantes. En analysant comment différentes RBP se corrèlent avec la stabilité de l'ARN à travers différents types de tissus, ils ont pu identifier celles qui jouent des rôles importants dans la stabilisation ou la déstabilisation des molécules d'ARN.
Cette analyse a révélé 12 RBP qui affectent la stabilité de l'ARNm, certaines stabilisant et d'autres déstabilisant l'ARN associé. Cela illustre un réseau régulateur complexe chez les plantes, où la même séquence d'ARN peut avoir différents résultats de stabilité en fonction de la RBP qui y est liée.
L'Importance de la Nouvelle Ressource
La nouvelle ressource, EuPRI, représente une avancée significative dans la compréhension de comment les RBP fonctionnent à travers de nombreuses espèces. Elle offre une collection complète de motifs de liaison et permet aux chercheurs d'étudier les divers rôles des RBP dans la régulation de l'ARN. De plus, cette ressource pourrait potentiellement aider dans les recherches liées aux maladies causées par des mutations dans les RBP ou leurs ARNs cibles.
La méthode JPLE s'est avérée efficace pour attribuer des motifs d'ARN à un large éventail de RBP, augmentant significativement le nombre de spécificités connues. Cette approche contraste avec d'autres méthodes plus complexes, la rendant accessible et efficace pour les chercheurs.
Implications pour la Recherche Future
Avec EuPRI et JPLE, les chercheurs peuvent explorer des questions sur l'évolution et la fonction des RBP de manière plus approfondie. Les découvertes soulèvent d'importantes questions sur comment différentes RBP se sont adaptées au fil du temps, comment elles contribuent aux processus cellulaires, et comment elles peuvent être ciblées à des fins thérapeutiques.
En comprenant mieux ces protéines, les scientifiques peuvent également obtenir des perspectives sur l'évolution de la régulation de l'ARN, le développement d'organismes multicellulaires, et les relations entre différentes formes de vie.
En conclusion, le développement de nouvelles ressources de données et de modèles pave la voie à des études plus complètes des RBP. Ce travail est crucial pour faire avancer notre compréhension de la régulation post-transcriptionnelle et des interactions complexes entre protéines et ARN dans divers contextes biologiques.
Titre: Reconstructing the sequence specificities of RNA-binding proteins across eukaryotes
Résumé: RNA-binding proteins (RBPs) are key regulators of gene expression. Here, we introduce EuPRI (Eukaryotic Protein-RNA Interactions) - a freely available resource of RNA motifs for 34,736 RBPs from 690 eukaryotes. EuPRI includes in vitro binding data for 504 RBPs, including newly collected RNAcompete data for 174 RBPs, along with thousands of reconstructed motifs. We reconstruct these motifs with a new computational platform -- Joint Protein-Ligand Embedding (JPLE) -- which can detect distant homology relationships and map specificity-determining peptides. EuPRI quadruples the number of known RBP motifs, expanding the motif repertoire across all major eukaryotic clades, and assigning motifs to the majority of human RBPs. EuPRI drastically improves knowledge of RBP motifs in flowering plants. For example, it increases the number of Arabidopsis thaliana RBP motifs 7-fold, from 14 to 105. EuPRI also has broad utility for inferring post-transcriptional function and evolutionary relationships. We demonstrate this by predicting a role for 12 Arabidopsis thaliana RBPs in RNA stability and identifying rapid and recent evolution of post-transcriptional regulatory networks in worms and plants. In contrast, the vertebrate RNA motif set has remained relatively stable after its drastic expansion between the metazoan and vertebrate ancestors. EuPRI represents a powerful resource for the study of gene regulation across eukaryotes.
Auteurs: Quaid Morris, A. Sasse, D. Ray, K. U. Laverty, C. L. Tam, M. Albu, H. Zheng, O. Lyudovyk, T. Dalal, K. Nie, C. Magis, C. Notredame, M. T. Weirauch, T. R. Hughes
Dernière mise à jour: 2024-10-18 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.10.15.618476
Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.15.618476.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.