Riboswitches : Petits interrupteurs en ARN avec un grand impact
Découvrez comment les riboswitches contrôlent la production de protéines dans les cellules et leurs implications potentielles sur la santé.
William S. Raymond, Jacob DeRoo, Brian Munsky
― 7 min lire
Table des matières
- Comment ça marche, un Riboswitch ?
- Où trouve-t-on des Riboswitches ?
- Pourquoi les Riboswitches sont-ils importants ?
- Comment les scientifiques trouvent des Riboswitches ?
- Le Rôle de l'Apprentissage Machine dans la Découverte des Riboswitches
- Construction du Modèle
- Les Résultats
- Qu'est-ce qui rend ces candidats Riboswitch spéciaux ?
- Ontologie Génétique : Que signifient les Hits ?
- Implications potentielles pour la santé
- Conclusion
- Prochaines Étapes dans la Recherche sur les Riboswitches
- Source originale
- Liens de référence
Un riboswitch, c'est une partie spéciale de l'ARN qui fonctionne comme un interrupteur pour contrôler certains processus dans une cellule. Pense à ça comme un interrupteur de lumière qui peut être allumé ou éteint selon qu'une petite molécule spécifique est présente ou non. Quand cette petite molécule se fixe au riboswitch, elle peut changer la forme de l'ARN. Ce changement peut soit révéler soit cacher des parties de l'ARN qui sont importantes pour fabriquer des Protéines. Le riboswitch peut donc contrôler combien de protéines sont produites, ce qui influence différentes fonctions dans la cellule.
Comment ça marche, un Riboswitch ?
Les Riboswitches ont deux formes principales. Quand la petite molécule est absente, le riboswitch peut être dans une forme qui permet à la cellule de fabriquer une certaine protéine. Mais quand la petite molécule arrive et se lie au riboswitch, il change de forme. Cette nouvelle forme peut stopper la production de protéines ou la laisser se poursuivre, selon la situation. C'est comme passer du jeu à la sieste - ce que tu fais dépend des circonstances !
Où trouve-t-on des Riboswitches ?
On trouve surtout des riboswitches chez les bactéries (prokaryotes), où ils peuvent contrôler environ 40 Petites molécules différentes. Cependant, chez des organismes plus complexes comme les plantes et les animaux (eucaryotes), les riboswitches sont moins fréquents. Les quelques-uns qui ont été trouvés chez les plantes réagissent généralement à une molécule appelée thiamine pyrophosphate (TPP). Chez les humains, ils sont moins bien étudiés, ce qui amène les scientifiques à se demander s'il existe des riboswitches cachés en attente d'être découverts.
Pourquoi les Riboswitches sont-ils importants ?
Les riboswitches peuvent avoir de grandes implications pour la santé et les maladies. Si un riboswitch ne fonctionne pas bien, cela pourrait entraîner trop ou pas assez de protéines produites. Cela peut contribuer à des maladies, soit en produisant une quantité nuisible d'une protéine, soit en ne produisant pas assez d'une protéine nécessaire. Donc, comprendre les riboswitches pourrait aider les scientifiques à en apprendre plus sur certaines maladies et potentiellement trouver de nouveaux traitements.
Comment les scientifiques trouvent des Riboswitches ?
La recherche sur les riboswitches est en cours depuis leur découverte en 2002. Les scientifiques ont développé différentes méthodes pour les identifier, y compris des programmes informatiques qui peuvent prédire où les riboswitches pourraient se trouver dans les séquences d'ARN. Ces programmes utilisent souvent des techniques avancées, y compris l'apprentissage machine, pour analyser d'énormes quantités d'informations génétiques.
Le Rôle de l'Apprentissage Machine dans la Découverte des Riboswitches
Récemment, les scientifiques ont commencé à utiliser l'apprentissage machine pour aider à trouver des riboswitches. L'apprentissage machine utilise des algorithmes pour apprendre des données et faire des prédictions sur de nouvelles données. Dans ce cas, les chercheurs ont entraîné des modèles informatiques en utilisant des séquences de riboswitches connues pour aider à identifier de nouveaux riboswitches potentiels dans les séquences d'ARN humain.
Ils ont rassemblé beaucoup de séquences de riboswitches et de séquences d'ARN humain pour créer un modèle qui pouvait classer de nouvelles séquences comme étant probablement ou peu susceptibles d'être des riboswitches. Le modèle a ensuite été testé pour voir à quel point il pouvait prédire des riboswitches qu'il n'avait pas encore vus.
Construction du Modèle
Les scientifiques ont collecté un énorme répertoire de séquences de riboswitches provenant de diverses bases de données, nettoyant et organisant les données pour les rendre utiles pour l'entraînement. Ils ont ensuite extrait de nombreuses caractéristiques des séquences d'ARN, comme leur longueur, leur structure et d'autres caractéristiques.
Ensuite, ils ont créé plusieurs classificateurs d'apprentissage machine - pense à ces derniers comme des détectives numériques entraînés pour reconnaître les riboswitches d'après des exemples précédents. Ils ont validé ces classificateurs en les testant sur des séquences soigneusement sélectionnées pour s'assurer qu'elles n'avaient pas été utilisées lors de l'entraînement.
Les Résultats
Après avoir exécuté leurs modèles, les chercheurs ont trouvé plusieurs séquences dans l'ARN humain qui semblaient prometteuses en tant que riboswitches potentiels. Ils ont identifié 436 séquences sur lesquelles tous les classificateurs étaient d'accord, suggérant qu'elles étaient de probables candidates pour abriter des caractéristiques de riboswitches.
De plus, ils ont remarqué qu'un plus grand ensemble de 1 533 séquences montrait également des propriétés de riboswitch, bien que celles-ci aient été identifiées par seulement un sous-ensemble de classificateurs. Cette découverte a donné aux scientifiques un bon point de départ pour de futures investigations expérimentales.
Qu'est-ce qui rend ces candidats Riboswitch spéciaux ?
Les séquences identifiées partageaient de nombreuses caractéristiques avec des riboswitches connus. Les chercheurs ont examiné de plus près ces hits pour évaluer leurs caractéristiques, et ils ont même mis en place une présentation en ligne pour comparer ces riboswitches potentiels avec des séquences connues. Cette approche aide non seulement à organiser l'information, mais facilite également l'exploration de ces découvertes par d'autres chercheurs.
Ontologie Génétique : Que signifient les Hits ?
Les chercheurs ont également réalisé une analyse de l'Ontologie Génétique (GO) sur les hits des 5' UTR pour comprendre quelles fonctions ces riboswitches potentiels pourraient impacter. Ils ont découvert que beaucoup des protéines liées aux hits étaient impliquées dans des processus essentiels comme la régulation des gènes, le traitement de l'ARNm, et même la détection de signaux chimiques. Cela suggère que ces riboswitches pourraient jouer des rôles importants dans la réponse aux petites molécules à l'intérieur de la cellule.
Implications potentielles pour la santé
L'identification de ces séquences ressemblant à des riboswitches ouvre la voie à des travaux futurs importants. Si l'une des séquences découvertes se comporte réellement comme un riboswitch, cela pourrait donner un aperçu de la manière dont les cellules se régulent dans différentes conditions. Par exemple, les riboswitches pourraient être des acteurs clés dans les maladies où la régulation normale des protéines est perturbée.
Conclusion
L'étude des riboswitches représente une occasion passionnante pour les scientifiques de comprendre comment les cellules contrôlent divers processus. L'utilisation de l'apprentissage machine et d'outils informatiques a prouvé être un moyen innovant de trier d'énormes quantités de données génétiques, révélant de nouveaux candidats pour les riboswitches. Bien qu'il reste encore beaucoup de travail à faire - comme valider ces découvertes à travers des expériences - la technologie et les méthodes utilisées ouvrent la voie à une compréhension plus approfondie de la génétique et de la fonction cellulaire. Qui aurait cru que de minuscules nucléotides puissent avoir un potentiel aussi énorme ?
Prochaines Étapes dans la Recherche sur les Riboswitches
Alors que les chercheurs continuent d'explorer les riboswitches, ils visent à réaliser plus d'expériences pour valider les prévisions computationnelles. En étudiant ces riboswitches, les scientifiques espèrent découvrir leurs rôles dans divers processus biologiques et maladies.
En outre, la recherche future s'étendra probablement à d'autres domaines de la biologie de l'ARN, y compris l'exploration des riboswitches chez différents organismes et comment ils peuvent être manipulés à des fins thérapeutiques.
Avec les avancées technologiques continuelles et une appréciation croissante pour la complexité de l'ARN, le monde des riboswitches va sûrement offrir encore plus de surprises. Restez à l'écoute ; qui sait quels autres secrets ce petit monde de l'ARN a en réserve !
Titre: Identification of potential riboswitch elements in Homo Sapiens mRNA 5'UTR sequences using Positive-Unlabeled Machine learning
Résumé: Riboswitches are a class of noncoding RNA structures that interact with target ligands to cause a conformational change that can then execute some regulatory purpose within the cell. Riboswitches are ubiquitous and well characterized in bacteria and prokaryotes, with additional examples also being found in fungi, plants, and yeast. To date, no purely RNA-small molecule riboswitch has been discovered in Homo Sapiens. Several analogous riboswitch-like mechanisms have been described within the H. Sapiens translatome within the past decade, prompting the question: Is there a H. Sapiens riboswitch dependent on only small molecule ligands? In this work, we set out to train positive unlabeled machine learning classifiers on known riboswitch sequences and apply the classifiers to H. Sapiens mRNA 5UTR sequences found in the 5UTR database, UTRdb, in the hope of identifying a set of mRNAs to investigate for riboswitch functionality. 67,683 riboswitch sequences were obtained from RNAcentral and sorted for ligand type and used as positive examples and 48,031 5UTR sequences were used as unlabeled, unknown examples. Positive examples were sorted by ligand, and 20 positive-unlabeled classifiers were trained on sequence and secondary structure features while withholding one or two ligand classes. Cross validation was then performed on the withheld ligand sets to obtain a validation accuracy range of 75%-99%. The joint sets of 5UTRs identified as potential riboswitches by the 20 classifiers were then analyzed. 15333 sequences were identified as a riboswitch by one or more classifier(s) and 436 of the H. Sapiens 5UTRs were labeled as harboring potential riboswitch elements by all 20 classifiers. These 436 sequences were mapped back to the most similar riboswitches within the positive data and examined. An online database of identified and ranked 5UTRs, their features, and their most similar matches to known riboswitches, is provided to guide future experimental efforts to identify H. Sapiens riboswitches. Author summaryRiboswitches are an important regulatory element mostly found in bacteria that have not been described in Homo Sapiens. However, if human riboswitches exist and if they can be found, they could have vast implications on human disease. We apply positive-unlabeled machine learning to on known riboswitch sequences to search H. Sapiens 5UTR sequences for potential riboswitches. We analyze our ensemble predictions for likely H. Sapiens 5UTR riboswitches using GO analysis to determine their potential functional roles, and we rank and display our predicted sequences next to the most similar known riboswitches. We expect these analyses to be helpful to the scientific community in planning future experiments for laboratory discovery and validation. 0.1 Graphical Abstract O_FIG O_LINKSMALLFIG WIDTH=200 HEIGHT=169 SRC="FIGDIR/small/568398v2_ufig1.gif" ALT="Figure 1"> View larger version (55K): [email protected]@10f085corg.highwire.dtl.DTLVardef@1edfcaborg.highwire.dtl.DTLVardef@1674ce0_HPS_FORMAT_FIGEXP M_FIG C_FIG
Auteurs: William S. Raymond, Jacob DeRoo, Brian Munsky
Dernière mise à jour: 2024-12-06 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2023.11.23.568398
Source PDF: https://www.biorxiv.org/content/10.1101/2023.11.23.568398.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.