Les voies de l'évolution des protéines
Découvre comment les protéines évoluent grâce à des petits changements et des connexions.
Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta
― 8 min lire
Table des matières
- Le Mystère de l'Évolution des Protéines
- Le Langage des Séquences de Protéines
- Créer des Chemins entre les Protéines
- Le Road Trip des Protéines
- Homologues Évidents : Proches Parents
- Homologues Lointains : Arbres Généalogiques Plus Compliqués
- Homologues Spéculatifs : Les Cousins Mystères
- Les Défis de Trouver des Chemins
- Mesurer la Forme le Long du Chemin
- Comparer Différents Chemins
- Leçons Apprises
- Conclusion : La Route à Venir
- Source originale
Les Protéines, c'est un peu les chevaux de bataille de nos cellules. Elles font plein de trucs importants comme décomposer la nourriture, envoyer des signaux et donner leur forme aux cellules. Faits de chaînes d’acides aminés, les protéines prennent des formes uniques qui déterminent ce qu’elles peuvent faire. Pense à elles comme des machines complexes ; si tu changes une pièce, tu pourrais obtenir un résultat différent.
Le Mystère de l'Évolution des Protéines
Alors, imagine l'évolution comme une longue route sinueuse pleine de détours. Avec le temps, les protéines peuvent changer leurs séquences à cause de petites Mutations, un peu comme des bosses sur la route. Certaines protéines peuvent finir par avoir l'air et se comporter très différemment après avoir pris plein de détours, tandis que d'autres peuvent rester assez similaires, même après un long chemin.
Mais voilà le problème : comment les scientifiques font-ils pour savoir comment ces protéines sont liées, surtout si elles ressemblent à de lointains cousins ? C'est là que ça devient compliqué !
Le Langage des Séquences de Protéines
Tout comme chaque langue a sa propre grammaire, les protéines ont un moyen de "parler" à travers leurs séquences. Les scientifiques ont développé des outils pour comprendre cette langue. Un outil populaire est un modèle de langage des protéines, qui aide à deviner comment une protéine doit se plier et fonctionner en fonction de sa séquence d'acides aminés.
Ce modèle agit en gros comme un traducteur, essayant de voir comment différentes séquences se relient entre elles. Donc, si tu as deux protéines qui semblent assez différentes, ce modèle cherche des connexions qui pourraient ne pas être évidentes au premier coup d'œil.
Créer des Chemins entre les Protéines
Voici une idée sympa : que dirais-tu qu’on puisse créer des chemins entre les protéines, comme relier des points entre deux endroits ? C'est exactement ce que les scientifiques essaient de faire ! En faisant de petits changements, comme échanger un Acide aminé pour un autre, il est possible de voir comment une protéine pourrait théoriquement évoluer d'une forme à une autre.
Imagine que tu joues à un jeu où tu changes une lettre dans un mot pour créer un autre mot – mais avec des protéines ! Au lieu de mots, tu as des séquences d'acides aminés, et le but est de continuer à créer des mutations viables jusqu'à atteindre la protéine désirée.
Le Road Trip des Protéines
Prenons une analogie de road trip. Si tu commences à partir d'une protéine (appelons-la Protéine A) et que tu veux atteindre la Protéine B, tu ne peux faire que de petits ajustements (ou mutations) en cours de route. Chaque fois que tu fais un changement, tu veux garantir que ta nouvelle protéine fonctionne toujours, comme s'assurer que la voiture ne tombe pas en panne en plein milieu de ton road trip.
Pour rendre ce road trip intéressant, les scientifiques ont inventé quelque chose appelé une "recherche par faisceau". C'est comme utiliser un GPS qui ne te guide pas seulement vers le chemin le plus rapide mais qui vérifie aussi si ta voiture (ou protéine) peut encore rouler en douceur à chaque arrêt. Cela aide à trouver les meilleurs chemins à travers le paysage des protéines.
Homologues Évidents : Proches Parents
Commençons par des protéines connues sous le nom d'homologues évidents. Ce sont comme des frères et sœurs qui partagent pas mal de caractéristiques, un peu comme avoir les mêmes parents. Par exemple, les enzymes qui aident les bactéries à résister aux antibiotiques partagent beaucoup de similitudes dans leurs séquences.
Quand les scientifiques ont essayé de relier ces protéines sœurs le long de divers chemins, ils ont trouvé que tant que les mutations étaient mineures et cohérentes, le chemin restait fonctionnel. C'est comme conduire d'une réunion de famille à une autre à travers des quartiers familiers sans rencontrer de culs-de-sac.
Homologues Lointains : Arbres Généalogiques Plus Compliqués
Maintenant, ajoutons un peu de piment avec les homologues lointains. Ces protéines peuvent ressembler à des cousins de deuxième ou troisième degré qui ont beaucoup changé au fil du temps mais partagent toujours quelques traits de famille.
Une de ces familles inclut des protéines qui aident les bactéries à réagir à différents environnements. Malgré leur diversité, les chercheurs ont découvert qu'il est encore possible de trouver des connexions entre ces parents éloignés. Les chemins peuvent passer par des états bizarres ou instables, comme prendre un détour dans un coin peu familier.
Homologues Spéculatifs : Les Cousins Mystères
Ensuite, lors de notre voyage protéique, on a les homologues spéculatifs. Ces protéines ressemblent à de lointains cousins qui n’ont pas beaucoup d’airs de famille. Elles remplissent des rôles différents, mais il y a des similitudes étranges qui suggèrent qu'elles pourraient avoir un ancêtre commun.
Par exemple, la lactate déshydrogénase et la NADH peroxydase sont deux protéines différentes qui font des jobs très différents. Cependant, certaines parties de leur structure portent des similarités fantomatiques. Les scientifiques ont trouvé des chemins entre ces protéines qui prennent des virages inattendus, souvent à travers des états instables qui te font te demander si tu ne t'es pas perdu.
Les Défis de Trouver des Chemins
Trouver des chemins entre les protéines, ce n'est pas si simple que ça en a l'air. Tu peux le voir comme essayer de relier deux vieux ponts qui se sont effondrés avec le temps. Alors que c'est facile de trouver des chemins entre des protéines similaires (comme des frères et sœurs), les parents éloignés ou les cousins mystérieux nécessitent souvent de naviguer dans des espaces incertains.
Parfois, en parcourant ces chemins, les protéines peuvent perdre leur structure stable ou leur fonctionnalité. C'est comme une voiture qui ne peut pas supporter une route cahoteuse et qui tombe en panne. En cherchant ces chemins, les scientifiques rassemblent beaucoup de données pour s'assurer qu'ils avancent toujours dans la bonne direction.
Mesurer la Forme le Long du Chemin
Au fur et à mesure que les scientifiques créent des chemins protéiques, ils ont aussi besoin d'un moyen de mesurer à quel point chaque variation est "apte". Une méthode populaire pour ça est d'utiliser des modèles de langage ESM2 pour prédire à quel point une protéine donnée est susceptible de fonctionner efficacement.
Imagine que tu avais un tracker de Fitness qui te dit comment tu progresses lors de ton road trip. Si tu rencontres quelques bosses, ton tracker pourrait biper pour te prévenir qu'il est temps de changer de route avant que la voiture (ou la protéine) abandonne.
Comparer Différents Chemins
Pour s'assurer que les chemins sont utiles, les scientifiques les comparent souvent. Les chemins créés par la méthode de recherche par faisceau ont tendance à mieux résister que les chemins aléatoires.
Dans un twist amusant, utiliser des chemins aléatoires peut mener à des découvertes surprenantes, mais ils mènent souvent à des cul-de-sac – ou pire – à des pannes ! En gardant un œil sur à quel point les protéines restent "aptes" tout au long de leur parcours, les scientifiques peuvent affiner leurs techniques pour créer de meilleurs chemins.
Leçons Apprises
En créant des chemins viables entre les séquences de protéines, les scientifiques ont découvert pas mal de choses sur le fonctionnement de l'évolution. Ils ont trouvé que, bien qu'il soit facile de relier des homologues évidents, les homologues lointains et spéculatifs peuvent nécessiter un peu plus de finesse.
La beauté de ce travail réside dans la compréhension de la nature aléatoire de l'évolution, où parfois, tu peux tomber sur une connexion cachée qui change tout.
Conclusion : La Route à Venir
Alors que les scientifiques continuent de cartographier le parcours des protéines, ils ne trouvent pas seulement des chemins mais dévoilent aussi des secrets sur comment la vie s'adapte. Cette connaissance peut nous aider à prédire comment les protéines pourraient évoluer dans le futur, menant potentiellement à de nouvelles innovations en médecine et biotechnologie.
Donc, la prochaine fois que tu penses à l'évolution, souviens-toi juste : c'est une route sinueuse pleine de rebondissements inattendus, de tournants et du détour occasionnel qui mène à une belle nouvelle destination !
Titre: High fitness paths can connect proteins with low sequence overlap
Résumé: The structure and function of a protein are determined by its amino acid sequence. While random mutations change a protein's sequence, evolutionary forces shape its structural fold and biological activity. Studies have shown that neutral networks can connect a local region of sequence space by single residue mutations that preserve viability. However, the larger-scale connectedness of protein morphospace remains poorly understood. Recent advances in artificial intelligence have enabled us to computationally predict a protein's structure and quantify its functional plausibility. Here we build on these tools to develop an algorithm that generates viable paths between distantly related extant protein pairs. The intermediate sequences in these paths differ by single residue changes over subsequent steps - substitutions, insertions and deletions are admissible moves. Their fitness is evaluated using the protein language model ESM2, and maintained as high as possible subject to the constraints of the traversal. We document the qualitative variation across paths generated between progressively divergent protein pairs, some of which do not even acquire the same structural fold. The ease of interpolating between two sequences could be used as a proxy for the likelihood of homology between them.
Auteurs: Pranav Kantroo, Günter P. Wagner, Benjamin B. Machta
Dernière mise à jour: 2024-11-13 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2411.09054
Source PDF: https://arxiv.org/pdf/2411.09054
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.