L'impact des mutations ADN sur les protéines
Cet article examine comment les substitutions et les suppressions dans l'ADN affectent la fonction des protéines.
― 6 min lire
Table des matières
Les Mutations dans notre ADN peuvent influencer le fonctionnement des Protéines. Certaines modifications sont petites et arrivent souvent, tandis que d'autres sont plus grandes et moins comprises. Les scientifiques étudient ces mutations pour comprendre comment elles affectent les protéines et comment elles sont liées à la santé humaine. Cet article explore les différences entre deux types de mutations : les Substitutions, où un élément d'une protéine est remplacé par un autre, et les Suppressions, où un ou plusieurs éléments sont enlevés.
L'Importance des Mutations
Les mutations sont naturelles et peuvent se produire dans n'importe quelle cellule. Elles peuvent mener à de nouveaux traits ou à des maladies. Alors que les chercheurs ont avancé dans la compréhension des substitutions, les suppressions restent moins explorées. Ce manque de connaissances peut rendre difficile de déterminer comment certaines mutations pourraient être liées à des problèmes de santé.
Qu'est-ce que les Substitutions et les Suppressions ?
Les substitutions se produisent quand un acide aminé dans une protéine est remplacé par un autre. Par exemple, une sérine pourrait être remplacée par une thréonine. Les suppressions, elles, enlèvent un ou plusieurs acides aminés. Par exemple, s'il y a trois acides aminés et qu'on en retire un, la séquence a changé.
Les deux types de mutations peuvent affecter le fonctionnement d'une protéine, mais pas de la même manière. Comprendre comment chaque type de mutation impacte les protéines est crucial dans des domaines comme la génétique et la médecine.
Axe de Recherche Actuel
Les scientifiques ont commencé à combiner des expériences en laboratoire avec des modèles informatiques pour étudier les mutations. Ces modèles peuvent prédire comment les changements dans l'ADN vont impacter les protéines. Grâce à ces outils, les chercheurs ont été capables d'analyser des milliers de protéines et de voir comment les substitutions et les suppressions les affectent.
Un de ces modèles, appelé ESM-1b, a été utilisé pour analyser les suppressions dans un grand groupe de protéines. Ce modèle aide à examiner les effets potentiels sur la fonction des protéines juste en se basant sur la séquence ADN.
Tolérance Différentielle
La tolérance différentielle fait référence à l'idée que certaines parties d'une protéine peuvent mieux gérer les substitutions que les suppressions, ou vice versa. En examinant les protéines, les chercheurs ont trouvé de nombreux exemples où un site dans une protéine accepte une substitution mais pas une suppression, ou l'inverse.
Dans leurs études, les scientifiques ont identifié des dizaines de milliers de sites dans diverses protéines montrant cette tolérance différentielle. Cette découverte souligne que simplement regarder les substitutions ne donne pas une vue d'ensemble de comment une protéine pourrait se comporter face à différents types de mutations.
Éléments Structurels des Protéines
Les protéines sont composées de chaînes d'acides aminés qui se replient en formes spécifiques. Ces formes sont importantes pour le fonctionnement des protéines. Certaines zones de la protéine sont plus sensibles aux changements que d'autres.
Par exemple, des régions appelées hélices alpha sont des structures dans les protéines qui semblent être particulièrement sensibles aux suppressions. Cette sensibilité pourrait venir de la façon dont ces régions sont organisées. Quand un acide aminé est supprimé dans une hélice alpha, cela peut perturber toute la structure, la rendant moins stable.
Contexte de Séquence
Un autre facteur qui influence comment les mutations impactent les protéines est les acides aminés environnants, connu sous le nom de contexte de séquence. Certaines séquences d'acides aminés peuvent être similaires ou différentes, influençant comment les mutations sont tolérées.
Par exemple, si une suppression se produit dans une chaîne d'acides aminés similaires, cela peut ne pas perturber autant la fonction de la protéine qu'une suppression dans une séquence diverse. Les chercheurs ont découvert que les zones de protéines composées d'acides aminés similaires ont tendance à mieux gérer les suppressions, tandis que les substitutions peuvent causer plus de problèmes.
Résultats Expérimentaux
Dans leur analyse, les scientifiques ont comparé les résultats des modèles informatiques avec des données expérimentales pour voir à quel point ils correspondaient. Ils ont trouvé que le modèle prévoyait des différences dans la tolérance aux mutations qui étaient cohérentes avec les résultats expérimentaux. Par exemple, les sites intolérants aux suppressions mais tolérants aux substitutions correspondaient souvent à des caractéristiques structurelles spécifiques de la protéine.
Implications Cliniques
Les résultats ont des implications importantes pour la recherche clinique et le traitement. De nombreuses conditions génétiques sont liées à des mutations dans les protéines. Si les chercheurs se concentrent uniquement sur les substitutions sans considérer les suppressions, ils pourraient passer à côté de facteurs clés qui contribuent à une condition.
En comprenant les différences dans la façon dont les substitutions et les suppressions affectent les protéines, les professionnels de santé peuvent améliorer les tests génétiques et les stratégies de traitement. Cela pourrait mener à de meilleurs diagnostics et à des thérapies ciblées pour les troubles génétiques.
Avancer
Il y a plein de pistes pour de futures recherches. Les scientifiques veulent explorer pourquoi certaines protéines sont plus tolérantes à des mutations spécifiques que d'autres. De plus, ils espèrent approfondir comment cette compréhension peut être appliquée aux pratiques cliniques et au conseil génétique.
Au fur et à mesure que la recherche avance, il y a un potentiel pour affiner les prédictions sur le comportement des protéines en fonction des mutations génétiques. Cela pourrait mener à de nouvelles découvertes sur les maladies et potentiellement à de nouveaux traitements.
Conclusion
Les mutations dans l'ADN, qu'il s'agisse de substitutions ou de suppressions, jouent un rôle crucial dans le fonctionnement des protéines. Comprendre leurs effets aide non seulement à l'étude de la biologie de base mais a aussi des implications cliniques concrètes. En utilisant des modèles avancés et en les combinant avec des données expérimentales, les chercheurs peuvent obtenir une vue plus complète de comment différentes mutations affectent la stabilité et la fonction des protéines. Ce savoir est vital pour avancer la recherche génétique et améliorer les résultats en santé.
Titre: Uncovering differential tolerance to deletions versus substitutions with a protein language model
Résumé: Deep mutational scanning (DMS) experiments have been successfully leveraged to understand genotype to phenotype mapping, with broad implications for protein engineering, human genetics, drug development, and beyond. To date, however, the overwhelming majority of DMS have focused on amino acid substitutions, excluding other classes of variation such as deletions or insertions. As a consequence, it remains unclear how indels differentially shape the fitness landscape relative to substitutions. In order to further our understanding of the relationship between substitutions and deletions, we leveraged a protein language model to analyze every single amino acid deletion in the human proteome. We discovered hundreds of thousands of sites that display opposing behavior for deletions versus substitutions, i.e. sites that can tolerate being substituted but not deleted, and vice versa. We identified secondary structural elements and sequence context to be important mediators of differential tolerability at these sites. Our results underscore the value of deletion-substitution comparisons at the genome-wide scale, provide novel insights into how substitutions could systematically differ from deletions, and showcase the power of protein language models to generate biological hypotheses in-silico. All deletion-substitution comparisons can be explored and downloaded at https://huggingface.co/spaces/ntranoslab/diff-tol.
Auteurs: Vasilis Ntranos, G. Goldman, P. Chati
Dernière mise à jour: 2024-07-02 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.06.27.601077
Source PDF: https://www.biorxiv.org/content/10.1101/2024.06.27.601077.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://github.com/ntranoslab/esm-variants/blob/main/esm_score_missense_mutations.py
- https://github.com/ntranoslab/esm-variants/blob/main/esm_score_multi_residue_mutations.py
- https://github.com/ntranoslab/esm-variants/blob/main/benchmarks/ClinVar_gnomAD_benchmark_with_predictions.csv
- https://github.com/ntranoslab/esm-variants/blob/main/benchmarks/ClinVar_indel_benchmark_with_predictions.csv
- https://alphafold.ebi.ac.uk/download
- https://biopython.org/docs/1.75/api/Bio.PDB.DSSP.html
- https://zenodo.org/records/7992926
- https://gnomad.broadinstitute.org/downloads
- https://biit.cs.ut.ee/gprofiler/convert
- https://github.com/ntranoslab/diff-tol
- https://huggingface.co/spaces/goldmangrant/diff-tol