GPMelt : Une nouvelle approche pour analyser la stabilité thermique des protéines
GPMelt améliore l'analyse des comportements de fusion des protéines pour de meilleures connaissances biologiques.
― 7 min lire
Table des matières
Les protéines sont des éléments essentiels de tous les êtres vivants. Elles participent à de nombreux processus biologiques et interagissent avec diverses molécules, y compris d'autres protéines, l'ADN et des petites molécules. Une des propriétés clés des protéines est leur stabilité thermique, c'est-à-dire leur capacité à maintenir leur structure lorsqu'elles sont exposées à la chaleur. Si une protéine n'est pas stable, elle peut changer de forme ou s'agglomérer lorsqu'elle est chauffée, un processus qu'on appelle la dénaturation.
Pour étudier et comprendre comment les protéines réagissent à la chaleur, les chercheurs utilisent une méthode appelée profilage du protéome thermique (TPP). Cette technique permet aux scientifiques d'observer comment la stabilité de nombreuses protéines varie lorsqu'elles sont chauffées à différentes températures. En combinant le TPP avec une méthode de mesure spécifique appelée Spectrométrie de masse, ils peuvent analyser des milliers de protéines en même temps.
Dans le TPP, les protéines sont soumises à une plage de températures, et les données obtenues aident à créer ce qu'on appelle des "courbes de fusion". Ces courbes montrent comment l'abondance de chaque protéine change à mesure que la température augmente. À l'origine, le TPP a été conçu pour découvrir comment les médicaments interagissent avec leurs cibles protéiques, mais son utilisation s'est élargie au fil du temps pour explorer d'autres questions biologiques.
Comprendre les Expériences sur la Plage de Température
Dans les expériences de profilage du protéome thermique sur plage de température (TPP-TR), les scientifiques chauffent des échantillons de protéines à diverses températures puis analysent les protéines solubles pour créer des courbes de fusion. Le processus consiste à chauffer les échantillons, à filtrer les agrégats, à décomposer les protéines en parties plus petites, puis à les mesurer grâce à la spectrométrie de masse.
Les chercheurs regardent généralement deux niveaux d'observation dans le TPP-TR : au niveau des protéines, qui fait une moyenne des données sur plusieurs parties de la même protéine, et au niveau des peptides, où des fragments individuels de protéines sont analysés. L'avantage d'étudier les peptides est que cela permet aux scientifiques de voir les changements causés par des modifications aux protéines, comme la phosphorylation, qui peuvent survenir après que la protéine a été fabriquée.
Bien que la plupart des courbes de fusion s'adaptent à un modèle typique (une forme sigmoïdale), certaines protéines montrent des comportements inhabituels qui ne correspondent pas aux courbes attendues. Ces formes inhabituelles peuvent donner des informations importantes sur les fonctions biologiques des protéines, notamment sur la manière dont elles interagissent avec d'autres molécules et réagissent aux changements environnementaux.
Le Problème des Approches Traditionnelles
Les approches passées pour analyser les données du TPP-TR supposaient souvent que les courbes de fusion suivraient une forme spécifique. Cette hypothèse a limité les chercheurs car cela signifiait qu'ils pouvaient passer à côté d'informations précieuses provenant de protéines avec des comportements de fusion non standards. Certains chercheurs ont suggéré que des courbes de fusion inhabituelles pouvaient avoir des significations biologiques importantes, en particulier concernant le comportement des protéines dans différentes conditions.
Les méthodes traditionnelles avaient tendance à filtrer les protéines avec des courbes de fusion qui ne collaient pas à la forme attendue, entraînant une perte de données potentiellement significatives. Cela est devenu préoccupant car certaines protéines, en particulier celles impliquées dans des processus biologiques complexes, pouvaient exhiber des comportements qui ne correspondaient pas aux attentes habituelles.
Introduction d'un Nouveau Cadre
Pour résoudre ces problèmes, un nouvel outil statistique, appelé GPMelt, a été développé pour analyser les données du TPP-TR de manière plus efficace. Cette approche ne repose pas sur l'hypothèse que les courbes de fusion seront sigmoïdales. Au lieu de cela, elle permet plus de flexibilité dans la modélisation des comportements de fusion.
GPMelt utilise un modèle de processus gaussien hiérarchique, ce qui implique de créer des couches d'analyse qui partagent des informations. Cela signifie que l'analyse peut prendre en compte les similarités entre les points de données tout en permettant des comportements de fusion standards et non standards. En faisant cela, les chercheurs peuvent obtenir des informations sur une plus large gamme de protéines, y compris celles qui auraient pu être écartées auparavant.
La Structure de GPMelt
Le cadre GPMelt est structuré de manière à pouvoir gérer à la fois des données au niveau des peptides et au niveau des protéines simultanément. Le modèle est conçu pour permettre différentes conditions, ce qui signifie qu'il peut analyser comment les protéines se comportent dans divers montages expérimentaux.
Le niveau supérieur de la hiérarchie représente les comportements globaux des protéines, tandis que les niveaux inférieurs se concentrent sur des duplicatas individuels. Cette structure multi-niveaux aide les chercheurs à évaluer à quel point les comportements de fusion des protéines sont similaires ou différents dans différentes conditions.
GPMelt introduit également une nouvelle méthode pour mesurer les différences entre les courbes de fusion, ce qui fournit une compréhension plus précise de comment les traitements ou modifications affectent la stabilité des protéines. Cette flexibilité nouvelle permet aux scientifiques de considérer de nombreux facteurs expérimentaux différents sans être enfermés dans des hypothèses rigides sur les formes de données.
Validation de GPMelt
Pour confirmer que GPMelt fonctionne comme prévu, il a été testé en utilisant des ensembles de données existants, y compris des données au niveau des protéines et des peptides. Les résultats ont montré que GPMelt pouvait détecter avec précision les protéines qui présentaient des changements significatifs dans le comportement de fusion en raison de traitements, comme des médicaments.
La capacité de GPMelt à inclure des protéines avec des comportements de fusion non standards a permis de meilleurs taux de découverte, ce qui signifie que les chercheurs pouvaient identifier plus de protéines potentiellement intéressantes qu'avec des méthodes traditionnelles. Cela renforce l'idée que des comportements protéiques inhabituels peuvent être importants à étudier.
Applications dans le Monde Réel
Les implications de GPMelt s'étendent à de nombreux domaines de la recherche biologique, en particulier pour comprendre comment les protéines fonctionnent dans différents contextes. Par exemple, dans la recherche sur le cancer, savoir comment les protéines se comportent sous certains traitements pourrait aider à développer des thérapies plus efficaces.
GPMelt a également des applications dans la conception de médicaments. En comprenant comment différentes protéines réagissent à divers composés, les scientifiques peuvent mieux prédire l'efficacité d'un nouveau médicament. De plus, la polyvalence de GPMelt signifie qu'il peut être appliqué à divers ensembles de données, pas seulement à ceux provenant d'expériences TPP-TR, élargissant son utilisation potentielle dans les études biologiques.
Conclusion
En résumé, GPMelt représente une avancée importante dans l'analyse de la stabilité thermique des protéines. En fournissant un cadre statistique qui s'adapte à des formes de données et des conditions diverses, il ouvre de nouvelles avenues pour explorer des questions biologiques. Cet outil peut aider les scientifiques à découvrir des informations cachées sur le fonctionnement des protéines, leur interaction et leur réponse à différents stimuli, contribuant ainsi à notre compréhension de la biologie et au développement de nouvelles thérapies.
Titre: Hierarchical Gaussian process models explore the dark meltome of thermal proteome profiling experiments.
Résumé: Thermal proteome profiling (TPP) is a proteome wide technology that enables unbiased detection of protein drug interactions as well as changes in post-translational state of proteins between different biological conditions. Statistical analysis of temperature range TPP (TPP-TR) datasets relies on comparing protein melting curves, describing the amount of non-denatured proteins as a function of temperature, between different conditions (e.g. presence or absence of a drug). However, state-of-the-art models are restricted to sigmoidal melting behaviours while unconventional melting curves, representing up to 50% of TPP-TR datasets, have recently been shown to carry important biological information. We present a novel statistical framework, based on hierarchical Gaussian process models and named GPMelt, to make TPP-TR datasets analysis unbiased with respect to the melting profiles of proteins. GPMelt scales to multiple conditions, and extension of the model to deeper hierarchies (i.e. with additional sub-levels) allows to deal with complex TPP-TR protocols. Collectively, our statistical framework extends the analysis of TPP-TR datasets for both protein and peptide level melting curves, offering access to thousands of previously excluded melting curves and thus substantially increasing the coverage and the ability of TPP to uncover new biology. Author summaryProteins interactions with other proteins, nucleic acids or metabolites, are key to all biological processes. Being able to detect these interactions is essential to understand biological systems. Thermal proteome profiling is a proteome-wide biological assay able to capture these interactions. It consists in analysing the effect of heat treatment on proteins. Indeed, proteins, under physiological conditions, are folded. This folding gets disrupted as the temperature increases. The way this unfolding happens, called the melting profile of the protein, informs on the interactions of proteins. For example, the interaction of a protein with another protein can increase (thermally stabilise) or decrease (thermally destabilise) the temperature at which this protein starts unfolding. In this work, we present a new statistical method, named GPMelt, to analyse these melting profiles. Notably, GPMelt allows to analyse any melting profiles, independently of their shapes. The proposed improvements over previously published methods allow to investigate more robustly the melting profiles of more proteins, hence increasing the ability of thermal proteome profiling assays to discover new protein interactions. We anticipate that these advancements will aid in unravelling complex biological phenomena.
Auteurs: Cecile Le Sueur, M. Rattray, M. Savitski
Dernière mise à jour: 2024-07-27 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2023.10.26.564129
Source PDF: https://www.biorxiv.org/content/10.1101/2023.10.26.564129.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.