Cartographier les complexes protéiques humains : une nouvelle approche
De nouvelles découvertes sur les complexes de protéines améliorent notre compréhension de la biologie cellulaire.
― 8 min lire
Table des matières
- Complexes de protéines
- Avancées dans les Techniques de Recherche
- Le Projet hu.MAP
- Analyser les Données pour Identifier les Complexes
- Importance de l'Apprentissage Automatique dans la Cartographie des Protéines
- Construire et Entraîner le Modèle
- Comprendre les Interactions entre Protéines
- Analyse de Covariation
- Analyse Basée sur la Structure des Interactions Protéiques
- Le Rôle d'AlphaFold
- Étapes Finales dans l'Intégration des Données
- Partager les Découvertes avec la Communauté
- Signification des Découvertes Réalisées
- Potentiel dans la Recherche sur les Maladies
- Directions Futures
- Explorer les Protéines Peu Caractérisées
- Conclusion
- Source originale
- Liens de référence
Les protéines sont essentielles à la vie et jouent des rôles cruciaux dans chaque cellule de notre corps. Elles fonctionnent comme les machines qui animent de nombreux processus, du mouvement des muscles à la communication entre les cellules. Chaque protéine est composée de plus petites unités appelées acides aminés, qui se replient en formes spécifiques pour effectuer leurs tâches. Comprendre comment les protéines travaillent ensemble est super important pour faire avancer la médecine et la biologie.
Complexes de protéines
Les protéines ne travaillent souvent pas seules ; elles forment des groupes appelés complexes de protéines. Ces complexes sont composés de deux protéines ou plus qui collaborent pour accomplir une fonction. Par exemple, certaines protéines peuvent travailler ensemble pour déplacer des substances à travers la membrane d'une cellule, tandis que d'autres peuvent aider à réparer de l'ADN endommagé. En étudiant ces complexes de protéines, les scientifiques peuvent en apprendre plus sur le fonctionnement des cellules et sur comment les maladies peuvent perturber ces processus.
Avancées dans les Techniques de Recherche
Les récents développements en sciences ont amélioré notre capacité à étudier les protéines et leurs complexes de manière significative. Des techniques comme la Spectrométrie de masse permettent aux chercheurs d'identifier et de comprendre de grandes quantités de protéines en même temps. La spectrométrie de masse peut déterminer la taille et la composition chimique des protéines, aidant les scientifiques à savoir quelles protéines se lient pour former des complexes.
L'Apprentissage automatique est un autre outil puissant utilisé par les scientifiques. En analysant d'énormes quantités de données, les algorithmes d'apprentissage automatique peuvent identifier des motifs et prédire les interactions entre les protéines. Cela peut aider les scientifiques à créer des cartes détaillées de toutes les protéines dans une cellule et comment elles interagissent entre elles.
Le Projet hu.MAP
Le projet humain d'association multi-protéines (hu.MAP) vise à créer une carte complète des complexes de protéines dans les cellules humaines. Les chercheurs ont rassemblé des données provenant de milliers d'expériences pour mieux identifier et caractériser ces complexes de protéines. Les derniers efforts ont intégré plus de 25 000 expériences de spectrométrie de masse.
Analyser les Données pour Identifier les Complexes
En utilisant des algorithmes avancés, les chercheurs ont pu organiser et analyser ces données pour identifier plus de 15 000 complexes de protéines différents. Ils ont réussi à cartographier une grande partie du protéome humain, qui comprend environ 13 769 protéines. C'est une avancée significative par rapport aux précédents efforts, qui avaient identifié moins de complexes et de protéines.
Les chercheurs ont utilisé diverses méthodes pour la collecte de données, y compris la purification par affinité par spectrométrie de masse (AP-MS), la co-fractionation par spectrométrie de masse (CF-MS) et le marquage de proximité. Chaque méthode apporte des aperçus uniques sur la manière dont les protéines interagissent, renforçant la compréhension globale des réseaux de protéines.
Importance de l'Apprentissage Automatique dans la Cartographie des Protéines
L'apprentissage automatique joue un rôle central dans le projet hu.MAP en traitant les données collectées à partir de diverses expériences. La technique implique d'entraîner des algorithmes avec des données connues pour prédire les interactions inconnues entre les protéines. Les scientifiques ont utilisé un modèle d'apprentissage automatique pour analyser les interactions entre les paires de protéines, ce qui a finalement conduit à l'identification de 15 326 complexes.
Construire et Entraîner le Modèle
Pour construire un modèle fiable, les chercheurs ont d'abord préparé une matrice de caractéristiques représentant les données collectées. Chaque paire de protéines a été évaluée pour les interactions potentielles en fonction de diverses caractéristiques. Le modèle a ensuite été entraîné avec des données sur des complexes de protéines connus, lui permettant d'apprendre les caractéristiques de ces interactions.
Une fois entraîné, le modèle a été testé pour sa précision. Les résultats ont montré que la version actuelle du projet hu.MAP surpassait les modèles précédents, permettant de meilleures prédictions des interactions entre les protéines.
Comprendre les Interactions entre Protéines
Les chercheurs ont fait d'énormes progrès dans la compréhension des interactions entre les protéines. Ils ont découvert que les protéines présentent souvent des motifs de co-expression, ce qui signifie qu'elles sont exprimées à des niveaux similaires dans différentes conditions. C'est un facteur essentiel pour déchiffrer comment les protéines fonctionnent ensemble dans les complexes.
Analyse de Covariation
Destinée à compléter les données obtenues par des interactions physiques, les chercheurs ont également déployé l'analyse de covariation des protéines. Cette technique examine comment les niveaux de protéines changent ensemble dans diverses conditions biologiques. En identifiant les protéines qui affichent une expression coordonnée, les scientifiques peuvent obtenir des aperçus sur les relations fonctionnelles entre elles.
Analyse Basée sur la Structure des Interactions Protéiques
En plus des données d'expression, les chercheurs ont utilisé des modèles structurels des protéines pour approfondir leur analyse. En modélisant les interactions protéiques, ils peuvent visualiser comment les protéines s'assemblent, ce qui aide à comprendre les relations physiques au sein des complexes.
AlphaFold
Le Rôle d'AlphaFold, un outil qui prédit les structures protéiques, s'est révélé particulièrement utile. En modélisant les structures 3D des protéines, les scientifiques peuvent identifier des interactions qui seraient autrement restées cachées. Par exemple, les chercheurs ont utilisé des modèles AlphaFold pour explorer des interactions potentiellement mutuellement exclusives, où deux protéines ne peuvent pas exister dans le même complexe en même temps en raison de contraintes structurelles.
Étapes Finales dans l'Intégration des Données
Le projet hu.MAP a culminé avec l'intégration de toutes les données rassemblées en ressources utilisables pour la communauté de recherche. Les cartes complètes créées permettent aux scientifiques d'explorer et d'étudier les complexes de protéines de manière plus efficace.
Partager les Découvertes avec la Communauté
Les chercheurs ont rendu ces données disponibles via des ressources en ligne, encourageant d'autres scientifiques à les utiliser dans leurs études. Cette collaboration est vitale pour faire avancer la compréhension de la biologie humaine et développer des traitements pour les maladies liées aux interactions protéiques.
Signification des Découvertes Réalisées
Les avancées dans l'identification et la compréhension des complexes de protéines peuvent avoir des implications considérables. En fournissant des aperçus sur les fonctions cellulaires et les mécanismes des maladies, cette recherche peut ouvrir de nouvelles voies en recherche médicale, y compris le développement de thérapies ciblées.
Potentiel dans la Recherche sur les Maladies
L'identification de nouvelles interactions et complexes protéiques est particulièrement pertinente pour la découverte de nouveaux gènes liés aux maladies. Par exemple, les protéines liées à des conditions spécifiques peuvent former des complexes uniques qui fournissent des aperçus sur les mécanismes sous-jacents de ces maladies.
Directions Futures
Au fur et à mesure que la recherche progresse, les scientifiques visent à affiner encore plus leur compréhension des complexes de protéines. En continuant à intégrer de nouvelles données expérimentales et à améliorer les méthodes computationnelles, ils espèrent créer des cartes encore plus détaillées du protéome.
Explorer les Protéines Peu Caractérisées
Un objectif important est de se concentrer sur les protéines mal comprises. De nombreuses protéines restent peu caractérisées, ce qui signifie que leurs fonctions ne sont pas encore connues. En analysant ces protéines dans le contexte de complexes connus, les chercheurs peuvent faire des prédictions sur leurs rôles et potentiellement identifier de nouvelles fonctions.
Conclusion
Le travail réalisé pour cartographier les complexes protéiques humains est une étape cruciale vers une meilleure compréhension de la biologie cellulaire. Avec les avancées technologiques et l'analyse des données, les scientifiques peuvent maintenant explorer les réseaux complexes de protéines qui soutiennent la vie. Les découvertes du projet hu.MAP et d'efforts similaires représentent une nouvelle frontière dans la recherche biologique, avec le potentiel de changer notre approche du traitement et de la prévention des maladies.
Titre: hu.MAP3.0: Atlas of human protein complexes by integration of > 25,000 proteomic experiments
Résumé: Macromolecular protein complexes carry out most functions in the cell including essential functions required for cell survival. Unfortunately, we lack the subunit composition for all human protein complexes. To address this gap we integrated >25,000 mass spectrometry experiments using a machine learning approach to identify > 15,000 human protein complexes. We show our map of protein complexes is highly accurate and more comprehensive than previous maps, placing [~]75% of human proteins into their physical contexts. We globally characterize our complexes using protein co-variation data (ProteomeHD.2) and identify co-varying complexes suggesting common functional associations. Our map also generates testable functional hypotheses for 472 uncharacterized proteins which we support using AlphaFold modeling. Additionally, we use AlphaFold modeling to identify 511 mutually exclusive protein pairs in hu.MAP3.0 complexes suggesting complexes serve different functional roles depending on their subunit composition. We identify expression as the primary way cells and organisms relieve the conflict of mutually exclusive subunits. Finally, we import our complexes to EMBL-EBIs Complex Portal (https://www.ebi.ac.uk/complexportal/home) as well as provide complexes through our hu.MAP3.0 web interface (https://humap3.proteincomplexes.org/). We expect our resource to be highly impactful to the broader research community.
Auteurs: Kevin Drew, S. N. Fischer, E. R. Claussen, S. Kourtis, S. Sdelci, S. Orchard, H. Hermjakob, G. Kustatscher
Dernière mise à jour: 2024-10-15 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.10.11.617930
Source PDF: https://www.biorxiv.org/content/10.1101/2024.10.11.617930.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://humap3.proteincomplexes.org
- https://www.ebi.ac.uk/complexportal/home
- https://humap2.proteincomplexes.org/static/downloads/humap2/humap2_feature_matrix_20200820.featmat.gz
- https://ftp.ebi.ac.uk/pub/databases/intact/complex/2022-07-11/
- https://archive.bioinfo.se/huintaf2/humap.zip
- https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip
- https://www.proteinatlas.org/about/assays+annotation#classification_rna
- https://www.proteinatlas.org/download/proteinatlas.tsv.zip