ModiFinder : Un nouvel outil pour identifier les modifications chimiques
ModiFinder aide à repérer les modifications chimiques dans les petites molécules en utilisant des données de spectrométrie de masse.
― 7 min lire
Table des matières
Les modifications chimiques dans les petites molécules peuvent être difficiles à identifier. Les chercheurs se fient souvent à des techniques comme la Spectrométrie de masse en tandem (MS/MS) pour analyser et comprendre ces structures chimiques. Toutefois, interpréter les données MS/MS pour déterminer la structure exacte de ces petites molécules n'est pas simple. Jusqu'à 87 % des Spectres générés dans certaines expériences restent non identifiés.
Pour pallier ce problème, des scientifiques ont développé des méthodes qui consistent à comparer les spectres de composés connus avec ceux de substances inconnues. Ces approches peuvent connecter des composés connus avec des structures similaires pour éventuellement identifier des inconnus. Cependant, même si ces méthodes montrent des similarités, elles laissent souvent les différences spécifiques ouvertes à l'interprétation. Cela peut prendre beaucoup de temps pour les chimistes qui doivent analyser ces données manuellement.
Pour améliorer ce processus, un nouvel outil baptisé ModiFinder a été créé. Cet outil vise à aider à déterminer où une modification pourrait se situer sur un composé inconnu par rapport à une structure connue. En comparant les spectres de masse des deux composés, ModiFinder aide à indiquer la probabilité que différentes parties de la molécule soient le site de la modification.
Comment ModiFinder fonctionne
ModiFinder prend les spectres MS/MS d'un composé connu et d'un composé inconnu ainsi que la structure 2D du composé connu. Il commence par identifier les zones potentielles dans le composé connu qui pourraient présenter des similarités structurales avec l'inconnu.
D'abord, les données MS/MS sont nettoyées en supprimant les pics de faible intensité et en normalisant les données pour réduire le bruit. ModiFinder identifie ensuite les pics correspondants entre les spectres connus et inconnus. Les pics qui changent de masse sont notés comme décalés, tandis que ceux qui restent les mêmes sont considérés comme non décalés.
Pour chaque pic dans les spectres, ModiFinder attribue un ensemble de Sous-structures possibles basé sur la structure du composé connu. Cela suit un processus connu sous le nom de fragmentation combinatoire. Les sous-structures de chaque pic sont examinées pour déterminer comment elles se rapportent aux décalages de masse observés.
Lorsqu'un pic se décale, cela suggère que la zone liée à ce pic pourrait contenir le site de la modification. À l'inverse, les pics qui ne se déplacent pas sont considérés comme moins susceptibles de contenir la modification. Les scores indiquant la probabilité que la modification se produise sont calculés pour chaque atome dans la structure connue. Des scores plus élevés suggèrent une plus grande probabilité pour cet atome d'être le site de la modification.
Enfin, ModiFinder produit une distribution de scores de probabilité, mettant en avant les zones les plus probables où la modification pourrait se situer dans la structure du composé connu.
Évaluation de la performance
Pour évaluer l'efficacité de ModiFinder, les chercheurs ont utilisé des paires de composés connus, chacun ayant seulement une modification structurelle. En comparant les Performances de ModiFinder aux méthodes de sélection aléatoire et à d'autres outils de prédiction, l'efficacité de l'outil a pu être mesurée.
L'évaluation s'est concentrée sur deux domaines principaux : la proximité des sites de modification prédits par rapport aux sites réels, et la pertinence des prédictions. L'outil a surpassé les choix aléatoires pour identifier les sites de modification.
Plusieurs versions de ModiFinder ont été testées. La version de base fonctionnait bien mais a été améliorée avec des ajustements prenant en compte les formules moléculaires et les composés apparentés. Une version "oracle" de l'outil a utilisé des sites de modification connus pour obtenir une performance encore meilleure.
Plus de 12 000 paires de composés ont été analysées, une portion significative montrant au moins un pic décalé. Les résultats ont indiqué que la présence de ces pics décalés était essentielle pour identifier avec précision les sites de modification.
L'importance des pics décalés
Les résultats ont souligné l'importance des pics décalés dans la détermination des sites de modification. Les spectres avec pics décalés ont généralement montré de meilleures performances pour identifier où les modifications se produisaient. Plus il y avait de pics décalés, mieux se portait la performance de ModiFinder.
Même avec une complexité accrue dans l'interprétation des données, avoir plus de pics décalés a conduit à un ensemble plus riche de sous-structures potentielles à considérer, réduisant ainsi le chevauchement dans les interprétations. Cela a, à son tour, aidé à améliorer la précision pour pinpoint où les modifications étaient susceptibles d'avoir lieu.
Défis avec l'ambiguïté
Un des défis permanents pour ModiFinder était l'ambiguïté potentielle qui surgissait lors du processus d'annotation des sous-structures. Des fragmentations plus détaillées avaient parfois pour conséquence une ambiguïté plus élevée, compliquant l'identification des vrais sites de modification. Cela était particulièrement évident dans des structures symétriques, où de nombreux atomes pouvaient sembler également probables en tant que site de modification.
Pour lutter contre cela, les chercheurs ont utilisé des stratégies pour réduire cette ambiguïté, comme affiner les assignations de sous-structures avec une aide computationnelle. Ces étapes ont abouti à des identifications plus claires du site de modification.
Interface utilisateur et expertise dans le domaine
Pour rendre l'outil plus accessible, une interface web conviviale a été développée. Cette interface permet aux experts de tirer parti de leur connaissance, aidant à éliminer les sous-structures potentiellement incorrectes en fonction de leur expérience. La combinaison des contributions des utilisateurs avec les résultats computationnels de ModiFinder a conduit à des prédictions améliorées.
Dans des applications pratiques, des experts du domaine ont utilisé avec succès l'outil pour identifier des modifications dans des produits naturels complexes. En affinant les sites prédits selon leur compréhension de la chimie des composés, ils ont pu améliorer significativement la précision de localisation.
Applications réelles
Les capacités de ModiFinder s'étendent à plusieurs domaines qui utilisent la spectrométrie de masse pour l'analyse, y compris la toxicologie, la pharmacologie et la découverte de médicaments. Le potentiel de l'outil pour aider à identifier les modifications chimiques peut mener à de meilleures connaissances sur les produits naturels et leurs dérivés.
Par exemple, des chercheurs ont examiné deux produits naturels, la Kirromycine et la Naphthomycine B, en utilisant ModiFinder pour localiser des modifications structurelles avec un succès notable. Dans les deux cas, cela a montré comment les prédictions computationnelles combinées aux insights des experts pouvaient conduire à des scores de localisation plus élevés, mettant en avant les avantages pratiques de l'utilisation de ModiFinder dans la recherche.
Conclusion
Le défi d'identifier et de localiser des modifications chimiques dans les petites molécules est important, mais des outils comme ModiFinder peuvent simplifier ce processus. En automatisant certaines parties de l'analyse et en permettant un affinement par des experts, ModiFinder a le potentiel d'améliorer considérablement l'efficacité et la précision de l'identification des petites molécules.
Le développement continu de techniques pour améliorer la fragmentation MS/MS et les méthodes d'acquisition de données continuera probablement à soutenir la croissance d'outils comme ModiFinder. À mesure que le domaine de la spectrométrie de masse évolue, le potentiel d'application plus large de ces méthodes computationnelles dans divers domaines scientifiques reste prometteur.
Titre: ModiFinder: Tandem Mass Spectral Alignment Enables Structural Modification Site Localization
Résumé: Untargeted tandem mass spectrometry (MS/MS) has become a high-throughput method to measure small molecules in complex samples. One key goal is the transformation of these MS/MS spectra into chemical structures. Computational techniques such as MS/MS library search have enabled the re-identification of known compounds. Analog library search and molecular networking extend this identification to unknown compounds. While there have been advancements in metrics for the similarity of MS/MS spectra of structurally similar compounds, there is still a lack of automated methods to provide site specific information about structural modifications. Here we introduce ModiFinder that leverages the alignment of peaks in MS/MS spectra between structurally related known and unknown small molecules. Specifically, ModiFinder focuses on shifted MS/MS fragment peaks in the MS/MS alignment. These shifted peaks putatively represent substructures of the known molecule that contain the site of the modification. ModiFinder synthesizes these information together and scores the likelihood for each atom in the known molecule to be the modification site. We demonstrate in this manuscript how ModiFinder can effectively localize modifications which extends the capabilities of MS/MS analog searching and molecular networking to accelerate the discovery of novel compounds.
Auteurs: Mingxun Wang, M. R. Z. Shahneh, M. Strobel, G. A. Vitale, C. Geibel, Y. El Abiead, N. Garg, A. T. Aron, V. V. Phelan, D. Petras
Dernière mise à jour: 2024-02-21 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.02.17.580849
Source PDF: https://www.biorxiv.org/content/10.1101/2024.02.17.580849.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.