ModiFinder: Ein neues Tool zur Identifizierung chemischer Modifikationen
ModiFinder hilft dabei, chemische Modifikationen in kleinen Molekülen mithilfe von Massenspektrometrie-Daten zu finden.
― 6 min Lesedauer
Inhaltsverzeichnis
Chemische Modifikationen in kleinen Molekülen sind oft ganz schön kompliziert zu identifizieren. Forscher nutzen dafür häufig Techniken wie Tandem-Massenspektrometrie (MS/MS), um diese chemischen Strukturen zu analysieren und besser zu verstehen. Aber das MS/MS-Daten zu interpretieren, um die genaue Struktur dieser kleinen Moleküle rauszufinden, ist nicht so einfach. Bis zu 87% der Spektren, die in bestimmten Experimenten erzeugt werden, bleiben unidentifiziert.
Um das Problem anzugehen, haben Wissenschaftler Methoden entwickelt, bei denen die Spektren von bekannten Verbindungen mit denen unbekannter Substanzen verglichen werden. Diese Ansätze verbinden bekannte Verbindungen mit ähnlichen Strukturen, um möglicherweise unbekannte Identifikationen zu ermöglichen. Allerdings zeigen diese Methoden zwar Ähnlichkeiten, lassen aber oft die spezifischen Unterschiede offen für Interpretationen. Das kann für Chemiker, die diese Daten manuell analysieren müssen, ganz schön zeitaufwendig sein.
Um diesen Prozess zu verbessern, wurde ein neues Tool namens ModiFinder entwickelt. Dieses Tool soll helfen herauszufinden, wo eine Modifikation bei einer unbekannten Verbindung im Vergleich zu einer bekannten Struktur sein könnte. Durch den Vergleich der Massenspektren beider Verbindungen zeigt ModiFinder an, wo es wahrscheinlich ist, dass sich die Modifikationsstelle befindet.
So funktioniert ModiFinder
ModiFinder nimmt die MS/MS-Spektren von einer bekannten und einer unbekannten Verbindung sowie die 2D-Struktur der bekannten Verbindung. Zuerst identifiziert es potenzielle Bereiche in der bekannten Verbindung, die strukturelle Ähnlichkeiten mit der unbekannten zeigen könnten.
Zuerst werden die MS/MS-Daten bereinigt, indem schwach ausgeprägte Peaks entfernt und die Daten normalisiert werden, um das Rauschen zu reduzieren. ModiFinder identifiziert dann die übereinstimmenden Peaks zwischen den bekannten und unbekannten Spektren. Peaks, die sich in der Masse ändern, werden als verschoben angesehen, während die, die gleich bleiben, als unverändert gelten.
Für jeden Peak im Spektrum weist ModiFinder eine Reihe möglicher Substrukturen basierend auf der Struktur der bekannten Verbindung zu. Dies folgt einem Prozess, der als kombinatorische Fragmentierung bekannt ist. Die Substrukturen jedes Peaks werden untersucht, um herauszufinden, wie sie sich auf die beobachteten Masseverschiebungen beziehen.
Wenn ein Peak verschoben ist, deutet das darauf hin, dass der Bereich, der mit diesem Peak verbunden ist, die Modifikationsstelle enthalten könnte. Umgekehrt werden Peaks, die sich nicht verschieben, als weniger wahrscheinlich betrachtet, dass sie die Modifikation enthalten. Die Scores, die die Wahrscheinlichkeit anzeigen, wo eine Modifikation vorkommt, werden für jedes Atom in der bekannten Struktur berechnet. Höhere Scores deuten auf eine grössere Wahrscheinlichkeit hin, dass dieses Atom die Modifikationsstelle ist.
Am Ende produziert ModiFinder eine Verteilung der Wahrscheinlichkeitswerte, die die wahrscheinlichsten Bereiche hervorhebt, wo die Modifikation in der Struktur der bekannten Verbindung liegen könnte.
Leistungsbewertung
Um zu bewerten, wie gut ModiFinder funktioniert, verwendeten Forscher Paare von bekannten Verbindungen, die jeweils nur eine strukturelle Modifikation hatten. Durch den Vergleich von ModiFinders Leistung mit zufälligen Auswahlmethoden und anderen Vorhersagetools konnte die Effektivität des Tools gemessen werden.
Die Bewertung konzentrierte sich auf zwei Hauptbereiche: wie nah die vorhergesagten Modifikationsstellen an den tatsächlichen Stellen lagen und wie informativ die Vorhersagen waren. Das Tool schnitt besser ab als zufällige Wahlmethoden bei der Identifizierung von Modifikationsstellen.
Mehrere Versionen von ModiFinder wurden getestet. Die grundlegende Version funktionierte gut, wurde aber mit Verfeinerungen aufgewertet, die molekulare Formeln und verwandte Verbindungen berücksichtigten. Eine „Oracle“-Version des Tools nutzte bekannte Modifikationsstellen, um noch bessere Leistungen zu erzielen.
Über 12.000 Paare von Verbindungen wurden analysiert, und ein bedeutender Teil zeigte mindestens einen verschobenen Peak. Die Ergebnisse zeigten, dass das Vorhandensein dieser verschobenen Peaks entscheidend war für die genaue Identifizierung von Modifikationsstellen.
Die Bedeutung verschobener Peaks
Die Ergebnisse unterstrichen die Wichtigkeit verschobener Peaks bei der Bestimmung von Modifikationsstellen. Spektren mit verschobenen Peaks lieferten im Allgemeinen bessere Ergebnisse bei der Identifizierung, wo Modifikationen auftraten. Je mehr verschobene Peaks vorhanden waren, desto besser war die Leistung von ModiFinder.
Selbst bei steigender Komplexität der Dateninterpretation führte die höhere Anzahl an verschobenen Peaks zu einer reichhaltigeren Auswahl potenzieller Substrukturen, die zu berücksichtigen waren, wodurch die Überlappung in den Interpretationen verringert wurde. Das half wiederum, die Genauigkeit bei der Bestimmung, wo Modifikationen wahrscheinlich stattfinden, zu verbessern.
Herausforderungen mit Mehrdeutigkeiten
Eine der ständigen Herausforderungen für ModiFinder war die mögliche Mehrdeutigkeit, die während des Prozesses der Substrukturanotation auftrat. Detailliertere Fragmentierungen führten manchmal zu höherer Mehrdeutigkeit, was die Identifizierung wahrer Modifikationsstellen erschwerte. Dies war besonders bei symmetrischen Strukturen deutlich, wo viele Atome als gleich wahrscheinlich für die Modifikationsstelle erscheinen konnten.
Um dem entgegenzuwirken, verwendeten die Forscher Strategien zur Reduzierung dieser Mehrdeutigkeit, wie zum Beispiel die Verfeinerung der Substrukturanweisungen mit computergestützter Unterstützung. Diese Schritte führten zu klareren Identifikationen der Modifikationsstelle.
Benutzeroberfläche und Fachwissen
Um das Tool zugänglicher zu machen, wurde eine benutzerfreundliche Weboberfläche entwickelt. Diese Schnittstelle ermöglicht Experten, ihr Wissen einzubringen, um potenziell falsche Substrukturen basierend auf ihren Erfahrungen auszuschliessen. Die Kombination aus Benutzereingaben und den computergestützten Ergebnissen von ModiFinder führte zu verbesserten Vorhersagen.
In praktischen Anwendungen konnten Fachleute das Tool erfolgreich nutzen, um Modifikationen in komplexen Naturprodukten zu identifizieren. Durch die Verfeinerung der vorhergesagten Stellen anhand ihres Verständnisses der Chemie der Verbindungen konnten sie die Lokalisierungsgenauigkeit erheblich steigern.
Anwendungen in der Praxis
Die Möglichkeiten von ModiFinder erstrecken sich auf mehrere Bereiche, die Massenspektrometrie zur Analyse nutzen, darunter Toxikologie, Pharmakologie und Arzneimittelentdeckung. Das Potenzial des Tools, die Identifikation chemischer Modifikationen zu unterstützen, kann zu besseren Erkenntnissen über Naturprodukte und deren Derivate führen.
Zum Beispiel untersuchten Forscher zwei Naturprodukte, Kirromycin und Naphthomycin B, und nutzten dabei ModiFinder, um strukturelle Modifikationen mit bemerkenswertem Erfolg zu lokalisieren. Beide Fälle zeigten, wie computergestützte Vorhersagen in Verbindung mit Expertenwissen zu höheren Lokalisierungswerten führen können, und verdeutlichten die praktischen Vorteile des Einsatzes von ModiFinder in der Forschung.
Fazit
Die Herausforderung, chemische Modifikationen in kleinen Molekülen zu identifizieren und zu lokalisieren, ist erheblich, aber Tools wie ModiFinder können diesen Prozess vereinfachen. Indem Teile der Analyse automatisiert werden und eine Expertenverfeinerung ermöglicht wird, kann ModiFinder die Effizienz und Genauigkeit bei der Identifizierung kleiner Moleküle erheblich verbessern.
Die ständige Entwicklung von Techniken zur Verbesserung der MS/MS-Fragmentierung und der Datenerfassungsmethoden wird wahrscheinlich weiterhin das Wachstum von Tools wie ModiFinder unterstützen. Während sich das Feld der Massenspektrometrie weiterentwickelt, bleibt das Potenzial für breitere Anwendungen dieser computergestützten Methoden in verschiedenen wissenschaftlichen Bereichen vielversprechend.
Titel: ModiFinder: Tandem Mass Spectral Alignment Enables Structural Modification Site Localization
Zusammenfassung: Untargeted tandem mass spectrometry (MS/MS) has become a high-throughput method to measure small molecules in complex samples. One key goal is the transformation of these MS/MS spectra into chemical structures. Computational techniques such as MS/MS library search have enabled the re-identification of known compounds. Analog library search and molecular networking extend this identification to unknown compounds. While there have been advancements in metrics for the similarity of MS/MS spectra of structurally similar compounds, there is still a lack of automated methods to provide site specific information about structural modifications. Here we introduce ModiFinder that leverages the alignment of peaks in MS/MS spectra between structurally related known and unknown small molecules. Specifically, ModiFinder focuses on shifted MS/MS fragment peaks in the MS/MS alignment. These shifted peaks putatively represent substructures of the known molecule that contain the site of the modification. ModiFinder synthesizes these information together and scores the likelihood for each atom in the known molecule to be the modification site. We demonstrate in this manuscript how ModiFinder can effectively localize modifications which extends the capabilities of MS/MS analog searching and molecular networking to accelerate the discovery of novel compounds.
Autoren: Mingxun Wang, M. R. Z. Shahneh, M. Strobel, G. A. Vitale, C. Geibel, Y. El Abiead, N. Garg, A. T. Aron, V. V. Phelan, D. Petras
Letzte Aktualisierung: 2024-02-21 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.02.17.580849
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.02.17.580849.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.