Avances en Espectrometría de Masas para Análisis Químico
Un nuevo enfoque mejora las predicciones de similitud química en espectrometría de masas.
― 7 minilectura
Tabla de contenidos
La espectrometría de masas es un método que se usa para descubrir qué químicos hay en diferentes sustancias, como extractos naturales y mezclas biológicas. En el campo de la Metabolómica, que estudia pequeñas moléculas en organismos vivos, la espectrometría de masas juega un papel clave. Un enfoque común se llama metabolómica no dirigida. Esto significa que los investigadores analizan todas las moléculas presentes sin enfocarse en objetivos específicos.
Para entender la estructura de estas moléculas, a menudo se usa una técnica llamada Espectrometría de masas en tándem (MS/MS). Esto implica descomponer las moléculas en piezas más pequeñas y analizarlas para ver qué son. Ahora, los investigadores utilizan programas de computadora para ayudar a interpretar los resultados de estas lecturas de espectrometría de masas, lo que facilita determinar la estructura de las moléculas.
El papel de los modos iónicos
La espectrometría de masas puede funcionar en dos modos diferentes: modo de ion positivo y modo de ion negativo. El tipo de modo que se use afecta qué tan bien se pueden detectar ciertas moléculas. Por eso, los científicos suelen analizar muestras utilizando ambos modos para obtener una visión más completa de la composición química.
Al comparar los espectros de masas de estos dos modos, los patrones pueden verse bastante diferentes. Esto significa que las formas tradicionales de compararlos, como calcular puntajes coseno, no funcionan bien cuando los datos provienen de diferentes modos iónicos. Como resultado, los investigadores a menudo analizan los datos de iones positivos y negativos por separado, usando diferentes bibliotecas de referencia y creando redes separadas.
Existen algunos métodos que intentan combinar ambos modos en una sola red, pero pueden ser complicados y requieren mediciones precisas. Si hubiera una mejor manera de vincular los dos modos iónicos, se agilizaría el proceso y se permitiría a los investigadores usar una biblioteca de datos más amplia en sus análisis.
Un nuevo enfoque para predecir Similitudes Químicas
En este estudio, se desarrolló un nuevo método para ayudar a predecir similitudes entre espectros de masas de diferentes modos iónicos. Este método se basa en un tipo de inteligencia artificial conocida como red neuronal siamés, que ha demostrado evaluar de manera efectiva las similitudes químicas.
El modelo original solo se entrenó con datos de un modo iónico a la vez, lo que limitaba su eficacia. El nuevo modelo utiliza datos de ambos modos, positivo y negativo, lo que significa que puede evaluar las similitudes entre los dos de manera más precisa. Además, el nuevo enfoque toma en cuenta información extra sobre las muestras, como la masa precursora y el tipo de ionización utilizada. Estos datos adicionales mejoran la capacidad del modelo para predecir similitudes.
Además, el estudio introduce una forma de determinar qué tan confiables son las predicciones. Los usuarios pueden filtrar resultados con baja confianza, facilitando el enfoque en las predicciones más confiables.
Mejoras clave en la metodología
El modelo revisado tiene muchas mejoras sobre su predecesor. Un cambio importante es el uso de una estructura de codificación más sencilla y eficiente, que acelera el procesamiento de datos. Entrenar nuevos modelos también se ha vuelto más fácil y eficiente.
El nuevo modelo, que utiliza datos de ambos modos iónicos, mostró un buen desempeño al predecir similitudes dentro de los mismos modos iónicos también. Superó a modelos anteriores que se centraban solo en un tipo de modo iónico. Este enfoque dual abre nuevas oportunidades para conectar ambos modos en los análisis. Ahora, los investigadores pueden crear redes de moléculas que incluyan datos de modos de iones positivos y negativos.
Datos de entrada y proceso de entrenamiento
Para el nuevo modelo, los espectros de masas fueron limpiados y organizados antes del análisis. Solo se utilizaron aquellos espectros que eran lo suficientemente claros -que contenían un número mínimo de picos significativos- para el entrenamiento. De esta manera, el modelo tiene más probabilidades de hacer predicciones precisas porque se basa en datos de alta calidad.
Durante el entrenamiento, el modelo aprendió a identificar patrones en los espectros de masas y a compararlos de manera efectiva. Los investigadores ajustaron varios parámetros y configuraciones para mejorar aún más el rendimiento del modelo.
Evaluando la calidad y fiabilidad
Otro enfoque de la investigación fue la calidad de los datos de entrada. El modelo puede tener problemas cuando se le presentan espectros de baja calidad, lo que puede llevar a predicciones inexactas. Para abordar esto, los investigadores crearon una nueva herramienta para evaluar la calidad de las incrustaciones de espectros, es decir, las representaciones de los datos creadas por el modelo.
Al identificar ejemplos de menor calidad, el modelo puede mejorar la precisión de las predicciones al eliminar estas entradas poco confiables. Esto permite a los investigadores tener más confianza en los resultados generados por el modelo.
Comparando con métodos tradicionales
Los métodos tradicionales para medir similitudes, como los puntajes coseno, se centran principalmente en los patrones específicos dentro de los datos de fragmentación. Aunque estos métodos pueden ser útiles, a menudo no tienen en cuenta las variaciones causadas por pequeños cambios en las estructuras químicas. Esto puede dificultar la identificación de compuestos verdaderamente similares.
El nuevo modelo MS2DeepScore, por otro lado, ha sido entrenado con una gama más amplia de ejemplos. Puede comparar espectros de masas de manera confiable, incluso cuando los datos provienen de diferentes condiciones. Así, ofrece una alternativa más robusta a los métodos anteriores.
Aplicaciones potenciales
La mejor capacidad para predecir similitudes químicas a través de modos iónicos trae posibilidades emocionantes para los investigadores. Por ejemplo, pueden crear gráficos basados en similitudes que mezclan datos de ambos modos de iones positivos y negativos. Esto facilitará análisis más completos de los datos de espectrometría de masas.
Además, los investigadores pueden comparar espectros de modo de ion negativo con una gran biblioteca de datos de modo de ion positivo, enriqueciendo así sus conocimientos sobre interacciones químicas e identidades de compuestos. Esto podría llevar a nuevos hallazgos y a una mejor comprensión de procesos biológicos complejos.
Conclusión
Los avances en el análisis espectral de masas a través del modelo MS2DeepScore presentan oportunidades significativas para la investigación en metabolómica y campos relacionados. Con la capacidad de integrar datos de múltiples modos iónicos y evaluar mejor la fiabilidad de las predicciones, los científicos están mejor equipados para explorar el paisaje químico de los organismos vivos.
A medida que los investigadores continúan empujando los límites de lo que es posible con la espectrometría de masas, el impacto de estas metodologías en nuestra comprensión de la biología será, probablemente, profundo. La capacidad de establecer conexiones entre diferentes tipos de datos agiliza la investigación y fomenta nuevos descubrimientos que podrían tener importantes implicaciones en varios dominios científicos.
Título: Reliable cross-ion mode chemical similarity prediction between MS2 spectra
Resumen: Mass spectrometry is commonly used to characterize metabolites in untargeted metabolomics. This can be done in positive and negative ionization mode, a choice typically guided by the fraction of metabolites a researcher is interested in. During analysis, mass spectral comparisons are widely used to enable annotation through reference libraries and to facilitate data organization through networking. However, until now, such comparisons between mass spectra were restricted to mass spectra of the same ionization mode, as the two modes generally result in very distinct fragmentation spectra. To overcome this barrier, here, we have implemented a machine learning model that can predict chemical similarity between spectra of different ionization modes. Hence, our new MS2DeepScore 2.0 model facilitates the seamless integration of positive and negative ionization mode mass spectra into one analysis pipeline. This creates entirely new options for data exploration, such as mass spectral library searching of negative ion mode spectra in positive ion mode libraries or cross-ionization mode molecular networking. Furthermore, to improve the reliability of predictions and better cope with unseen data, we have implemented a method to estimate the quality of prediction. This will help to avoid false predictions on spectra with low information content or spectra that substantially differ from the training data. We anticipate that the MS2DeepScore 2.0 model will extend our current capabilities in organizing and annotating untargeted metabolomics profiles.
Autores: Niek F. de Jonge, D. Joas, L.-J. Truong, J. J. J. van der Hooft, F. Huber
Última actualización: 2024-04-02 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.03.25.586580
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.03.25.586580.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.