Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Física# Física de altas energías - Experimento# Física de altas energías - Fenomenología# Análisis de datos, estadística y probabilidad

Mejorando la calibración de energía de jet con aprendizaje automático

Este estudio utiliza aprendizaje automático para mejorar la calibración de energía de jets en el LHC.

― 7 minilectura


Avance en la calibraciónAvance en la calibraciónde energía de jetsjets con precisión.automático para medir la energía deEsta investigación utiliza aprendizaje
Tabla de contenidos

Medir la energía de los jets de partículas de colisiones es clave para la investigación en física en el Gran Colisionador de Hadrones (LHC). En este estudio, usamos modelos avanzados de machine learning para mejorar cómo calibramos la energía de estos jets. Creamos un sistema en la nube para ayudar con esta tarea, lo que nos permite realizar experimentos de manera eficiente, ajustar nuestros modelos y ponerlos a disposición para su uso.

Importancia de la Calibración de Energía de Jets

Una calibración precisa de la energía de los jets es necesaria para muchos estudios de física, incluyendo el examen de las propiedades de partículas como el quark top. Los jets se forman cuando colisiones de alta energía rompen partículas, lo que lleva a rociados de otras partículas. Necesitamos asegurarnos de que la energía medida de estos jets refleje la verdadera energía de las partículas producidas en las colisiones.

Machine Learning en Física de Alta Energía

El machine learning ha transformado la física de alta energía al ayudar a los investigadores a analizar grandes cantidades de datos de colisiones de partículas. Un método prometedor implica el deep learning, en particular usando redes neuronales gráficas, que son efectivas en muchas tareas, incluyendo el seguimiento de partículas y la clasificación de eventos.

El Experimento Compact Muon Solenoid

En el LHC, el experimento Compact Muon Solenoid (CMS) recoge datos sobre los jets de partículas producidos por colisiones de protones. Estos jets surgen de partículas interactivas llamadas partones, que pasan por un proceso que resulta en un rociado colimado de partículas. Calibrar correctamente las energías de los jets es complejo y requiere combinar datos de simulación con datos reales para asegurar precisión.

Esfuerzos Previos y Nuevas Estrategias

La colaboración CMS ya ha aplicado técnicas de deep learning para mejorar las mediciones de energía, especialmente para jets con propiedades específicas. Este estudio busca extender estas técnicas a todos los tipos de jets usando datos disponibles públicamente del portal OpenData de CERN. También incorporamos avances modernos en machine learning para entender mejor las características de los jets.

Desafíos en Flujos de Trabajo de Machine Learning

Implementar sistemas de machine learning puede ser complicado para muchas organizaciones. Por eso, proponemos una estrategia basada en la nube para simplificar el proceso de calibración de energía de jets. Usamos Kubeflow, una plataforma que soporta diversas tareas de machine learning, para gestionar nuestros experimentos de manera eficiente y hacerlos escalables.

Fuentes de Datos y Preparaciones

Analizamos datos de colisiones simuladas en el LHC. El conjunto de datos incluye jets de partículas formados de colisiones de alta energía y proporciona una vista detallada de cómo se comportan diferentes tipos de partículas en los detectores. Al limpiar y preparar estos datos, aseguramos que podamos aplicar efectivamente nuestras técnicas de calibración.

Correcciones de Energía de Jets

Calibrar la energía de los jets implica corregir factores que pueden distorsionar las mediciones, como la pérdida de energía cuando las partículas se mueven a través del detector. Usamos un proceso de múltiples pasos para abordar estos problemas, corrigiendo cosas como el pileup, donde ocurren colisiones adicionales en el mismo período de tiempo que el evento principal.

Abordando la Subestructura de los Jets

Los métodos tradicionales de calibración de energía pueden pasar por alto los detalles de cómo están estructurados los jets. Creemos que al analizar mejor la subestructura de los jets, podemos mejorar nuestras correcciones de energía. Usar técnicas de machine learning cuantitativas nos permite lograr este objetivo.

Modelos de Regresión para Calibración de Energía

Desarrollamos modelos de regresión de machine learning diseñados para predecir la energía de los jets según sus características. Al comparar los valores predichos con las mediciones reales, podemos enseñar al modelo a reconocer patrones y mejorar su precisión con el tiempo.

Selección de Características

Nuestros modelos utilizan una variedad de características relacionadas tanto con el jet completo como con partículas individuales dentro de él. Estas incluyen propiedades físicas como el momento y la masa, ayudando al modelo a aprender las diferencias entre los diversos tipos de jets.

Proceso de Entrenamiento

Para entrenar los modelos, dividimos el conjunto de datos en secciones para entrenamiento, validación y prueba. Esto asegura que tengamos suficientes datos para medir con precisión el rendimiento del modelo. Aplicamos técnicas para manejar la gran cantidad de datos de manera efectiva, usando recursos en la nube para acelerar la fase de entrenamiento.

Pipeline en la Nube para Machine Learning

El pipeline basado en la nube ofrece varias ventajas, incluyendo la capacidad de realizar múltiples experimentos rápidamente. Al usar Kubeflow, podemos automatizar tareas y gestionar recursos de manera efectiva. Esta configuración permite a los investigadores enfocarse en mejorar sus modelos sin preocuparse por la infraestructura subyacente.

Optimización de Hiperparámetros

Para obtener los mejores resultados de nuestros modelos de machine learning, optimizamos varias configuraciones, llamadas hiperparámetros. Al usar sistemas automatizados para probar diferentes combinaciones, podemos identificar rápidamente las mejores configuraciones para nuestros modelos.

Exportación y Servicio del Modelo

Una vez que tenemos el modelo óptimo, lo convertimos en un formato que se puede usar fácilmente por otras aplicaciones. Esto facilita la implementación de nuestro modelo en escenarios del mundo real, donde puede ser accedido y utilizado por varios usuarios para sus necesidades de investigación.

Evaluación del Rendimiento

Después de exportar el modelo, evaluamos su rendimiento observando cuán precisamente predice las energías de los jets. Esto implica comparar nuestros resultados con métodos tradicionales para entender dónde vemos mejoras y cuán significativas son esas mejoras.

Manejando la Complejidad Computacional

Diferentes modelos de machine learning tienen distintos niveles de complejidad. Comparamos nuestros modelos para entender cuál ofrece el mejor equilibrio entre rendimiento y eficiencia computacional. Esto implica analizar métricas como el número de cálculos requeridos y el tiempo tomado para las predicciones.

Tiempos de Inferencia y Eficiencia del Modelo

También medimos cuánto tiempo tardan nuestros modelos en proporcionar predicciones. Esto es importante para aplicaciones en tiempo real donde la velocidad es esencial. Nuestro objetivo es asegurar que incluso los modelos más complejos puedan entregar resultados rápidamente.

Dependencia del Sabor de la Respuesta de Energía

Un aspecto importante que analizamos es cuán bien funcionan los modelos a través de diferentes tipos de jets, conocidos como sabores. Comparamos las respuestas de energía de cada sabor para ver si nuestros modelos pueden reducir las discrepancias que los métodos tradicionales suelen tener problemas en manejar.

Resolución de Energía

También examinamos la resolución de energía, una medida de cuán precisamente se predicen los niveles de energía de los jets. Al observar estos datos, podemos ver si nuestras técnicas ofrecen una mejor resolución que los métodos existentes.

Conclusión

En este estudio, exploramos cómo el machine learning puede mejorar la calibración de energía de jets en física de partículas. Usando modelos avanzados y un flujo de trabajo estructurado basado en la nube, buscamos lograr un rendimiento superior en la medición de energías de jets. Nuestros hallazgos indican que el deep learning puede mejorar significativamente nuestra comprensión de los jets de partículas, ofreciendo resultados robustos que empujan los límites de los métodos actuales. A medida que el machine learning sigue evolucionando, presenta oportunidades emocionantes para avances en la investigación de física de alta energía.

Fuente original

Título: Jet energy calibration with deep learning as a Kubeflow pipeline

Resumen: Precise measurements of the energy of jets emerging from particle collisions at the LHC are essential for a vast majority of physics searches at the CMS experiment. In this study, we leverage well-established deep learning models for point clouds and CMS open data to improve the energy calibration of particle jets. To enable production-ready machine learning based jet energy calibration an end-to-end pipeline is built on the Kubeflow cloud platform. The pipeline allowed us to scale up our hyperparameter tuning experiments on cloud resources, and serve optimal models as REST endpoints. We present the results of the parameter tuning process and analyze the performance of the served models in terms of inference time and overhead, providing insights for future work in this direction. The study also demonstrates improvements in both flavor dependence and resolution of the energy response when compared to the standard jet energy corrections baseline.

Autores: Daniel Holmberg, Dejan Golubovic, Henning Kirschenmann

Última actualización: 2023-09-22 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2308.12724

Fuente PDF: https://arxiv.org/pdf/2308.12724

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares