Clasificación de objetos celestiales: Perspectivas de la encuesta MiniJPAS
Este estudio usa redes neuronales para clasificar estrellas, galaxias y cuásares en el universo.
― 5 minilectura
Tabla de contenidos
La encuesta miniJPAS es un estudio astronómico que busca identificar y clasificar varios objetos celestiales, como estrellas, galaxias y cuásares. Esta encuesta es parte de un proyecto más grande llamado J-PAS, que implica observar una gran área del cielo en múltiples bandas ópticas. El objetivo es clasificar eficazmente las fuentes puntuales utilizando técnicas avanzadas.
La Importancia de Clasificar Objetos Celestiales
Clasificar objetos astronómicos es crucial para entender el universo. Diferentes tipos de cuerpos celestiales emiten luz de maneras únicas, lo que puede proporcionar información sobre su composición, distancia y evolución. Sin embargo, distinguir entre estrellas, galaxias y cuásares es complicado, especialmente cuando los objetos son tenues o están lejanos.
En este estudio, utilizamos redes neuronales artificiales (ANN) para clasificar estas fuentes celestiales. Las ANN son modelos de computadora que imitan la forma en que el cerebro humano procesa información. Pueden aprender de los datos y hacer predicciones basadas en ese aprendizaje.
La Encuesta MiniJPAS
La encuesta miniJPAS capturó datos de un área del cielo conocida como el campo AEGIS. Esta región se observó en 60 bandas ópticas diferentes, lo que permitió un estudio detallado de varios objetos. El objetivo principal era clasificar los objetos en cuatro categorías:
- Estrellas
- Galaxias
- Cuásares de bajo corrimiento al rojo
- Cuásares de alto corrimiento al rojo
El proceso de clasificación dependía del brillo y el color de los objetos, obtenidos de las observaciones de miniJPAS.
Entrenando las Redes Neuronales
Para entrenar las redes neuronales, primero creamos datos simulados. Los datos simulados son conjuntos de datos que parecen observaciones reales pero permiten pruebas controladas. Estos datos sirvieron de base para entrenar las redes. Usamos varias características, o entradas, como flujo de luz y colores para ayudar a las redes a aprender a qué clase pertenecía cada objeto.
Desarrollamos dos tipos de redes neuronales, cada una entrenada con diferentes conjuntos de entradas. Una usó flujos relativos (mediciones de luz en relación con una banda específica), mientras que la otra utilizó colores y magnitudes.
Aumento de Datos
El aumento de datos es una técnica utilizada para aumentar la cantidad de datos de entrenamiento sin recolectar más datos en realidad. En este estudio, utilizamos un método llamado hibridación, donde combinamos características de diferentes clases para crear nuevos ejemplos de entrenamiento. Este enfoque buscaba mejorar el aprendizaje y el rendimiento de las redes.
Sin embargo, encontramos que simplemente aumentar la cantidad de datos mezclados no mejoró significativamente la capacidad de las redes para clasificar los objetos con precisión. El conjunto de entrenamiento original ya contenía suficiente variación para funcionar bien.
Evaluando el Rendimiento
Para evaluar el rendimiento de los clasificadores, usamos varias métricas que nos permitieron medir qué tan bien las redes clasificaban los objetos. Una herramienta útil fue la matriz de confusión. Esta matriz mostraba las clasificaciones reales y predichas lado a lado, destacando dónde las redes confundían diferentes clases.
Otra métrica importante fue la Puntuación F1, que considera tanto la precisión (cuántos objetos predichos eran correctos) como el recall (cuántos objetos reales fueron identificados correctamente). Esta puntuación proporcionó una evaluación equilibrada del rendimiento de los clasificadores.
Resultados de Muestras de Prueba Simuladas
Al probar los clasificadores en los datos simulados, observamos que la precisión variaba dependiendo del brillo de los objetos. Los objetos más tenues eran más difíciles de clasificar correctamente, lo que es un problema común en las encuestas astronómicas.
Para los cuásares de alto corrimiento al rojo, logramos altas puntuaciones F1, lo que indica que los clasificadores podían identificar eficazmente estos objetos lejanos. Sin embargo, la confusión ocurrió principalmente entre cuásares de bajo corrimiento al rojo y galaxias, ya que estas dos clases a menudo comparten características similares.
Observaciones Reales
También evaluamos el rendimiento de nuestros clasificadores en datos reales obtenidos del Sloan Digital Sky Survey (SDSS). Esta comparación ayudó a determinar si nuestros modelos eran precisos al clasificar observaciones reales. Los resultados fueron prometedores, mostrando que nuestros clasificadores podían funcionar bien con datos reales, aunque se notaron algunas limitaciones debido al tamaño de la muestra más pequeña.
Desafíos en la Clasificación
Un desafío importante identificado durante el estudio fue la superposición entre cuásares de bajo corrimiento al rojo y galaxias. En muchos casos, la luz de una galaxia podía enmascarar o mezclarse con la luz de un cuásar, dificultando la clasificación. Esta ambigüedad es particularmente pronunciada en ciertos casos, donde los clasificadores a menudo producían clasificaciones dobles.
Conclusión y Direcciones Futuras
En resumen, la encuesta miniJPAS muestra el potencial de usar redes neuronales artificiales para clasificar objetos celestiales de manera efectiva. El estudio mostró que, aunque hay desafíos, especialmente con respecto a las clases superpuestas, el rendimiento general de los modelos es prometedor.
El trabajo futuro implicará reunir más datos para refinar y reentrenar las redes neuronales, mejorando su capacidad para clasificar no solo los objetos presentes en la encuesta, sino también proporcionar una comprensión más profunda de la estructura y composición del universo. A medida que se desarrollen nuevas tecnologías y metodologías, el campo de la clasificación astronómica seguirá evolucionando.
Título: The miniJPAS survey quasar selection III: Classification with artificial neural networks and hybridisation
Resumen: This paper is part of large effort within the J-PAS collaboration that aims to classify point-like sources in miniJPAS, which were observed in 60 optical bands over $\sim$ 1 deg$^2$ in the AEGIS field. We developed two algorithms based on artificial neural networks (ANN) to classify objects into four categories: stars, galaxies, quasars at low redshift ($z < 2.1)$, and quasars at high redshift ($z \geq 2.1$). As inputs, we used miniJPAS fluxes for one of the classifiers (ANN$_1$) and colours for the other (ANN$_2$). The ANNs were trained and tested using mock data in the first place. We studied the effect of augmenting the training set by creating hybrid objects, which combines fluxes from stars, galaxies, and quasars. Nevertheless, the augmentation processing did not improve the score of the ANN. We also evaluated the performance of the classifiers in a small subset of the SDSS DR12Q superset observed by miniJPAS. In the mock test set, the f1-score for quasars at high redshift with the ANN$_1$ (ANN$_2$) are $0.99$ ($0.99$), $0.93$ ($0.92$), and $0.63$ ($0.57$) for $17 < r \leq 20$, $20 < r \leq 22.5$, and $22.5 < r \leq 23.6$, respectively, where $r$ is the J-PAS rSDSS band. In the case of low-redshift quasars, galaxies, and stars, we reached $0.97$ ($0.97$), $0.82$ ($0.79$), and $0.61$ ($0.58$); $0.94$ ($0.94$), $0.90$ ($0.89$), and $0.81$ ($0.80$); and $1.0$ ($1.0$), $0.96$ ($0.94$), and $0.70$ ($0.52$) in the same r bins. In the SDSS DR12Q superset miniJPAS sample, the weighted f1-score reaches 0.87 (0.88) for objects that are mostly within $20 < r \leq 22.5$. Finally, we estimate the number of point-like sources that are quasars, galaxies, and stars in miniJPAS.
Autores: G. Martínez-Solaeche, Carolina Queiroz, R. M. González Delgado, Natália V. N. Rodrigues, R. García-Benito, Ignasi Pérez-Ràfols, L. Raul Abramo, Luis Díaz-García, Matthew M. Pieri, Jonás Chaves-Montero, A. Hernán-Caballero, J. E. Rodríguez-Martín, Silvia Bonoli, Sean S. Morrison, Isabel Márquez, J. M. Vílchez, C. López-Sanjuan, A. J. Cenarro, R. A. Dupke, A. Martín-Franch, J. Varel, H. Vázquez Ramió, D. Cristóbal-Hornillos, M. Moles, J. Alcaniz, N. Benitez, J. A. Fernández-Ontiveros, A. Ederoclite, V. Marra, C. Mendes de Oliveira, K. Taylor
Última actualización: 2023-03-22 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2303.12684
Fuente PDF: https://arxiv.org/pdf/2303.12684
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.