Clasificando Objetos Variables en Astronomía
Un nuevo modelo ayuda a clasificar objetos celestes variables de manera efectiva.
― 6 minilectura
Tabla de contenidos
En los últimos años, la astronomía ha avanzado un montón en el estudio de varios objetos celestiales, como estrellas, galaxias y otros fenómenos cósmicos. Este artículo presenta una visión simplificada de un proyecto de clasificación específico que se centra en identificar diferentes tipos de objetos variables en el cielo. Estos incluyen Núcleos Galácticos Activos (AGN), supernovas y otros transitorios, que a menudo cambian de brillo con el tiempo.
El Desafío de la Clasificación
Los astrónomos enfrentan desafíos debido a las grandes cantidades de datos que se recogen de los estudios del cielo. Los métodos tradicionales usados para analizar estos datos a menudo son inadecuados para manejar el volumen y la complejidad. Cada noche, encuestas como la Instalación de Transitorios Zwicky (ZTF) pueden producir más de 300,000 alertas sobre posibles eventos celestiales. Estas alertas provienen de observaciones que detectan cambios en el brillo, pero muchos objetos no producen cambios notorios, lo que lleva a detecciones perdidas.
Para enfrentar esto, los investigadores desarrollaron herramientas y modelos para clasificar estos objetos de manera efectiva. El objetivo es identificar con precisión las fuentes basándose en sus patrones de luz, teniendo en cuenta la variedad de comportamientos que exhiben estos objetos.
¿Qué es el ZTF?
La Instalación de Transitorios Zwicky es un proyecto diseñado para observar el cielo y detectar eventos transitorios. Utilizando un telescopio de campo amplio, el ZTF captura imágenes del cielo y las compara con el tiempo, buscando cambios en el brillo. Estos cambios pueden indicar la presencia de nuevas estrellas, supernovas u otros fenómenos astrofísicos.
Los datos generados por el ZTF son extensos, y los investigadores necesitan maneras eficientes para analizarlos y clasificarlos. Con millones de curvas de luz (las mediciones de brillo a lo largo del tiempo), es esencial tener un enfoque sistemático.
Creando un Modelo de Clasificación
El modelo de clasificación desarrollado durante este proyecto se basa en variaciones de brillo, color y otras características de las fuentes observadas. El objetivo principal es crear una jerarquía de clasificaciones que represente diferentes tipos de objetos celestiales.
Características Clave para la Clasificación
Para categorizar objetos de manera efectiva, el modelo usa varias características importantes derivadas de las curvas de luz, incluyendo:
- Variaciones de brillo a lo largo del tiempo.
- Mediciones de color tomadas de diferentes encuestas.
- Un puntaje que indica si un objeto se parece más a una estrella o a una galaxia.
Esta combinación permite al modelo distinguir con precisión entre diferentes tipos de objetos celestiales.
Entrenando el Modelo
Para entrenar el modelo de clasificación, los investigadores usaron datos de varios catálogos de objetos conocidos. Este conjunto de datos etiquetados se cruzó con los datos recogidos del ZTF. Al comparar los patrones de brillo con clasificaciones conocidas, el modelo se entrenó para identificar patrones similares en nuevas observaciones.
Creando un Conjunto Etiquetado
El conjunto etiquetado es esencial para el entrenamiento, ya que proporciona puntos de referencia. Los investigadores crearon este conjunto cruzando los datos del ZTF con catálogos astronómicos existentes. Al combinar múltiples fuentes de clasificaciones conocidas, garantizaron un conjunto de datos de entrenamiento completo.
La Taxonomía de Clasificación
El sistema de clasificación es jerárquico, lo que significa que organiza las fuentes en categorías y subcategorías. En el nivel más alto, las fuentes se dividen en estrellas no variables, galaxias no variables y fuentes variables.
Subcategorías de Fuentes Variables
Las fuentes variables se dividen además en transitorios, variables estocásticas y variables periódicas.
- Transitorios: Estos objetos cambian rápidamente, como supernovas u otros eventos explosivos.
- Variables Estocásticas: Este grupo incluye objetos como AGNs que exhiben variaciones aleatorias de brillo a lo largo del tiempo.
- Variables Periódicas: Estas tienen patrones de brillo regulares, como ciertos tipos de estrellas que cambian de brillo en un horario predecible.
Cómo Funciona el Modelo
Usando las características mencionadas antes, el modelo aplica un método conocido como un bosque aleatorio equilibrado jerárquico. Este método consiste en establecer diferentes niveles de clasificación, cada uno diseñado para manejar grupos específicos de fuentes.
Proceso de Clasificación
- Clasificación Inicial: Primero, el modelo determina si un objeto es una estrella no variable, una galaxia no variable o variable.
- Jerarquía Adicional: Si se clasifica como variable, el modelo avanza al siguiente nivel de clasificación, diferenciando entre fuentes transitorias, estocásticas y periódicas.
- Clasificación Final: El último nivel divide los transitorios en tipos específicos como supernovas y variables catastróficas, y el grupo estocástico en AGNs y objetos estelares jóvenes.
Evaluación del Desempeño
El rendimiento del modelo se evalúa usando métricas como precisión, recall y F1-score. Estas ayudan a medir qué tan bien el modelo identifica correctamente cada tipo de objeto.
Entendiendo la Precisión del Modelo
A través de pruebas que involucran clasificaciones conocidas, el modelo mostró buena precisión, particularmente para fuentes AGN. Cuando se agruparon, las cuatro clasificaciones principales de AGN mostraron alta precisión y recall, indicando la efectividad del modelo para identificar estos candidatos.
Aplicación al Cielo ZTF/4MOST
Los investigadores aplicaron el modelo de clasificación al área del cielo cubierta tanto por el ZTF como por otro proyecto observacional llamado 4MOST. Al filtrar los datos para excluir regiones con estrellas densas o fondos complicados, se centraron en muestras más limpias para la clasificación.
Resultados de la Clasificación
A partir de los datos analizados, se identificaron miles de AGNs y candidatos Blazar potenciales en el cielo observado. El modelo mostró una tasa de éxito más alta usando los datos en la banda r del ZTF en comparación con los datos de la banda g, sugiriendo que diferentes condiciones en la captura de luz modifican los resultados.
Importancia de la Clasificación Correcta
La clasificación precisa es crucial en la astronomía moderna, ya que ayuda a los científicos a entender la naturaleza y distribución de los objetos celestiales. Identificar eventos transitorios y varios tipos de estrellas variables contribuye significativamente a nuestro conocimiento de la evolución estelar y fenómenos cósmicos.
Conclusión
El desarrollo de este modelo de clasificación representa un paso significativo para enfrentar los desafíos que presentan los grandes conjuntos de datos astronómicos. Al utilizar técnicas avanzadas y un enfoque jerárquico, los investigadores pueden clasificar sistemáticamente la multitud de objetos variables en el cielo nocturno. Este esfuerzo no solo ayuda en el estudio de cuerpos celestiales individuales, sino que también mejora nuestra comprensión general del universo y sus muchos misterios.
A medida que estas tecnologías y técnicas continúan mejorando, los astrónomos estarán mejor equipados para revelar los secretos del cosmos y desentrañar las complejidades del universo que habitamos.
Título: Persistent and occasional: searching for the variable population of the ZTF/4MOST sky using ZTF data release 11
Resumen: We present a variability, color and morphology based classifier, designed to identify transients, persistently variable, and non-variable sources, from the Zwicky Transient Facility (ZTF) Data Release 11 (DR11) light curves of extended and point sources. The main motivation to develop this model was to identify active galactic nuclei (AGN) at different redshift ranges to be observed by the 4MOST ChANGES project. Still, it serves as a more general time-domain astronomy study. The model uses nine colors computed from CatWISE and PS1, a morphology score from PS1, and 61 single-band variability features computed from the ZTF DR11 g and r light curves. We trained two versions of the model, one for each ZTF band. We used a hierarchical local classifier per parent node approach, where each node was composed of a balanced random forest model. We adopted a 17-class taxonomy, including non-variable stars and galaxies, three transient classes, five classes of stochastic variables, and seven classes of periodic variables. The macro averaged precision, recall and F1-score are 0.61, 0.75, and 0.62 for the g-band model, and 0.60, 0.74, and 0.61, for the r-band model. When grouping the four AGN classes into one single class, its precision, recall, and F1-score are 1.00, 0.95, and 0.97, respectively, for both the g and r bands. We applied the model to all the sources in the ZTF/4MOST overlapping sky, avoiding ZTF fields covering the Galactic bulge, including 86,576,577 light curves in the g-band and 140,409,824 in the r-band. Only 0.73\% of the g-band light curves and 2.62\% of the r-band light curves were classified as stochastic, periodic, or transient with high probability ($P_{init}\geq0.9$). We found that, in general, more reliable results are obtained when using the g-band model. Using the latter, we identified 384,242 AGN candidates, 287,156 of which have $P_{init}\geq0.9$.
Autores: P. Sánchez-Sáez, J. Arredondo, A. Bayo, P. Arévalo, F. E. Bauer, G. Cabrera-Vives, M. Catelan, P. Coppi, P. A. Estévez, F. Förster, L. Hernández-García, P. Huijse, R. Kurtev, P. Lira, A. M. Muñoz Arancibia, G. Pignata
Última actualización: 2023-04-17 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2304.08519
Fuente PDF: https://arxiv.org/pdf/2304.08519
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://orcid.org/#1
- https://cdsarc.cds.unistra.fr/cgi-bin/qcat?J/A+A/
- https://doi.org/10.5281/zenodo.7826044
- https://github.com/alercebroker/ztf_dr
- https://github.com/PaulaSanchezSaez/ZTF-DR11-classifier
- https://irsa.ipac.caltech.edu/data/ZTF/docs/releases/dr11/ztf_release_notes_dr11.pdf
- https://faculty.washington.edu/ivezic/sdss/catalogs/stripe82.html
- https://www.wis-tns.org/
- https://github.com/alercebroker/minimal_astroide
- https://github.com/phuijse/P4J
- https://www.nlhpc.cl/infraestructura/
- https://github.com/hollance/reliability-diagrams
- https://irsa.ipac.caltech.edu/data/ZTF/docs/releases/dr11/src/TspanVsDT
- https://www.cosmos.esa.int/gaia
- https://www.cosmos.esa.int/web/gaia/dpac/consortium