Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Aprendizaje automático# Inteligencia artificial

Avances en la detección de anomalías para datos de series temporales

Nuevo método detecta anomalías en datos de series temporales a pesar de los valores faltantes.

― 8 minilectura


Detección de Anomalías enDetección de Anomalías enSeries de Tiempopesar de los valores faltantes.Nuevo método aborda la detección a
Tabla de contenidos

La tecnología ha avanzado rápido, lo que ha llevado a un aumento masivo en la cantidad de datos de series temporales producidos en varias industrias. Estos datos vienen de diferentes fuentes como la salud, la infraestructura e incluso naves espaciales. Muchos dispositivos y sensores recogen estos datos a lo largo del tiempo, resultando en conjuntos de datos complejos con muchas variables. Por eso, dependemos mucho de métodos automatizados para encontrar eventos inusuales en estos datos, lo que puede ayudar a prevenir desastres antes de que ocurran. Idealmente, usaríamos algoritmos que puedan manejar grandes cantidades de datos y funcionar bien a pesar del ruido que viene de sistemas del mundo real. Así que hay una gran demanda de modelos sólidos que puedan detectar estas anomalías automáticamente.

Aunque tenemos muchos datos de series temporales que muestran patrones normales, los eventos inesperados o anomalías suceden raramente. Esto hace que sea difícil recoger y etiquetar estos datos para análisis. Como resultado, los métodos que no requieren datos etiquetados, conocidos como técnicas de Detección de Anomalías no supervisadas, han ganado popularidad. Algunas técnicas tradicionales incluyen modelos estadísticos, enfoques basados en la distancia y métodos basados en distribuciones. Sin embargo, estos pueden tener problemas para captar las relaciones complicadas en los datos.

Recientemente, el aprendizaje profundo ha avanzado significativamente en este área. Los primeros intentos usaron redes de memoria a largo y corto plazo (LSTM) para detectar anomalías basándose en errores en las predicciones. Otros métodos se han centrado en reconstruir datos para encontrar anomalías. Sin embargo, los métodos LSTM a menudo no tienen en cuenta explícitamente las relaciones entre diferentes variables, lo que puede limitar su efectividad en conjuntos de datos complejos. Para superar esto, algunos modelos más nuevos utilizan redes neuronales de grafos para entender mejor las relaciones espaciales y temporales en los datos.

A pesar de estos avances, los métodos actuales de aprendizaje profundo a menudo necesitan datos bien organizados que estén muestreados uniformemente, lo que no siempre es el caso en la vida real. Los datos faltantes y las observaciones irregulares son comunes debido a limitaciones de sensores u otros problemas. Por lo tanto, es esencial desarrollar métodos que puedan detectar efectivamente anomalías incluso cuando tenemos datos faltantes.

Técnicas simples como el relleno de ceros, la interpolación y otros métodos estadísticos pueden llenar valores faltantes. Sin embargo, los experimentos han mostrado que usar estos métodos antes de la detección puede debilitar el rendimiento general. Esto resalta la necesidad de métodos alternativos para encontrar anomalías en conjuntos de datos con valores faltantes.

Desafíos en la Detección de Anomalías

Detectar anomalías en conjuntos de datos con valores faltantes presenta varios desafíos:

  1. Esparcimiento en los Datos de Entrenamiento: La irregularidad en los datos puede significar que patrones importantes no se aprenden durante el entrenamiento.
  2. Puntuación de Anomalías con Observaciones Irregulares: Los modelos deben ser capaces de identificar anomalías en tiempo real, incluso si algunos valores observados faltan.
  3. Modelando Relaciones: Los datos de series temporales multivariantes requieren una comprensión profunda de las relaciones entre diferentes variables, lo que puede complicarse aún más por los datos faltantes.

Para abordar estos desafíos, presentamos un nuevo enfoque que usa métodos predictivos combinados con una estructura de grafo para modelar datos de series temporales, sin importar los valores faltantes. Nuestro método comienza llenando los puntos de datos faltantes para crear una serie continua de datos. Luego empleamos procesos específicos para analizar los datos desde perspectivas espaciales y temporales, abordando los primeros y terceros desafíos. Además, introducimos un método de puntuación de anomalías que evalúa cuán inusual es una observación actual sin necesidad de datos completos.

Marco Propuesto

Nuestro enfoque consta de dos partes principales. La primera parte es el Método de pronóstico, que llena los valores faltantes y hace predicciones. La segunda parte es el método de detección de anomalías, que evalúa si las predicciones son inusuales.

El método de pronóstico utiliza un tipo especial de ecuación que le permite aprender de los datos actuales y pasados para hacer predicciones. Este modelo puede manejar casos donde los datos están faltantes y puede entender efectivamente cómo las variables están relacionadas a lo largo del tiempo.

La parte de detección de anomalías utiliza las predicciones para averiguar cuán probable es que la observación actual sea anómala. Lo hace ajustando un modelo estadístico en movimiento a las predicciones. Esto significa que puede identificar comportamientos extraños sin necesidad de comparar contra valores observados reales, que no siempre pueden estar disponibles.

Importancia de las Relaciones en Datos Multivariantes

En una serie temporal multivariante, donde múltiples variables están interconectadas, entender las relaciones entre estas variables es crucial. Por ejemplo, si una variable se desvía de su relación esperada con otra, eso podría significar una anomalía. Es esencial que un modelo capture estas interdependencias porque los valores faltantes en el conjunto de datos a menudo ocurren de manera aleatoria. Al aprender cómo estas variables suelen interactuar, el modelo puede identificar mejor cuándo ocurre algo inusual, incluso en presencia de datos faltantes.

Nuestro método enfatiza construir una comprensión profunda de estas relaciones utilizando los datos continuos generados durante el proceso de pronóstico. Al hacer esto, podemos detectar anomalías efectivamente, incluso cuando enfrentamos conjuntos de datos incompletos.

Estudio Experimental

Para probar nuestro método propuesto, realizamos experimentos utilizando conjuntos de datos del mundo real. Queríamos ver si nuestro marco podría superar a los métodos existentes en la detección de anomalías, particularmente cuando faltan datos.

Conjuntos de Datos Utilizados

Evaluamos nuestro método usando dos conjuntos de datos realistas relacionados con sistemas de tratamiento de agua. Estos conjuntos simulan varios escenarios de ataque que presentan anomalías potenciales. Incluyeron datos no anómalos y anómalos, lo que nos permitió ver qué tan bien el modelo podía identificar anomalías en medio de datos faltantes.

Técnicas de imputación

Antes de aplicar métodos existentes para comparación, llenamos los valores faltantes usando varias técnicas de imputación:

  1. Imputación Naive: Este método reemplaza los valores faltantes con el valor más reciente disponible.
  2. Imputación de Media: Este enfoque calcula la media de los datos disponibles y la usa para llenar los huecos.
  3. Imputación por Splines Cúbicos: Esta técnica crea una curva suave a través de los datos disponibles para estimar valores faltantes, tratando las observaciones en la ventana como límites.

Comparación con Baselines

Comparábamos nuestro método con varios métodos existentes de detección de anomalías, incluyendo enfoques basados en LSTM y modelos de redes neuronales de grafos. Nos enfocamos en evaluar el rendimiento en diferentes configuraciones, particularmente en el contexto de datos faltantes.

Resultados de Detección de Anomalías

Los resultados de nuestros experimentos mostraron que nuestro marco superó a los modelos de referencia en casi todos los escenarios, particularmente al tratar con conjuntos de datos con valores faltantes. El rendimiento se mantuvo estable incluso con tasas de faltantes crecientes, mostrando la robustez de nuestro método.

En contraste, algunos métodos existentes experimentaron una caída significativa en el rendimiento cuando se enfrentaron a datos irregulares. Esto fue especialmente cierto para métodos que dependían mucho de tener conjuntos de datos completos en cada marca de tiempo.

Análisis de Robustez

También evaluamos qué tan bien nuestro método manejó varios niveles de datos faltantes. Nuestro marco mantuvo un rendimiento fuerte incluso cuando un porcentaje significativo de datos estaba faltando. Esto mostró que nuestro modelo no solo detecta anomalías efectivamente en situaciones típicas, sino que también se adapta bien a escenarios del mundo real donde los datos pueden estar incompletos.

Nuestro análisis reveló que los problemas comenzaron a surgir solo en tasas de faltantes extremadamente altas. En este punto, la precisión de detección disminuyó, pero nuestro método aún superó a los métodos competidores en escenarios regulares, incluso bajo condiciones desafiantes.

Conclusión

En este trabajo, presentamos un nuevo método para detectar anomalías en datos de series temporales multivariantes con valores faltantes. Nuestro enfoque identifica efectivamente eventos inusuales en tiempo real, sin importar si las observaciones actuales están disponibles. Los resultados de nuestros experimentos demostraron que nuestro método supera a los modelos de vanguardia actuales tanto en configuraciones regulares como irregulares de detección de anomalías.

De cara al futuro, nuestro objetivo es mejorar aún más la escalabilidad de nuestro marco y explorar su aplicabilidad en contextos más amplios. Buscamos afinar el modelo para manejar conjuntos de datos aún más grandes de manera eficiente, asegurando su usabilidad en aplicaciones del mundo real.

En general, creemos que nuestro enfoque establece un nuevo estándar para la detección de anomalías en entornos de datos complejos, abordando los desafíos que plantean los valores faltantes y las intrincadas relaciones entre variables.

Fuente original

Título: Graph Spatiotemporal Process for Multivariate Time Series Anomaly Detection with Missing Values

Resumen: The detection of anomalies in multivariate time series data is crucial for various practical applications, including smart power grids, traffic flow forecasting, and industrial process control. However, real-world time series data is usually not well-structured, posting significant challenges to existing approaches: (1) The existence of missing values in multivariate time series data along variable and time dimensions hinders the effective modeling of interwoven spatial and temporal dependencies, resulting in important patterns being overlooked during model training; (2) Anomaly scoring with irregularly-sampled observations is less explored, making it difficult to use existing detectors for multivariate series without fully-observed values. In this work, we introduce a novel framework called GST-Pro, which utilizes a graph spatiotemporal process and anomaly scorer to tackle the aforementioned challenges in detecting anomalies on irregularly-sampled multivariate time series. Our approach comprises two main components. First, we propose a graph spatiotemporal process based on neural controlled differential equations. This process enables effective modeling of multivariate time series from both spatial and temporal perspectives, even when the data contains missing values. Second, we present a novel distribution-based anomaly scoring mechanism that alleviates the reliance on complete uniform observations. By analyzing the predictions of the graph spatiotemporal process, our approach allows anomalies to be easily detected. Our experimental results show that the GST-Pro method can effectively detect anomalies in time series data and outperforms state-of-the-art methods, regardless of whether there are missing values present in the data. Our code is available: https://github.com/huankoh/GST-Pro.

Autores: Yu Zheng, Huan Yee Koh, Ming Jin, Lianhua Chi, Haishuai Wang, Khoa T. Phan, Yi-Ping Phoebe Chen, Shirui Pan, Wei Xiang

Última actualización: 2024-01-11 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2401.05800

Fuente PDF: https://arxiv.org/pdf/2401.05800

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares