Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones

Avances en la detección de anomalías no supervisada con LSGS

Un nuevo método mejora la detección de anomalías en imágenes usando VQVAE y modelos de transformadores.

― 6 minilectura


Método de Detección deMétodo de Detección deAnomalías de ÚltimaGeneracióndetección de anomalías no supervisada.LSGS define nuevos estándares en la
Tabla de contenidos

La detección de Anomalías no supervisada es super útil en campos como la industria y la salud. Ayuda a encontrar patrones raros en los datos sin hacer tanto trabajo manual. Por ejemplo, en el área de salud, puede acelerar el diagnóstico de enfermedades al detectar automáticamente anomalías en imágenes médicas. Últimamente, los métodos de aprendizaje profundo, especialmente los auto-codificadores, han mostrado mucho potencial para detectar estas anomalías. Al aprender de datos normales, pueden identificar áreas anormales comparando la calidad de las reconstrucciones. Sin embargo, a veces estos métodos pueden fallar, ya que pueden funcionar demasiado bien, reconstruyendo anomalías como si fueran normales.

El Desafío

El problema principal con muchos enfoques de detección de anomalías es que dependen de la capacidad del modelo para generalizar bien a partir de datos normales. Cuando el modelo es demasiado bueno en esto, puede reconstruir muestras anormales con precisión, lo que lleva a omisiones en las detecciones. Otras estrategias han intentado solucionar esto, pero a menudo introducen sus propios problemas, como producir ruido en áreas normales o tener dificultades con anomalías estructurales.

Algunos métodos implican usar memoria para ayudar al auto-codificador a recordar mejor los patrones normales. Aunque esto puede funcionar bien para ciertos tipos de anomalías, a menudo tiene problemas cuando se enfrenta a estructuras de imagen complejas. Otros enfoques podrían requerir datos externos o patrones conocidos de anomalías, lo que limita sus capacidades no supervisadas.

Presentando LSGS

Para abordar estos problemas, se ha desarrollado un nuevo método llamado LSGS. Este enfoque combina un auto-codificador especial, conocido como Auto-codificador Variacional Cuantizado por Vector (VQVAE), y un modelo transformer que utiliza atención global. El objetivo es aprovechar las fortalezas de estas tecnologías para detectar mejor anomalías en imágenes.

El Papel de VQVAE

El VQVAE se centra en dos tareas principales: extraer características importantes de las imágenes y reconstruirlas. Al entrenarse solo con imágenes normales, forma un Libro de códigos que representa estos patrones estándar. Cuando se enfrenta a imágenes anormales, el modelo verifica qué tan bien puede recrearlas. Si el error de reconstrucción es alto, indica una anomalía.

Entendiendo el Transformer

Mientras que el VQVAE es genial para manejar patrones locales, puede tener problemas con la información global de toda la imagen. Aquí es donde entra el transformer. Al usar un mecanismo de atención global, el transformer puede entender mejor el contexto de toda la imagen e identificar áreas que no se ajustan a los patrones esperados. Funciona junto al VQVAE, tomando los patrones codificados y refinando el proceso de reconstrucción.

Cómo Funciona LSGS

El método LSGS comienza entrenando el VQVAE usando un conjunto de imágenes normales. Una vez que ha aprendido los patrones usuales, los agrupa en un libro de códigos. Luego, el transformer se entrena en secuencias de estas codificaciones, enseñándole a reconocer distribuciones y anomalías basándose en conocimientos previos.

Cuando se procesa una nueva imagen, se codifica en secuencias. El transformer analiza estas secuencias y las ajusta, creando una mejor representación de cómo debería lucir lo normal. Finalmente, el modelo reconstruye la imagen a partir de estos patrones ajustados. Si la reconstrucción muestra una desviación significativa de la imagen de entrada, probablemente hay una anomalía presente.

Beneficios de LSGS

El método LSGS introduce algunas ventajas cruciales:

  1. Mejor Representación del Libro de Códigos: Usando un nuevo libro de códigos que agrega patrones de manera efectiva, el VQVAE puede capturar mejor la distribución de datos.

  2. Conciencia del Contexto Global: La sensibilidad global del transformer le permite considerar toda la estructura de la imagen, mejorando la detección de anomalías que pueden abarcar áreas más grandes o tener formas complejas.

  3. Aprendizaje Auto-supervisado: Empleando una estrategia única de auto-supervisión, el transformer puede aprender de manera eficiente sin necesitar grandes cantidades de datos etiquetados.

  4. Mayor Precisión en la Detección: Los experimentos han mostrado que este método supera a las técnicas existentes en varios contextos, incluidos conjuntos de datos médicos e industriales.

Pruebas del Enfoque

Para validar la efectividad de LSGS, se realizaron pruebas en dos conjuntos de datos bien conocidos: BraTS2018, que se centra en imágenes de MRI de cerebro, y MVTec-AD, un conjunto de datos para análisis de imágenes industriales. En estas pruebas, el modelo se entrenó usando imágenes sin anomalías y luego se evaluó en otras que las contenían.

Visión General de los Conjuntos de Datos

  • BraTS2018: Este conjunto de datos contiene escaneos de MRI usados para identificar tejidos cerebrales anormales. Las imágenes se procesan para ayudar a diagnosticar condiciones más eficientemente.

  • MVTec-AD: Se utiliza para evaluar modelos de visión por computadora en entornos industriales. Incluye varias categorías, cada una con datos de entrenamiento normales y una mezcla de datos normales y anormales para prueba.

Detalles de Implementación

Implementar LSGS implica establecer parámetros específicos para los modelos. Por ejemplo, el encoder VQVAE reduce el tamaño de las imágenes a un tamaño manejable para un procesamiento eficiente. El transformer consta de múltiples capas de atención para refinar su comprensión de los datos.

Midiendo el Éxito

Para evaluar qué tan bien funciona el método LSGS, se utilizan varias métricas, incluyendo:

  • Puntuación de Precisión Promedio (AP): Mide la precisión de las predicciones del modelo.

  • Área Bajo la Curva de Características Operativas del Receptor (AUROC): Evalúa el equilibrio entre tasas de verdaderos positivos y tasas de falsos positivos.

  • Coeficiente de Similitud de Dice (Dice): Evalúa la superposición entre las anomalías predichas y las reales.

Comparación con Métodos Existentes

El método LSGS se ha comparado con otros métodos de detección de anomalías basados en reconstrucción. Estas comparaciones muestran consistentemente que LSGS logra mejores resultados en ambos conjuntos de datos, BraTS2018 y MVTec-AD. Esto resalta su versatilidad y efectividad en diferentes contextos.

Entendiendo los Componentes del Modelo

Para explorar más el método LSGS, se revisaron varios componentes:

  1. Libro de Códigos Agregado: Esta representación refinada de patrones de imagen permite una mejor detección de anomalías al asegurar una mapeo más preciso de imágenes normales.

  2. Mecanismo de Atención: Usar diferentes tipos de estructuras de atención demuestra lo importante que es para mejorar la detección de anomalías. El transformer de atención completa superó a otros que usaban atención limitada.

Conclusión

El método LSGS representa un avance significativo en la detección de anomalías no supervisada. Al combinar un VQVAE sensible a lo local con transformers sensibles a lo global, este enfoque identifica efectivamente anormalidades en varios tipos de imágenes. Los resultados experimentales confirman su capacidad para superar los métodos existentes, convirtiéndolo en una dirección prometedora para futuras investigaciones y aplicaciones en contextos industriales y médicos.

Fuente original

Título: Unsupervised Anomaly Detection with Local-Sensitive VQVAE and Global-Sensitive Transformers

Resumen: Unsupervised anomaly detection (UAD) has been widely implemented in industrial and medical applications, which reduces the cost of manual annotation and improves efficiency in disease diagnosis. Recently, deep auto-encoder with its variants has demonstrated its advantages in many UAD scenarios. Training on the normal data, these models are expected to locate anomalies by producing higher reconstruction error for the abnormal areas than the normal ones. However, this assumption does not always hold because of the uncontrollable generalization capability. To solve this problem, we present LSGS, a method that builds on Vector Quantised-Variational Autoencoder (VQVAE) with a novel aggregated codebook and transformers with global attention. In this work, the VQVAE focus on feature extraction and reconstruction of images, and the transformers fit the manifold and locate anomalies in the latent space. Then, leveraging the generated encoding sequences that conform to a normal distribution, we can reconstruct a more accurate image for locating the anomalies. Experiments on various datasets demonstrate the effectiveness of the proposed method.

Autores: Mingqing Wang, Jiawei Li, Zhenyang Li, Chengxiao Luo, Bin Chen, Shu-Tao Xia, Zhi Wang

Última actualización: 2023-03-29 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2303.17505

Fuente PDF: https://arxiv.org/pdf/2303.17505

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares