Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones

Nuevo método para identificar lesiones cutáneas desconocidas

Un marco para descubrir nuevas condiciones de la piel usando aprendizaje profundo.

― 7 minilectura


Detección Avanzada deDetección Avanzada deLesiones en la Pieldiagnóstico del cáncer de piel.El marco mejora la precisión en el
Tabla de contenidos

Identificar Lesiones en la piel es clave para diagnosticar cáncer de piel. Los métodos actuales que usan deep learning han mostrado buenos resultados, especialmente con imágenes tomadas con una técnica llamada dermatoscopia. Sin embargo, estos métodos solo pueden reconocer ciertas condiciones de la piel que han sido predefinidas por investigadores. A medida que se descubren más condiciones de la piel, es importante tener una forma de identificar estas nuevas condiciones sin necesidad de etiquetar cada una manualmente.

Hay muchas enfermedades de la piel conocidas-más de 2000, con alrededor de 200 siendo comunes. Con nuevas enfermedades apareciendo, no es práctico anotar datos nuevos para cada una de estas condiciones. Como las enfermedades conocidas y las desconocidas a menudo comparten similitudes, el conocimiento existente sobre las condiciones conocidas puede ayudar a identificar las nuevas.

Un enfoque para abordar este problema es el Descubrimiento de Clases Nuevas (NCD). Este método intenta usar lo que se sabe sobre las condiciones existentes para encontrar y agrupar nuevas enfermedades de la piel desconocidas. La mayoría de los métodos NCD implican dos pasos principales: primero, entrenar un modelo usando datos etiquetados de condiciones conocidas; segundo, agrupar las condiciones desconocidas basándose en el conocimiento aprendido.

El Marco Propuesto

En nuestra investigación, presentamos un nuevo marco para el descubrimiento de clases nuevas centrado en lesiones de la piel. El objetivo es encontrar automáticamente nuevas categorías de condiciones de la piel a partir de imágenes de dermatoscopia. Para hacerlo de manera efectiva, seguimos varios pasos:

  1. Aprendiendo Características: Primero, usamos una técnica llamada Aprendizaje Contrastivo para crear un modelo base sólido que entienda las características de categorías conocidas y desconocidas.

  2. Estrategia de Agrupamiento: Luego, implementamos un método único que se centra en la incertidumbre. Este enfoque permite que el modelo haga mejores predicciones al agrupar las condiciones desconocidas. Utilizamos un método llamado auto-etiquetado para generar etiquetas temporales para las condiciones desconocidas que serán tratadas de manera similar a las etiquetas reales de las conocidas.

  3. Mejorando Predicciones: Como paso final, refinamos estas etiquetas temporales al observar imágenes similares dentro del conjunto de datos. Esto ayuda a mejorar la precisión general del proceso de agrupamiento.

Importancia de la Identificación Precisa de Lesiones en la Piel

Una identificación rápida y precisa de las lesiones en la piel puede hacer una gran diferencia en el tratamiento del cáncer de piel. Un diagnóstico temprano a menudo conduce a mejores resultados para los pacientes. Sin embargo, los modelos tradicionales de deep learning requieren muchos datos etiquetados para cada categoría para funcionar eficazmente. Recoger estos datos no siempre es factible, especialmente cuando se trata de muchas condiciones de piel diferentes o raras.

El aprendizaje semi-supervisado, que utiliza una mezcla de datos etiquetados y no etiquetados, se ha sugerido como una forma de mejorar el rendimiento del modelo cuando los datos etiquetados son limitados. Aun así, a menudo requiere al menos algunos datos etiquetados para cada condición, lo que no siempre está disponible en situaciones del mundo real.

Desafíos en los Métodos Actuales

A pesar de los avances, muchos métodos existentes para el descubrimiento de clases nuevas tienen limitaciones. El enfoque común de dos pasos puede llevar a etiquetas ruidosas al agrupar condiciones desconocidas. Estas etiquetas ruidosas pueden obstaculizar el proceso de agrupamiento y causar que los errores se acumulen con el tiempo. Además, la mayoría de los métodos se centran solo en alinear muestras globalmente a los centros de categoría, descuidando las relaciones locales entre muestras.

Nuestro Enfoque en Detalle

Para abordar los desafíos mencionados, proponemos un nuevo marco que incluye tres componentes principales:

1. Aprendizaje Contrastivo

Este paso ayuda a construir una representación de características sólida para nuestro modelo. Al contrastar diferentes imágenes y sus versiones aumentadas, podemos entrenar a nuestro modelo para distinguir entre características de manera más efectiva. Este entrenamiento ayuda a evitar que el modelo se enfoque demasiado en las categorías conocidas.

2. Supervisión Pseudo-Cruzada Multi-Visual Consciente de la Incertidumbre

En esta parte, nuestro modelo crea predicciones basadas en diferentes vistas de las mismas imágenes. Luego combinamos estas predicciones para generar resultados finales. Para manejar mejor las etiquetas temporales creadas para condiciones desconocidas, incorporamos incertidumbre. Cuando las predicciones son muy inciertas, entendemos que las etiquetas temporales pueden no ser confiables. Por lo tanto, ajustamos la forma en que usamos estas etiquetas basadas en la confianza del modelo en sus predicciones.

3. Agregación de Información Local

Finalmente, introducimos un método para mejorar la comprensión del modelo sobre vecindarios locales. Cada vez que procesamos un lote de imágenes, hacemos un seguimiento de las características de muestras recientes. Al comparar estas características con las que están en memoria, podemos refinar mejor las etiquetas temporales y mejorar la precisión general. Este paso asegura que el modelo no solo esté considerando patrones globales, sino también similitudes locales.

Resultados Experimentales

Para validar nuestro método, realizamos experimentos extensivos en un conjunto de datos dermatológicos bien conocido, ISIC 2019. Este conjunto de datos incluye miles de imágenes dermatoscópicas categorizadas en varias enfermedades de la piel. Dada la naturaleza desequilibrada del conjunto de datos, tuvimos que equilibrar el número de muestras utilizadas para cada categoría.

Llevamos a cabo dos tareas en nuestros experimentos. Para la primera tarea, clasificamos cuatro categorías como conocidas y cuatro como desconocidas. Para la segunda tarea, intercambiamos estas categorías. Al realizar múltiples pruebas, pudimos evaluar el rendimiento promedio de nuestro modelo frente a métodos existentes.

Comparación con Otros Métodos

Después de realizar experimentos, comparamos nuestro marco con varios métodos de vanguardia en NCD. Los resultados mostraron que nuestro marco tuvo un mejor desempeño en la agrupación de categorías desconocidas. Mientras que otros métodos mejoraron los puntos de referencia básicos, nuestro método destacó, proporcionando mejores predicciones y minimizando los efectos de etiquetas ruidosas.

Entendiendo el Impacto de Cada Componente

Para asegurarnos de que nuestro marco fuera efectivo, también realizamos estudios de ablación-esencialmente pruebas que aíslan partes de nuestro método para ver su impacto individual. Los resultados indicaron que:

  • Aprendizaje Contrastivo mejoró significativamente la capacidad del modelo para entender características y mejoró la precisión de agrupamiento.

  • Supervisión Pseudo-Cruzada Multi-Visual Consciente de la Incertidumbre permitió que nuestro modelo generalizara mejor al fomentar la consistencia en diferentes vistas de imágenes.

  • Agregación de Información Local aumentó el rendimiento del modelo al refinar las etiquetas temporales basadas en relaciones de vecindario.

Conclusión

En resumen, nuestro método propuesto para el descubrimiento de clases nuevas en lesiones de la piel muestra mejoras significativas sobre los enfoques tradicionales. Establecimos un marco que integra aprendizaje contrastivo, gestión de incertidumbre y métodos de agregación local para identificar efectivamente nuevas categorías de enfermedades de la piel a partir de imágenes. Los resultados que obtuvimos de pruebas rigurosas muestran que nuestro enfoque puede ayudar en la detección temprana del cáncer de piel al reconocer con precisión condiciones emergentes de la piel.

El trabajo futuro ampliará la aplicabilidad de este marco a otros campos del análisis de imágenes médicas, abriendo puertas para mejores diagnósticos y opciones de tratamiento en diversas condiciones médicas.

Fuente original

Título: Towards Novel Class Discovery: A Study in Novel Skin Lesions Clustering

Resumen: Existing deep learning models have achieved promising performance in recognizing skin diseases from dermoscopic images. However, these models can only recognize samples from predefined categories, when they are deployed in the clinic, data from new unknown categories are constantly emerging. Therefore, it is crucial to automatically discover and identify new semantic categories from new data. In this paper, we propose a new novel class discovery framework for automatically discovering new semantic classes from dermoscopy image datasets based on the knowledge of known classes. Specifically, we first use contrastive learning to learn a robust and unbiased feature representation based on all data from known and unknown categories. We then propose an uncertainty-aware multi-view cross pseudo-supervision strategy, which is trained jointly on all categories of data using pseudo labels generated by a self-labeling strategy. Finally, we further refine the pseudo label by aggregating neighborhood information through local sample similarity to improve the clustering performance of the model for unknown categories. We conducted extensive experiments on the dermatology dataset ISIC 2019, and the experimental results show that our approach can effectively leverage knowledge from known categories to discover new semantic categories. We also further validated the effectiveness of the different modules through extensive ablation experiments. Our code will be released soon.

Autores: Wei Feng, Lie Ju, Lin Wang, Kaimin Song, Zongyuan Ge

Última actualización: 2023-09-28 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2309.16451

Fuente PDF: https://arxiv.org/pdf/2309.16451

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares