Avanzando la detección de pólipos con imágenes sintéticas
Nuevo método genera imágenes sintéticas de pólipos para mejorar la detección y segmentación.
― 7 minilectura
Tabla de contenidos
El cáncer colorrectal es un gran problema de salud a nivel mundial. Es la tercera causa más común de muertes por cáncer. Los Pólipos en el colon pueden llevar a este tipo de cáncer. Quitar estos pólipos puede ayudar a prevenir que el cáncer se desarrolle. La colonoscopia es el método principal para revisar el colon. Permite a los doctores ver y sacar pólipos al mismo tiempo. Sin embargo, la efectividad de una colonoscopia puede depender de las habilidades del médico. A veces, los doctores pueden pasar por alto pólipos, con informes que muestran una tasa de error entre 6% y 27%.
Muchos investigadores han tratado de crear sistemas que ayuden a los doctores a encontrar pólipos automáticamente. Los métodos anteriores se enfocaban en detectar características de los pólipos como color, forma y textura. Recientemente, se ha utilizado el aprendizaje profundo para encontrar y segmentar pólipos, mostrando mejores resultados que los métodos antiguos. Aun así, la mayoría de los estudios dependen de conjuntos de datos públicos que son limitados en la variedad de muestras de pólipos. Recoger imágenes de pólipos más variadas es difícil y caro porque los datos médicos son sensibles y difíciles de recopilar.
Para abordar el problema de los datos limitados, los métodos de aprendizaje profundo a menudo utilizan técnicas para mejorar las imágenes existentes. Pero para entrenar estos modelos avanzados de manera efectiva, se necesita más imágenes diversas de pólipos.
Declaración del Problema
Algunos investigadores han recurrido a las Redes Generativas Adversariales (GAN) para generar nuevas imágenes de pólipos. Este método puede ayudar a crear más datos de entrenamiento para los modelos. Estudios anteriores han intentado adaptar imágenes de pólipos existentes a nuevas. A menudo usaban múltiples pasos y algoritmos separados para diferentes tipos de imágenes, lo que complica el proceso.
En este trabajo, buscamos simplificar el proceso usando solo una estructura GAN para la tarea. Mostraremos cómo convertir imágenes reales de pólipos en imágenes “negativas” (imágenes sin pólipos) y luego crear nuevas imágenes de pólipos a partir de esas negativas usando la misma red.
Metodología
Generación de Imágenes Negativas
El primer paso es convertir una imagen de pólipo en una imagen negativa. Una imagen negativa se parece al área alrededor del pólipo pero sin el pólipo mismo. Para hacer esto, entrenamos un modelo GAN para aprender a rellenar el área donde se encuentra el pólipo. Creamos un conjunto de entrenamiento emparejando imágenes originales de pólipos con máscaras que destacan las áreas de pólipos.
Para nuestros datos de entrenamiento, aumentamos las imágenes con ajustes aleatorios como rotación y escalado. De esta manera, el modelo aprende a crear imágenes que se ven naturales sin el pólipo.
Generación de Nuevas Imágenes de Pólipos
Después de crear una imagen negativa, el siguiente paso es cambiar esa imagen de nuevo a una nueva imagen de pólipo. Para esto, también usamos el modelo GAN. La diferencia aquí es que introducimos una máscara que controla las características del nuevo pólipo.
En lugar de usar un valor fijo para la máscara, permitimos variabilidad asignando diferentes valores a diferentes muestras de pólipos. Esta variación ayuda a producir nuevas imágenes de pólipos con colores, formas y texturas distintas.
Configuración Experimental
Usamos varios conjuntos de datos para evaluar nuestro trabajo. El conjunto de datos principal contiene 612 imágenes de pólipos con sus correspondientes máscaras. Además, usamos videos de otros conjuntos de datos para probar qué tan bien nuestras imágenes generadas ayudan con la Detección de pólipos.
Métricas de Evaluación
Para ver qué tan bien funciona nuestro método, miramos algunas métricas importantes para la detección y Segmentación:
- Precisión: ¿Cuántos de los pólipos detectados son correctos?
- Recuperación: ¿Cuántos de los pólipos reales fueron detectados?
- Puntuación F1: Un balance entre precisión y recuperación.
- Índice de Jaccard: Una medida de qué tan bien el área detectada coincide con el área real del pólipo.
- Puntuación de Similitud de Dice: Otra medida de qué tan bien el área predicha coincide con la verdad.
Resultados
Rendimiento en Modelos de Detección
Cuando añadimos imágenes generadas de pólipos a nuestro conjunto de datos original para el entrenamiento, los modelos mostraron una mejor capacidad para detectar pólipos. Por ejemplo, usando un modelo específico de aprendizaje profundo, observamos un aumento notable tanto en las métricas de recuperación como de precisión.
En un escenario, se detectaron alrededor de 1,045 pólipos adicionales al combinar las imágenes originales y generadas. Esto indica que usar datos sintéticos puede aumentar significativamente el número de pólipos detectables.
Rendimiento en Modelos de Segmentación
También examinamos qué tan bien los modelos se desempeñaron en la segmentación de pólipos. Los modelos mostraron mejoras claras en el rendimiento cuando se incluyeron imágenes sintéticas en su entrenamiento.
Las mejoras de rendimiento variaron entre el 4% y el 9% en las puntuaciones de Jaccard y Dice a través de diferentes modelos de segmentación cuando se añadieron imágenes generadas. Esto confirma que las imágenes sintéticas pueden ayudar en el entrenamiento de modelos para distinguir mejor las áreas de pólipos en imágenes del colon.
Resultados Visuales
Las imágenes generadas a partir de este proceso variaron en apariencia, mostrando características distintas para diferentes máscaras. El modelo pudo tomar la misma forma de entrada y generar diversas características de pólipos al cambiar los valores de píxel de la máscara.
Limitaciones del Enfoque Actual
Aunque este método ha demostrado ser beneficioso, hay ciertas limitaciones. Los modelos no pueden crear características completamente nuevas fuera del conjunto de datos existente. Solo pueden manipular y generar nuevas versiones parecidas de los pólipos que ya están en los datos de entrenamiento.
En el futuro, estudios adicionales podrían explorar formas de introducir nuevas características o combinar características de diferentes pólipos para generar imágenes sintéticas aún más diversas.
Conclusión
En resumen, la generación de imágenes sintéticas de pólipos es una estrategia útil para mejorar los conjuntos de datos de entrenamiento para modelos de aprendizaje profundo enfocados en la detección y segmentación de pólpos. Al convertir imágenes existentes de pólipos en imágenes negativas y luego de nuevo en nuevas imágenes de pólipos con características controladas, podemos crear datos diversos para mejorar el rendimiento del modelo.
Este enfoque no solo ayuda a aumentar las capacidades de detección sino que también reduce el esfuerzo manual necesario en el etiquetado de datos médicos. El trabajo continuo en esta área puede llevar a avances aún mayores en la detección del cáncer colorrectal, ayudando a salvar vidas.
Título: Simple U-net Based Synthetic Polyp Image Generation: Polyp to Negative and Negative to Polyp
Resumen: Synthetic polyp generation is a good alternative to overcome the privacy problem of medical data and the lack of various polyp samples. In this study, we propose a deep learning-based polyp image generation framework that generates synthetic polyp images that are similar to real ones. We suggest a framework that converts a given polyp image into a negative image (image without a polyp) using a simple conditional GAN architecture and then converts the negative image into a new-looking polyp image using the same network. In addition, by using the controllable polyp masks, polyps with various characteristics can be generated from one input condition. The generated polyp images can be used directly as training images for polyp detection and segmentation without additional labeling. To quantitatively assess the quality of generated synthetic polyps, we use public polyp image and video datasets combined with the generated synthetic images to examine the performance improvement of several detection and segmentation models. Experimental results show that we obtain performance gains when the generated polyp images are added to the training set.
Autores: Hemin Ali Qadir, Ilangko Balasingham, Younghak Shin
Última actualización: 2023-02-20 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2302.09835
Fuente PDF: https://arxiv.org/pdf/2302.09835
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.