Mejorando la detección de núcleos con CycleGAN y filtrado DCT
Un nuevo método mejora las imágenes de núcleos sintéticos para un mejor rendimiento en la segmentación.
― 8 minilectura
Tabla de contenidos
- Detección de Núcleos en Imágenes de Microscopía
- El Papel del Filtrado DCT
- Creación de Máscaras Sintéticas
- Configuración de Evaluación
- Evaluación de la Fidelidad de la Imagen
- Resultados Cualitativos de Imágenes Sintéticas
- Rendimiento de Segmentación en DSB
- Rendimiento de Segmentación en BBBC039v1
- Conclusión
- Fuente original
- Enlaces de referencia
Anotar núcleos en imágenes de microscopía puede ser complicado y lleva mucho tiempo. A menudo necesita conocimientos de expertos y puede resultar en diferencias en los resultados dependiendo de quién haga la etiqueta. Este problema es especialmente evidente en microscopía de fluorescencia. Las redes generativas, como CycleGAN, pueden crear imágenes sintéticas de microscopía basadas en máscaras dadas, ayudando a producir más datos de entrenamiento. Sin embargo, intentos anteriores han mostrado que hay inconsistencias entre la máscara y la imagen generada. Esto se debe en parte a que CycleGAN tiende a ocultar detalles importantes de la imagen para facilitar la reconstrucción de imágenes.
En este trabajo, sugerimos un método para mejorar las imágenes producidas por CycleGAN eliminando atajos ocultos, conocidos como esteganografía. Aplicamos una técnica llamada filtrado de paso bajo basada en la Transformada Discreta del Coseno (DCT). El objetivo es aumentar la coherencia entre las imágenes generadas y las máscaras originales. Al probar nuestros conjuntos de datos sintéticos para una tarea de segmentación de núcleos, encontramos mejoras en el rendimiento en comparación con el enfoque estándar de CycleGAN.
Detección de Núcleos en Imágenes de Microscopía
Detectar núcleos y estructuras celulares en imágenes de microscopía es común en el análisis de imágenes biomédicas. Nos da información sobre diversos procesos celulares. Aunque las redes neuronales profundas pueden automatizar esta detección, a menudo requieren muchos datos etiquetados manualmente. Este etiquetado manual no solo consume tiempo, sino que también puede variar en calidad debido a muchos factores, como núcleos superpuestos o artefactos en las imágenes.
Los métodos no supervisados pueden ser una alternativa. Generalmente hay dos enfoques: uno es un método de dos etapas donde un modelo generativo crea conjuntos de datos sintéticos para entrenar una Red de Segmentación supervisada. El otro es un método de una etapa donde un modelo generativo realiza directamente la segmentación. Ambos métodos utilizan modelos generativos entrenados con imágenes de microscopía reales y máscaras sintéticas, que pueden ser creadas a través de métodos de síntesis más simples.
CycleGAN es una arquitectura comúnmente utilizada en este contexto. Emplea múltiples generadores y discriminadores para traducir entre diferentes dominios de imagen. La pérdida de consistencia cíclica asegura que la imagen retenga contenido mientras se transfiere de un dominio a otro. Sin embargo, esto no siempre garantiza que el contenido en las imágenes originales y generadas coincidan.
En un intento de minimizar la pérdida de consistencia cíclica, los generadores a veces incrustan una versión comprimida de la imagen de entrada, creando una reconstrucción perfecta sin transferir contenido esencial. Este proceso se ha llamado esteganografía de CycleGAN, donde el generador oculta información del discriminador, lo que lleva a un desajuste entre las imágenes originales y generadas.
El Papel del Filtrado DCT
Para abordar el problema de la esteganografía, utilizamos el filtrado DCT. Esta técnica es bien conocida en la compresión de imágenes, específicamente en el formato JPEG. Al eliminar patrones de píxeles de alta frecuencia que los CycleGANs utilizan para ocultar información, nuestro objetivo es producir imágenes más claras y coherentes.
Establecemos coeficientes de frecuencia más altos en cero en las imágenes generadas usando DCT. Aunque este filtrado puede eliminar algunos detalles reales en las imágenes, creemos que no es crucial para nuestros propósitos. Después del filtrado, aún podemos ver algunas discrepancias entre las máscaras de entrada y las imágenes de núcleos generadas, pero aseguramos que las máscaras cíclicas reflejen con Precisión el contenido de las imágenes generadas.
Las imágenes filtradas sirven como datos de entrenamiento para redes que segmentan núcleos. Nuestro enfoque muestra un aumento en la precisión cuando se aplica el filtrado DCT, mejorando así la relación entre la máscara y las imágenes generadas.
Creación de Máscaras Sintéticas
Para producir máscaras sintéticas, podemos usar elipses para modelar las formas de los núcleos. Aunque es efectivo, se necesitan ajustes cuidadosos para hacer que estas máscaras sintéticas coincidan con precisión con las imágenes de microscopía reales. Si hay una gran brecha entre las distribuciones sintéticas y reales, el CycleGAN tiene dificultades para aprender de manera efectiva.
Al crear las máscaras, variamos aleatoriamente los parámetros para asegurar diversidad. Esto incluye muestreo para el tamaño de los ejes, excentricidad y ángulo de rotación. Las imágenes de máscara finales permiten que los núcleos se toquen pero nunca se superpongan, manteniendo la representación realista.
Configuración de Evaluación
Para ver qué tan efectivo es nuestro filtrado DCT, generamos conjuntos de datos sintéticos usando CycleGAN con y sin el filtrado, así como comparando otros métodos de la literatura. Después de entrenar, utilizamos estas imágenes y máscaras sintéticas para entrenar una red de segmentación, StarDist. Probamos la red de segmentación entrenada en datos reales para evaluar el rendimiento.
En nuestros experimentos con el conjunto de datos de núcleos de la Data Science Bowl (DSB) 2018 y el conjunto de datos BBBC039v1, encontramos que nuestro CycleGAN propuesto con filtrado DCT superó al CycleGAN estándar, llevando a mejores puntuaciones de precisión y menos falsos positivos.
Evaluación de la Fidelidad de la Imagen
Si bien el enfoque principal de nuestros métodos es mejorar la segmentación de núcleos, también evaluamos la calidad de las imágenes generadas. Al comparar los datos generados con las imágenes originales utilizando la Distancia de Fréchet (FID), encontramos que el CycleGAN combinado con el filtrado DCT dio la mejor puntuación, indicando una mejor fidelidad de imagen.
Resultados Cualitativos de Imágenes Sintéticas
Al revisar las imágenes generadas, notamos desviaciones de las máscaras de entrada originales. Aunque esto puede parecer negativo, puede ser beneficioso siempre que los cambios se reflejen en las máscaras cíclicas. Nuestro filtrado DCT propuesto demostró que la esteganografía se redujo de manera efectiva, lo que resultó en que las máscaras cíclicas coincidieran estrechamente con las imágenes generadas.
En contraste, otros métodos como la eliminación de ruido y la inyección de ruido redujeron algo de esteganografía, pero no fueron tan efectivos. Las imágenes producidas por inyección de ruido tenían más variabilidad, lo que resultó en un resultado menos estable para las tareas de segmentación.
Rendimiento de Segmentación en DSB
La red de segmentación probada en el conjunto de datos DSB mostró mejoras significativas cuando se entrenó con conjuntos de datos sintéticos generados a partir del CycleGAN con filtrado DCT. Nuestro enfoque superó al CycleGAN estándar, demostrando mayor precisión tanto en umbrales más fáciles como más desafiantes.
Rendimiento de Segmentación en BBBC039v1
Para el conjunto de datos BBBC039v1, todos los métodos mostraron alta precisión. El método de filtrado DCT tuvo el mejor rendimiento, mostrando una ligera ventaja sobre otros métodos. La estructura más sencilla del conjunto de datos BBBC039v1 condujo a puntuaciones más altas en todas las métricas debido a su menor variabilidad.
Conclusión
En este trabajo, propusimos un nuevo método para abordar el problema de la información oculta en imágenes generadas por CycleGAN. Nuestro enfoque de filtrado DCT condujo a una mejor consistencia en las imágenes sintéticas y, en última instancia, mejoró el rendimiento en las tareas de segmentación posteriores.
Al centrarnos en crear conjuntos de datos sintéticos con mejor alineación entre máscaras e imágenes generadas, pudimos mejorar el proceso de aprendizaje de las redes involucradas. Esta investigación no solo muestra la efectividad del filtrado DCT, sino que también abre la puerta a una mayor exploración en la sintonización de CycleGANs para diversas aplicaciones.
El trabajo futuro podría explorar métodos adicionales para mejorar las capacidades de segmentación de los CycleGANs. Esto incluye potencialmente adaptar la arquitectura para generar máscaras de instancia directamente en lugar de depender del post-procesamiento. Explorar cómo se podría aplicar el enfoque de eliminación de esteganografía a otras tareas similares podría llevar a un impacto más amplio en el campo de las redes generativas.
Título: Focus on Content not Noise: Improving Image Generation for Nuclei Segmentation by Suppressing Steganography in CycleGAN
Resumen: Annotating nuclei in microscopy images for the training of neural networks is a laborious task that requires expert knowledge and suffers from inter- and intra-rater variability, especially in fluorescence microscopy. Generative networks such as CycleGAN can inverse the process and generate synthetic microscopy images for a given mask, thereby building a synthetic dataset. However, past works report content inconsistencies between the mask and generated image, partially due to CycleGAN minimizing its loss by hiding shortcut information for the image reconstruction in high frequencies rather than encoding the desired image content and learning the target task. In this work, we propose to remove the hidden shortcut information, called steganography, from generated images by employing a low pass filtering based on the DCT. We show that this increases coherence between generated images and cycled masks and evaluate synthetic datasets on a downstream nuclei segmentation task. Here we achieve an improvement of 5.4 percentage points in the F1-score compared to a vanilla CycleGAN. Integrating advanced regularization techniques into the CycleGAN architecture may help mitigate steganography-related issues and produce more accurate synthetic datasets for nuclei segmentation.
Autores: Jonas Utz, Tobias Weise, Maja Schlereth, Fabian Wagner, Mareike Thies, Mingxuan Gu, Stefan Uderhardt, Katharina Breininger
Última actualización: 2023-08-03 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2308.01769
Fuente PDF: https://arxiv.org/pdf/2308.01769
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.