Mejorando la Segmentación de Imágenes con Normalización Local
Un nuevo método mejora la precisión de la segmentación de imágenes en diferentes condiciones.
― 6 minilectura
Tabla de contenidos
La Segmentación de imágenes es una técnica utilizada en visión por computadora para dividir una imagen en diferentes partes o regiones. El objetivo principal es separar los objetos importantes de la imagen del fondo. Este proceso ayuda a entender y analizar imágenes de manera automática. En esta discusión, nos enfocaremos en imágenes en escala de grises, que están compuestas por diferentes tonos de gris. Sin embargo, los métodos también se pueden usar para imágenes a color o incluso imágenes 3D que cambian con el tiempo.
Método de Conjuntos de Niveles
Un método común para la segmentación de imágenes se llama el método de conjuntos de niveles. Este enfoque usa una función matemática para delinear los límites de los objetos que queremos detectar en la imagen. Este límite se conoce como contorno. El contorno se define como los puntos donde la función tiene un valor de cero. Las áreas donde la función es positiva indican que pertenecen al objeto (primer plano), mientras que las áreas donde es negativa indican que pertenecen al fondo.
Modelo de Campo Binario Local
El modelo de Campo Binario Local (LBF) es un enfoque específico dentro del marco de conjuntos de niveles. Se enfoca en minimizar una función matemática, que tiene en cuenta el brillo promedio del objeto y el fondo. Esto asegura que la segmentación capte las diferencias de intensidad entre los objetos y su entorno.
Para lograr esto, el modelo utiliza el núcleo gaussiano, que suaviza las variaciones en el brillo. Además, emplea una versión modificada de la función escalón de Heaviside, que ayuda a determinar dónde se encuentran los límites. El modelo combina estas funciones para analizar la imagen y producir una segmentación que refleje con precisión los objetos subyacentes.
Desafíos con Segmentación LBF
El método de segmentación LBF tradicional funciona bien cuando las imágenes tienen alto contraste. Sin embargo, si las imágenes contienen variaciones fuertes en el brillo o ruido significativo, el método puede tener dificultades para identificar y segmentar con precisión las estructuras de menor intensidad. Esto puede llevar a segmentaciones incompletas o incorrectas.
Para abordar este problema, los investigadores introdujeron normalizaciones locales en el modelo LBF. Esto significa que el método ahora tiene en cuenta variaciones locales en el brillo dentro de las diferentes regiones de la imagen. Al hacer esto, el modelo puede manejar mejor imágenes con distribuciones de intensidad complejas y mejorar los resultados de la segmentación.
Comparación de Diferentes Modelos
Al comparar diferentes modelos de segmentación en investigaciones, a menudo se complica el hecho de que utilizan varias técnicas de regularización. Cada modelo puede tener diferentes parámetros que se pueden ajustar para mejorar el rendimiento, lo que puede llevar a resultados sesgados. Para asegurar una comparación justa entre los modelos LBF tradicionales y normalizados, se llevó a cabo un examen sistemático de estos parámetros.
La longitud y el área de superficie del contorno segmentado también se consideran en esta comparación. Estos atributos ayudan a los investigadores a entender qué tan bien está funcionando el modelo en términos de identificar correctamente los límites de los objetos en las imágenes.
Conjunto de Datos y Pruebas
El conjunto de datos utilizado para probar estos modelos consistió en imágenes sintéticas 2D y 3D que contenían objetos con niveles de brillo y formas distintas, junto con diferentes grados de neblina. Estas imágenes se crearon utilizando software, permitiendo pruebas controladas de los métodos de segmentación, ya que las segmentaciones correctas ya eran conocidas.
Para las imágenes 3D, se generaron dos imágenes base, con diferentes formas colocadas dentro de un volumen definido. Cada imagen base se modificó añadiendo neblina a diferentes intensidades, ayudando a simular condiciones del mundo real donde las imágenes podrían contener ruido o imperfecciones. Las imágenes sintéticas 2D se derivaron de imágenes 3D a través de proyecciones de intensidad máxima, que capturan los puntos más brillantes a través de la profundidad del volumen 3D.
Los parámetros utilizados en los modelos de segmentación se mantuvieron constantes durante las simulaciones para asegurar que la comparación se basara únicamente en las diferencias del modelo. Se empleó un algoritmo para optimizar los parámetros y encontrar la mejor configuración para los modelos LBF tradicionales y normalizados.
Resultados de la Segmentación
Tanto los modelos LBF tradicionales como los normalizados se probaron en las imágenes sintéticas. Los resultados destacaron que el modelo LBF normalizado tuvo un rendimiento notablemente mejor que la versión tradicional. Fue capaz de segmentar con precisión objetos de menor intensidad, resultando en superficies más suaves que coincidían de cerca con la verdad conocida.
En particular, el rendimiento de estos modelos se midió utilizando una métrica llamada Intersección sobre Unión (IOU). Esta métrica cuantifica qué tan bien la segmentación del modelo se superpone con los objetos reales presentes en la imagen. El modelo LBF normalizado produjo consistentemente puntuaciones IOU más altas, lo que indica su mejor precisión y rendimiento.
Aplicación a Imágenes Biológicas
El modelo LBF normalizado también se aplicó a imágenes biológicas, enfocándose específicamente en la segmentación de estructuras neuronales en C. elegans, un organismo modelo común en la investigación científica. Las neuronas fueron etiquetadas con fluorescencia e imágenes utilizando técnicas avanzadas de microscopía. El método mostró promesas para identificar y segmentar con precisión los cuerpos celulares neuronales, incluso en condiciones desafiantes donde los niveles de intensidad variaban ampliamente y había neblina presente.
Las comparaciones visuales de los resultados indicaron que el modelo normalizado delineó efectivamente las estructuras complejas de las neuronas. Esta capacidad lo convierte en una herramienta valiosa para los investigadores que estudian sistemas biológicos.
Conclusión
En resumen, la segmentación de imágenes es un aspecto crucial de la visión por computadora que ayuda en la detección y análisis automático de objetos dentro de las imágenes. El modelo de conjunto de niveles LBF es uno de los métodos empleados para este propósito, y la introducción de normalización local ha mejorado significativamente su rendimiento en varias situaciones. Las pruebas en imágenes sintéticas y datos biológicos reales demuestran el potencial de este enfoque para segmentar con precisión estructuras de diversas intensidades y complejidades.
Este método tiene un buen futuro para más aplicaciones en investigación biomédica, donde una segmentación precisa puede llevar a una comprensión más profunda de las estructuras y funciones celulares. El desarrollo continuo de técnicas de segmentación de imágenes apoyará varios campos, mejorando nuestra capacidad para analizar e interpretar información visual.
Título: Normalized level set model for segmentation of low-contrast objects in 2- and 3- dimensional images
Resumen: Analyses of biomedical images often rely on accurate segmentation of structures of interest. Traditional segmentation methods based on thresholding, watershed, fast marching, and level set perform well in high-contrast images containing structures of similar intensities. However, such methods can under-segment or miss entirely low-intensity objects on noisy backgrounds. Machine learning segmentation methods promise superior performance but require large training datasets of labeled images which are difficult to create, particularly in 3D. Here, we propose an algorithm based on the Local Binary Fitting (LBF) level set method, specifically designed to improve the segmentation of low-contrast structures.
Autores: Armen Stepanyants, M. M. J. Baig, Y. L. Wang, S. H. Chung
Última actualización: 2024-01-15 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.01.12.574651
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.01.12.574651.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.