Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Patología

Avances en el Análisis de Imágenes de Diapositivas Completa

Nuevos métodos mejoran la extracción de azulejos para un mejor diagnóstico de enfermedades.

― 7 minilectura


Extracción Mejorada deExtracción Mejorada deTejas en Patologíael análisis de patología digital.Nuevos métodos mejoran la precisión en
Tabla de contenidos

La imagenología de diapositivas completas (WSI) es una tecnología que escanea muestras de tejido y las convierte en imágenes digitales detalladas. Este método es esencial para los doctores que evalúan muestras de tejido para identificar enfermedades, incluido el cáncer. Las imágenes digitales son de muy alta resolución y se pueden almacenar, compartir y analizar fácilmente con computadoras. Esta tecnología se ha vuelto crucial en laboratorios médicos y está ganando popularidad para diagnósticos remotos y fines educativos.

Los WSIs son increíblemente grandes, llegando a alcanzar hasta 100,000 × 100,000 píxeles cuando se ven con un aumento alto de 40x. A medida que más hospitales y laboratorios adoptan esta tecnología, la necesidad de maneras efectivas para analizar estas imágenes masivas está en aumento.

El papel del Aprendizaje Profundo en el análisis de imágenes

El aprendizaje profundo es un tipo de inteligencia artificial que ha avanzado significativamente en el análisis de imágenes. Aplica técnicas para reconocer patrones en las imágenes que eran menos efectivas en enfoques anteriores. En el contexto de WSIs, el aprendizaje profundo puede ayudar en varias áreas, como segmentar tipos de tejido, predecir mutaciones y clasificar diapositivas.

Las redes neuronales artificiales (ANNs) y las redes neuronales convolucionales (CNNs) son tipos de modelos de aprendizaje profundo utilizados para estas tareas. Aprenden de datos etiquetados, lo que significa que necesitan ejemplos donde las características estén identificadas. Sin embargo, crear estos ejemplos etiquetados puede ser complicado debido a la diversidad y tamaño de los datos.

Manejar el tamaño de los WSIs es un problema porque pueden ser demasiado grandes para procesar todo de una vez. Por lo tanto, una solución común es dividir las imágenes en secciones más pequeñas o "tiles". Estos "tiles" pueden variar en tamaño, pero la mayoría de los métodos utilizan tiles de alrededor de 256 × 256 píxeles. Al analizar piezas más pequeñas de la imagen, los modelos de aprendizaje profundo pueden hacer predicciones sobre las diapositivas enteras.

Estrategias de "tiling" en imagenología de diapositivas completas

El "grid tiling" es una de las formas más comunes de descomponer los WSIs. Este método divide la diapositiva en una serie de "tiles" que no se superponen, dispuestos en una cuadrícula. Hay varias herramientas disponibles para implementar el "grid tiling", como Histolab y SliDL, que ayudan a extraer "tiles" de los WSIs de manera efectiva.

Sin embargo, los métodos de "tiling" tradicionales pueden tener dificultades con regiones de formas irregulares, como los tumores. Las áreas tumorales a menudo no encajan bien en los "tiles" de la cuadrícula, lo que dificulta la captura de datos de imagen relevantes. Algunos investigadores han tratado de abordar este problema con métodos que buscan extraer "tiles" de alrededor de los bordes de las regiones anotadas. Sin embargo, estos métodos aún pueden perder partes importantes de la imagen.

Desafíos de la extracción de "tiles"

Los métodos actuales para extraer "tiles" de los WSI a menudo conducen a problemas, especialmente al tratar con tumores. Los tumores pueden tener formas y tamaños irregulares que no se adaptan bien al método de "grid tiling". Como resultado, áreas importantes pueden quedar fuera, lo que podría afectar el rendimiento de los modelos de aprendizaje automático.

Por ejemplo, utilizar el método de ocho puntos para seleccionar "tiles" puede perder "tiles" que están solo parcialmente dentro de los límites anotados. A veces, extraer "tiles" más pequeños puede ayudar, pero eso tampoco siempre funciona. También hay problemas con áreas en blanco o áreas que no contienen tejido útil, lo que puede confundir a los modelos de aprendizaje automático durante el entrenamiento.

Los "tiles" no deseados pueden introducir información irrelevante, llevando a un pobre rendimiento de los algoritmos diseñados para analizar las imágenes.

Nuevos enfoques para la extracción de "tiles"

Para abordar estos desafíos, se han propuesto nuevos métodos para definir reglas para seleccionar "tiles". Se han introducido dos conceptos: intersección sobre tile (IoT) y fondo sobre tile (BoT).

El IoT observa cuánto se superpone un "tile" con una región anotada. Esto ayuda a determinar si un "tile" vale la pena incluirlo en el análisis. Si un "tile" tiene una buena cantidad de superposición con las regiones de interés, es más probable que sea útil para el entrenamiento.

El BoT se centra en identificar "tiles" que contienen espacios en blanco excesivos. Los "tiles" con demasiadas áreas en blanco o contenido no informativo pueden ser excluidos del conjunto de datos. Esto ayuda a asegurar que solo se consideren "tiles" con tejido relevante durante el análisis. Tanto IoT como BoT proporcionan criterios para elegir qué "tiles" conservar y cuáles descartar.

Implementando los nuevos métodos

Los nuevos enfoques se pueden combinar en un algoritmo de extracción de "tiles" conocido como PathEX. Este algoritmo utiliza tanto IoT como BoT para mejorar la extracción de "tiles" alrededor de los bordes de las regiones anotadas, excluyendo también aquellos que son principalmente fondo.

Al usar PathEX, los investigadores pueden ajustar los umbrales para IoT y BoT para encontrar la mejor configuración para sus estudios específicos. Esta flexibilidad permite afinar el conjunto de datos para asegurar que se seleccionen los "tiles" más relevantes para el análisis.

Pruebas y evaluación

En pruebas, se aplicó el algoritmo PathEX a una variedad de conjuntos de datos para evaluar su efectividad. Se utilizaron dos conjuntos de datos, uno centrado en muestras de ganglios linfáticos y otro en cánceres de múltiples órganos. De estos conjuntos de datos, se utilizó el algoritmo para extraer "tiles" con criterios específicos.

Los resultados iniciales mostraron que los umbrales óptimos para IoT y BoT llevaban a un mejor rendimiento del modelo. Umbrales más altos reducían la cantidad de "tiles" ruidosos y ayudaban a asegurar que el modelo se entrenara con datos más limpios. Esto lleva a un análisis más preciso y confiable, especialmente al tomar decisiones médicas cruciales basadas en los hallazgos.

Hallazgos y resultados

Los estudios encontraron que establecer el valor de IoT entre 0.2 y 0.5, junto con configuraciones de BoT alrededor de 0.2, producía los mejores resultados. Si bien umbrales más altos reducían el ruido, también podían llevar a un sobreajuste, donde el modelo funciona bien en datos de entrenamiento pero mal en nuevos datos.

Los resultados sugirieron que retener algunos "tiles" ruidosos puede ayudar a mejorar la robustez de los modelos. Esto se debe a que tener una mayor variedad de ejemplos puede ayudar a enseñar al modelo a reconocer patrones de manera más efectiva.

Al eliminar "tiles" que contenían solo áreas en blanco, la calidad general del conjunto de datos mejoró, lo que indica aún más la importancia de considerar tanto el IoT como el BoT al preparar datos para modelos de aprendizaje profundo.

Conclusión

El uso de PathEX y los conceptos de IoT y BoT ofrecen avances prometedores en el análisis de Imágenes de diapositivas completas. Al abordar los desafíos asociados con los métodos tradicionales de extracción de "tiles", el nuevo enfoque permite a los investigadores crear un conjunto de datos más preciso para entrenar modelos de aprendizaje automático.

Estos hallazgos tienen un gran potencial para mejorar la forma en que los profesionales médicos utilizan la patología digital para diagnosticar y comprender enfermedades. A medida que la tecnología avanza, el objetivo es mejorar la precisión y la eficiencia en el diagnóstico de condiciones como el cáncer, llevando, en última instancia, a mejores resultados para los pacientes.

Fuente original

Título: PathEX: Make Good Choice for Whole Slide Image Extraction

Resumen: BackgroundThe tile-based approach has been widely used for slide-level predictions in whole slide image (WSI) analysis. However, the irregular shapes and variable dimensions of tumor regions pose challenges for the process. To address this issue, we proposed PathEX, a framework that integrates intersection over tile (IoT) and background over tile (BoT) algorithms to extract tile images around boundaries of annotated regions while excluding the blank tile images within these regions. MethodsWe developed PathEX, which incorporated IoT and BoT into tile extraction, for training a classification model in CAM (239 WSIs) and PAIP (40 WSIs) datasets. By adjusting the IoT and BoT parameters, we generated eight training sets and corresponding models for each dataset. The performance of PathEX was assessed on the testing set comprising 13,076 tile images from 48 WSIs of CAM dataset and 6,391 tile images from 10 WSIs of PAIP dataset. ResultsPathEX could extract tile images around boundaries of annotated region differently by adjusting the IoT parameter, while exclusion of blank tile images within annotated regions achieved by setting the BoT parameter. As adjusting IoT from 0.1 to 1.0, and 1 - BoT from 0.0 to 0.5, we got 8 train sets. Experimentation revealed that set C demonstrates potential as the most optimal candidate. Nevertheless, a combination of IoT values ranging from 0.2 to 0.5 and 1-BoT values ranging from 0.2 to 0.5 also yielded favorable outcomes. ConclusionsIn this study, we proposed PathEX, a framework that integrates IoT and BoT algorithms for tile image extraction at the boundaries of annotated regions while excluding blank tiles within these regions. Researchers can conveniently set the thresholds for IoT and BoT to facilitate tile image extraction in their own studies. The insights gained from this research provide valuable guidance for tile image extraction in digital pathology applications.

Autores: Xinda Yang, R. Zhang, Y. Zhang, K. Chen

Última actualización: 2024-02-22 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.02.20.581147

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.02.20.581147.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares