Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones# Inteligencia artificial

Técnicas de IA para analizar imágenes de diapositivas completas

Un estudio sobre métodos de IA para la detección de cáncer en patología digital.

― 11 minilectura


IA en Patología DigitalIA en Patología Digitaldetección de cáncer en patología.Enfoques innovadores de IA para la
Tabla de contenidos

Las Imágenes de Deslizamiento Completo (WSI) se crean escaneando digitalmente diapositivas de microscopio a diferentes niveles de zoom. Estas imágenes son importantes en la Patología Digital moderna, pero también traen desafíos. Cuando los doctores etiquetan las imágenes, a menudo lo hacen a nivel de la diapositiva, en lugar de en secciones más pequeñas o "baldosas" dentro de la diapositiva. Esto hace que sea difícil para la IA analizar los datos con precisión. Por ejemplo, si un doctor nota la presencia de cáncer, normalmente se basa en toda la diapositiva en lugar de secciones específicas.

Los principales desafíos para la IA involucran dos cosas:

  1. Predecir el tipo de cáncer en general.
  2. Identificar características celulares específicas que están conectadas a ese tipo de cáncer dentro de las baldosas más pequeñas.

Para abordar estos problemas, se utilizó un método llamado Aprendizaje de Múltiples Instancias (MIL) débilmente supervisado. Este enfoque se probó en dos tipos comunes de cáncer: Carcinoma Invasivo de Mama y Carcinoma de Células Escamosas de Pulmón. El objetivo era detectar tumores a niveles de magnificación más bajos, junto con identificar mutaciones en el gen TP53.

Los resultados mostraron que una nueva forma de utilizar MIL funcionó bien, logrando un puntaje bajo la curva (AUC) de 0.96, que es impresionante. Un método alternativo llamado Attention MIL fue un poco mejor con un puntaje de 0.97. Lo interesante es que estos métodos captaron diferentes aspectos de las imágenes a varios niveles de zoom. Por ejemplo, las características asociadas con la mutación TP53 eran más notables a niveles de magnificación más altos, donde los detalles de las células eran más claros.

Proceso de Imágenes de Deslizamiento Completo

La Imágenes de Deslizamiento Completo es el proceso de escanear diapositivas de microscopio completas para crear imágenes digitales. Estas imágenes se guardan en un formato que facilita compartirlas para diagnóstico, enseñanza o investigación. Las WSI son cruciales para diagnosticar el cáncer.

El aprendizaje profundo ha mostrado un gran éxito en el análisis de imágenes médicas. Sin embargo, usar aprendizaje profundo para las WSI presenta tres grandes desafíos:

  1. Gran Tamaño de Imagen: Cada WSI puede tener una resolución de 100,000 por 100,000 píxeles. Este tamaño enorme hace que sea difícil introducirlo directamente en modelos de IA. Para lidiar con esto, se dividen las diapositivas en baldosas más pequeñas y de tamaño fijo, que son más fáciles de manejar.

  2. Falta de Etiquetas Detalladas: Normalmente, las diapositivas se etiquetan a un nivel general (como la diapositiva completa o el paciente), no al nivel de las baldosas individuales. Es difícil y lleva tiempo para los patólogos etiquetar cada parte pequeña de la diapositiva. Debido a esto, los métodos totalmente supervisados no se pueden usar de manera efectiva, por lo que son necesarios enfoques más débiles como el aprendizaje de múltiples instancias.

  3. Problemas de Recuperación de Información: Obtener información útil de patología a partir de informes clínicos puede ser complicado. Como resultado, entender las áreas identificadas por la IA a menudo carece de claridad, lo que hace que las explicaciones detalladas sean desafiantes. Identificar regiones de interés (RoI) a través de IA es un método común en Patología Digital, a menudo referido como “tinción virtual.” En este estudio, las imágenes en bruto se combinaron con mapas de calor generados por el análisis del modelo.

Explicación del Aprendizaje de Múltiples Instancias

El Aprendizaje de Múltiples Instancias (MIL) es un método que agrupa datos en conjuntos llamados bolsas. Cada bolsa recibe una etiqueta, pero los elementos individuales dentro de ella pueden no tenerla. Una idea clave es que una bolsa se considera positiva si al menos un elemento dentro de ella es positivo. El enfoque supone que no hay un orden o relación específica entre los elementos en una bolsa.

En el caso del análisis de deslizamiento completo, cada diapositiva se trata como una bolsa que contiene varios parches o baldosas. Aunque tenemos etiquetas a nivel de diapositiva, nos faltan etiquetas para cada baldosa individual. Para dar sentido a estas relaciones, se puede aplicar un operador específico que ayuda a interpretar mejor los resultados. Este operador puede ponderar cuán importante es cada baldosa para el resultado final, produciendo un mapa de calor que resalta áreas importantes de la imagen.

Arquitecturas de Modelo Utilizadas

Para asegurarse de que los resultados fueran comprensibles, se utilizaron modelos con un mecanismo de atención. Esto permitió que los modelos se concentraran en características importantes mientras seguían siendo eficientes. Se utilizaron dos modelos principales: el original Attention MIL y una nueva versión llamada Additive MIL.

El Attention MIL estándar calcula un promedio ponderado de las baldosas, con pesos aprendidos a través de una red neuronal de dos capas. Este método trata cada baldosa como separada. Sin embargo, hubo algunos problemas con la forma en que podía explicar sus resultados, ya que los puntajes de atención no siempre eran fáciles de interpretar.

El modelo Additive MIL fue diseñado para dar indicaciones visuales más claras de qué baldosas contribuyeron a la clasificación final. Cada baldosa fue puntuado individualmente, y estas puntuaciones se combinaron para proporcionar una puntuación total para toda la diapositiva. Esto significa que las puntuaciones podían mostrar si una baldosa contribuyó de manera positiva o negativa al resultado.

Métodos de Entrenamiento

Para este proyecto, se dividió un conjunto de datos en un conjunto de entrenamiento (80%) y un conjunto de prueba (20%). Los modelos pasaron por cinco rondas de validación durante el entrenamiento para evitar sesgos. Luego se utilizó el conjunto de prueba para ver qué tan bien podía desempeñarse el modelo en datos nuevos y no vistos.

Para cada modelo, se aplicó una función de pérdida para optimizar los resultados. El proceso se basó en dos proyectos de cáncer específicos: uno de cáncer de mama y otro de cáncer de pulmón.

En el análisis de cáncer de mama, solo se utilizaron las diapositivas que se congelaron para la Detección de tumores, ya que los tejidos congelados son más adecuados para el análisis en algunos casos. Para el análisis de mutaciones genéticas, se utilizaron diapositivas más confiables que habían sido preservadas de otra manera.

Preparación de Datos para Imágenes de Deslizamiento Completo

Las imágenes de deslizamiento completo son demasiado grandes para que los modelos de IA las analicen directamente. Para abordar esto, solo se procesó un nivel de zoom a la vez.

La preparación de datos involucró extraer metadatos de cada diapositiva, incluyendo detalles cruciales como ID de diapositiva, etiquetas y tamaño. Después de eso, se necesitaba obtener y preprocesar parches de la diapositiva. Esto se hacía para evitar incluir partes de la diapositiva que contenían solo el fondo o artefactos del proceso de preparación de la diapositiva.

Inicialmente, se analizó una versión en miniatura de la diapositiva para identificar parches no deseados. Este método ayudó a identificar áreas de píxeles que contenían tejido real. Después del procesamiento, solo se mantuvieron las baldosas útiles para un análisis posterior.

Para la tarea de detección de mutaciones genéticas, el proceso fue un poco diferente. Se tomaron muestras de las baldosas, y si el número de baldosas relevantes era demasiado alto, solo se seleccionó un porcentaje. Se utilizó el mismo enfoque para niveles de magnificación más altos.

Extracción de Características

Para extraer características importantes de las baldosas, se utilizó un modelo específico llamado KimiaNet, que se basa en una arquitectura de aprendizaje profundo. Este modelo fue entrenado para reconocer tipos de tumores en otros tipos de diapositivas, lo que le permite generar datos útiles sobre los parches.

Se aplicaron técnicas de aumento de datos para crear variaciones de cada baldosa, enriqueciendo así el conjunto de datos. Esto incluía cambiar colores, agregar ruido y rotar imágenes.

Resultados de Clasificación y Detección de Regiones

Una vez que los modelos fueron ajustados, se probaron varias veces para encontrar resultados promedio. El rendimiento se midió usando la métrica AUC, que es una forma de entender qué tan bien puede distinguir el modelo entre diferentes clases.

Para la tarea de detección de tumores a 5x de magnificación, el modelo original funcionó excepcionalmente bien con un AUC por encima de 0.9. Los hallazgos sugieren que los modelos fueron efectivos para distinguir entre áreas tumorales y no tumorales incluso a niveles de magnificación más bajos.

Al observar los puntajes de atención, se encontró que el modelo original Attention MIL era más propenso a concentrarse en áreas cerca de los bordes de los tejidos. Esto puede indicar un desafío para localizar áreas tumorales específicas o revelar que el tumor a menudo existe en los bordes del tejido.

Desafíos y Observaciones en la Detección de Tumores

Los modelos hicieron un buen trabajo identificando tumores, lo que indica que las características utilizadas eran probablemente relevantes. Los puntajes que generaron fueron mucho mejores en comparación con estudios anteriores. Esto enfatiza que usar niveles de magnificación más bajos aún podría permitir una detección efectiva de tumores.

A pesar de los resultados positivos, los puntajes de atención indicaron que los patrones a veces podían ser más difíciles de interpretar. Las diferencias en cómo se distribuía la atención sugieren que algunas características pueden ser más o menos útiles según las características del cáncer que se esté examinando.

Rendimiento en la Detección de Mutaciones Genéticas

Para la tarea de detección de mutaciones genéticas, los resultados fueron generalmente más bajos en comparación con la detección de tumores. A 5x de magnificación, fue evidente que el modelo tenía dificultades para identificar mutaciones específicas. Como se esperaba, las mayores magnificaciones mejoraron el rendimiento, mostrando que los detalles en la imagen se volvían más claros.

Con 10x de magnificación, los resultados mejoraron significativamente. Los modelos pudieron distinguir mejor entre casos con y sin mutaciones. A medida que el nivel de zoom aumentó a 20x, la capacidad para identificar áreas significativas mejoró aún más.

Sin embargo, los hallazgos también revelaron que los modelos podrían no siempre resaltar áreas que serían clínicamente relevantes. Los modelos parecían depender de patrones que no eran tan pronunciados en niveles de magnificación anteriores, lo que indica limitaciones en la detección de mutaciones solo a partir de imágenes de tejido.

Conclusión

En general, este estudio demostró la efectividad de usar métodos de Aprendizaje de Múltiples Instancias con mecanismos de atención para analizar Imágenes de Deslizamiento Completo. Si bien detectar tumores fue generalmente más exitoso, identificar mutaciones genéticas presentó desafíos. El uso de diferentes arquitecturas de modelo destacó sensibilidades variadas a características únicas, lo que dio lugar a oportunidades para un análisis más profundo de las morfologías relacionadas con el cáncer. Los trabajos futuros incluirán evaluaciones más detalladas de los mapas de calor para confirmar la relevancia de las áreas identificadas por los modelos.

Los resultados muestran potencial para una mayor exploración en el uso de IA en patología, especialmente en entender cómo diferentes características del cáncer se relacionan con sus características morfológicas. En general, el estudio allana el camino para avances en el diagnóstico y tratamiento del cáncer a través de mejores técnicas de análisis de imágenes.

Fuente original

Título: Finding Regions of Interest in Whole Slide Images Using Multiple Instance Learning

Resumen: Whole Slide Images (WSI), obtained by high-resolution digital scanning of microscope slides at multiple scales, are the cornerstone of modern Digital Pathology. However, they represent a particular challenge to AI-based/AI-mediated analysis because pathology labeling is typically done at slide-level, instead of tile-level. It is not just that medical diagnostics is recorded at the specimen level, the detection of oncogene mutation is also experimentally obtained, and recorded by initiatives like The Cancer Genome Atlas (TCGA), at the slide level. This configures a dual challenge: a) accurately predicting the overall cancer phenotype and b) finding out what cellular morphologies are associated with it at the tile level. To address these challenges, a weakly supervised Multiple Instance Learning (MIL) approach was explored for two prevalent cancer types, Invasive Breast Carcinoma (TCGA-BRCA) and Lung Squamous Cell Carcinoma (TCGA-LUSC). This approach was explored for tumor detection at low magnification levels and TP53 mutations at various levels. Our results show that a novel additive implementation of MIL matched the performance of reference implementation (AUC 0.96), and was only slightly outperformed by Attention MIL (AUC 0.97). More interestingly from the perspective of the molecular pathologist, these different AI architectures identify distinct sensitivities to morphological features (through the detection of Regions of Interest, RoI) at different amplification levels. Tellingly, TP53 mutation was most sensitive to features at the higher applications where cellular morphology is resolved.

Autores: Martim Afonso, Praphulla M. S. Bhawsar, Monjoy Saha, Jonas S. Almeida, Arlindo L. Oliveira

Última actualización: 2024-04-11 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2404.01446

Fuente PDF: https://arxiv.org/pdf/2404.01446

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares