Avances en la segmentación automatizada de tumores de tejido blando
Los modelos automatizados muestran potencial para segmentar con precisión tumores de tejido blando en imágenes de MRI.
― 7 minilectura
Tabla de contenidos
- Creación del Conjunto de Datos
- Proceso de etiquetado
- Importancia de la Segmentación Precisa
- Desafíos en la Segmentación Manual
- Modelos de Segmentación
- Modelo U-Net
- Modelo Segment Anything (SAM)
- Configuración Experimental
- Resultados y Análisis del Rendimiento
- Impacto del Tamaño y Ubicación del Tumor
- Dificultades con Ciertos Tipos de Tumores
- Conclusiones y Direcciones Futuras
- Fuente original
- Enlaces de referencia
Los tumores de tejidos blandos musculoesqueléticos (MSTTs) son crecimientos anormales que se forman en las partes blandas del cuerpo, como músculos, tendones y grasa. Estos tumores pueden ser benignos (no cancerosos) o malignos (cancerosos). Identificar y medir estos tumores con precisión es esencial para que los doctores evalúen su tamaño y ubicación, hagan diagnósticos y monitoreen la respuesta de un paciente al tratamiento.
Sin embargo, examinar estos tumores es una tarea complicada que a menudo requiere capacitación especializada. La segmentación manual, donde un experto entrenado contorna el tumor en imágenes médicas, puede llevar mucho tiempo y no siempre es precisa. Por eso, crear un modelo automatizado que pueda hacer esta tarea rápido y con precisión sería súper útil tanto para los doctores como para los pacientes.
Para construir un modelo así, se necesita una gran colección de imágenes etiquetadas. Este trabajo se centra en un conjunto de datos de imágenes de MRI, específicamente para tumores de tejidos blandos, que incluye datos de 199 pacientes.
Creación del Conjunto de Datos
Recopilamos imágenes de MRI de una base de datos de pacientes tratados por MSTTs en un centro médico. Inicialmente, identificamos a más de 2,600 pacientes que se habían sometido a cirugía por varios tipos de tumores. Después de un exhaustivo examen, nos enfocamos en 199 pacientes cuyos tumores cumplían ciertos criterios, incluyendo tamaño y calidad de las tomografías por MRI.
Cada tipo de tumor se categorizó según su tipo de tejido: fibroso, graso, mixoide, nervioso o vascular. El objetivo era incluir una representación equilibrada de estos diferentes tipos en el conjunto de datos.
Proceso de etiquetado
Para etiquetar las imágenes de los tumores, usamos una plataforma en línea llamada LabelStudio. La plataforma permitió a los radiólogos anotar las imágenes de forma fácil. Utilizamos tanto tomografías T1 como T2 para este estudio.
El proceso de anotación se llevó a cabo en tres etapas. Primero, un radiólogo marcó la sección central de cada tumor. Después, anotadores adicionales trabajaron en secciones adyacentes usando las marcas iniciales como guía. Finalmente, todas las anotaciones fueron revisadas por un equipo de radiólogos para asegurar la precisión.
Importancia de la Segmentación Precisa
La segmentación adecuada de los tumores es crucial por varias razones. Primero, proporciona mediciones exactas del tamaño y la forma del tumor, ayudando a los doctores a clasificar la enfermedad y decidir sobre un plan de tratamiento. Segundo, permite el monitoreo continuo de los cambios en los tumores a lo largo del tiempo, posibilitando ajustes en el tratamiento si es necesario.
Sin embargo, segmentar no es sencillo. Los tumores pueden aparecer bastante diferentes según su forma, tamaño y el tipo de tejido. Otros factores como el ruido de la imagen y las variaciones en cómo se toman las MRI pueden complicar el proceso.
Desafíos en la Segmentación Manual
Incluso para clínicos calificados, contornear manualmente los tumores en tres dimensiones puede ser muy laborioso. El proceso puede tardar hasta media hora solo para un volumen de MRI.
En respuesta a estos desafíos, los investigadores han comenzado a crear modelos automatizados. Se han probado varios métodos, incluyendo aprendizaje automático clásico y aprendizaje profundo, pero el progreso ha sido lento debido a la falta de Conjuntos de datos grandes y diversos.
Modelos de Segmentación
Se desarrollaron dos modelos principales para la segmentación de tumores: U-Net y Segment Anything Model (SAM).
Modelo U-Net
El modelo U-Net es un tipo de red neuronal específicamente diseñada para la segmentación de imágenes. Consiste en un codificador que comprime la imagen de entrada en una representación más pequeña, y un decodificador que expande esta representación de nuevo al tamaño original de la imagen. U-Net utiliza conexiones de acceso entre el codificador y el decodificador, lo que ayuda a retener detalles importantes para una segmentación precisa.
Modelo Segment Anything (SAM)
El modelo SAM fue creado para la segmentación de imágenes y se ha entrenado en un conjunto de datos muy grande. Se compone de tres partes: un codificador de imagen que procesa la entrada, un codificador de prompts que ayuda a guiar el modelo durante la segmentación, y un decodificador de máscaras que produce la máscara de segmentación final.
Ambos modelos fueron probados utilizando una combinación de imágenes de MRI (T1 y T2) para crear entradas más efectivas para el proceso de segmentación.
Configuración Experimental
Para evaluar los modelos, utilizamos conjuntos de datos adicionales más allá de nuestro conjunto principal de 199 pacientes. Uno incluía diversas modalidades de imagen, lo que añadió complejidad y diversidad a las pruebas.
Las MRI fueron procesadas a una resolución específica y normalizadas para minimizar los efectos de los valores atípicos. Agrupamos las imágenes en secciones y utilizamos validación cruzada para asegurar que los resultados fueran confiables y reproducibles. También se aplicaron diferentes técnicas de aumento para mejorar el rendimiento del modelo durante el entrenamiento.
Resultados y Análisis del Rendimiento
Después de completar los experimentos, analizamos el rendimiento de nuestros modelos de segmentación. El modelo U-Net, entrenado con nuestro conjunto de 199 pacientes, logró resultados impresionantes. En particular, destacó en la segmentación de tumores grasos y mixoides, aunque enfrentó desafíos con los tipos fibrosos y vasculares.
Impacto del Tamaño y Ubicación del Tumor
Un examen de cómo el tamaño del tumor afectó la precisión del modelo reveló que los tumores más grandes eran más fáciles de segmentar. Los modelos tendían a rendir mejor en tumores ubicados en las extremidades en lugar de en el tronco u otras áreas menos comunes, debido a un mayor tamaño de muestra en el entrenamiento.
Dificultades con Ciertos Tipos de Tumores
Aunque los modelos se desempeñaron bien en general, ciertos tipos de tumores presentaron desafíos significativos. Por ejemplo, los tumores fibrosos y vasculares a menudo mostraban estructuras más complejas, lo que dificultaba diferenciarlos de los tejidos circundantes.
Conclusiones y Direcciones Futuras
En conclusión, nuestros esfuerzos para crear un conjunto de datos completo para la segmentación de tumores de tejidos blandos han mostrado promesas. Los modelos de segmentación han mejorado significativamente nuestra capacidad para identificar y medir tumores con precisión. Sin embargo, los resultados también resaltan áreas para mejorar.
Recomendamos expandir aún más el conjunto de datos, especialmente para tumores fibrosos y vasculares. Recopilar más imágenes que representen una variedad de ubicaciones anatómicas y tipos de tumores ayudará a crear un modelo más robusto. Además, explorar más técnicas e parámetros de imagen diferentes puede llevar a un mejor rendimiento en el futuro.
En general, el avance de herramientas de segmentación automatizadas puede mejorar las capacidades de los profesionales de la salud, haciendo que la evaluación de tumores sea más rápida y confiable, beneficiando en última instancia la atención al paciente.
Título: MSTT-199: MRI Dataset for Musculoskeletal Soft Tissue Tumor Segmentation
Resumen: Accurate musculoskeletal soft tissue tumor segmentation is vital for assessing tumor size, location, diagnosis, and response to treatment, thereby influencing patient outcomes. However, segmentation of these tumors requires clinical expertise, and an automated segmentation model would save valuable time for both clinician and patient. Training an automatic model requires a large dataset of annotated images. In this work, we describe the collection of an MR imaging dataset of 199 musculoskeletal soft tissue tumors from 199 patients. We trained segmentation models on this dataset and then benchmarked them on a publicly available dataset. Our model achieved the state-of-the-art dice score of 0.79 out of the box without any fine tuning, which shows the diversity and utility of our curated dataset. We analyzed the model predictions and found that its performance suffered on fibrous and vascular tumors due to their diverse anatomical location, size, and intensity heterogeneity. The code and models are available in the following github repository, https://github.com/Reasat/mstt
Autores: Tahsin Reasat, Stephen Chenard, Akhil Rekulapelli, Nicholas Chadwick, Joanna Shechtel, Katherine van Schaik, David S. Smith, Joshua Lawrenz
Última actualización: Sep 4, 2024
Idioma: English
Fuente URL: https://arxiv.org/abs/2409.03110
Fuente PDF: https://arxiv.org/pdf/2409.03110
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.