Avancées dans la segmentation automatique des tumeurs des tissus mous
Les modèles automatisés montrent des promesses pour segmenter avec précision les tumeurs des tissus mous à partir des images IRM.
― 7 min lire
Table des matières
- Création de l'ensemble de données
- Processus de Labeling
- Importance de la segmentation précise
- Défis de la segmentation manuelle
- Modèles de segmentation
- Modèle U-Net
- Modèle Segment Anything Model (SAM)
- Configuration expérimentale
- Résultats et analyse des performances
- Impact de la taille et de l'emplacement de la tumeur
- Difficultés avec certains types de tumeurs
- Conclusions et perspectives d'avenir
- Source originale
- Liens de référence
Les tumeurs des tissus mous musculo-squelettiques (TTMMS) sont des croissances anormales qui se forment dans les parties molles du corps, comme les muscles, les tendons et la graisse. Ces tumeurs peuvent être bénignes (non cancéreuses) ou malignes (cancéreuses). Identifier et mesurer ces tumeurs avec précision est super important pour les médecins afin d'évaluer leur taille et leur emplacement, de poser des diagnostics et de suivre la réponse d'un patient au traitement.
Mais l'examen de ces tumeurs est une tâche compliquée qui nécessite souvent une formation spécialisée. La segmentation manuelle, où un expert formé trace la tumeur sur des images médicales, peut prendre beaucoup de temps et n'est pas toujours précise. Donc, créer un modèle automatisé qui peut faire cette tâche rapidement et précisément serait vraiment utile pour les médecins et les patients.
Pour construire un tel modèle, il faut une grande collection d'images étiquetées. Ce travail se concentre sur un ensemble de données d'images IRM, spécifiquement pour les tumeurs des tissus mous, qui inclut des données de 199 patients.
Création de l'ensemble de données
On a collecté des images IRM à partir d'une base de données de patients traités pour des TTMMS dans un centre médical. Au départ, on a identifié plus de 2 600 patients qui avaient subi une chirurgie pour différents types de tumeurs. Après un filtrage approfondi, on s'est concentré sur 199 patients dont les tumeurs répondaient à certains critères, comme la taille et la qualité des scans IRM.
Chaque type de tumeur a été catégorisé selon son type de tissu : fibreux, graisseux, myxoïde, nerveux ou vasculaire. L'objectif était d'inclure une représentation équilibrée de ces différents types dans l'ensemble de données.
Processus de Labeling
Pour l'étiquetage des images de tumeurs, on a utilisé une plateforme web appelée LabelStudio. Cette plateforme a permis aux radiologues d'annoter les images facilement. On a utilisé à la fois des scans IRM pondérés T1 et T2 pour cette étude.
Le processus d'annotation s'est déroulé en trois étapes. D'abord, un radiologue a marqué la tranche centrale de chaque tumeur. Ensuite, des annotateurs supplémentaires ont travaillé sur les tranches adjacentes en utilisant les marquages initiaux comme guide. Enfin, toutes les annotations ont été revues par une équipe de radiologues pour garantir leur exactitude.
Importance de la segmentation précise
Une bonne segmentation des tumeurs est cruciale pour plusieurs raisons. D'abord, elle fournit des mesures exactes de la taille et de la forme des tumeurs, aidant les médecins à définir le stade de la maladie et à décider d'un plan de traitement. Ensuite, elle permet de suivre les changements des tumeurs au fil du temps, ce qui facilite les ajustements de traitement si nécessaire.
Cependant, la segmentation n'est pas simple. Les tumeurs peuvent apparaître très différentes selon leur forme, leur taille et le type de tissu. D'autres facteurs comme le bruit d'image et les variations dans la façon dont les IRM sont prises peuvent compliquer le processus.
Défis de la segmentation manuelle
Même pour des cliniciens expérimentés, tracer manuellement les tumeurs en trois dimensions peut prendre beaucoup de temps. Le processus peut durer jusqu'à une demi-heure pour juste un volume IRM.
Face à ces défis, des chercheurs ont commencé à créer des modèles automatisés. Différentes méthodes, y compris l'apprentissage machine classique et l'apprentissage profond, ont été testées, mais les progrès ont été lents en raison du manque de grands ensembles de données diversifiés.
Modèles de segmentation
Deux modèles principaux ont été développés pour la segmentation des tumeurs : U-Net et Segment Anything Model (SAM).
Modèle U-Net
Le modèle U-Net est un type de réseau de neurones spécifiquement conçu pour la segmentation d'images. Il se compose d'un encodeur qui compresse l'image d'entrée en une représentation plus petite, et d'un décodeur qui développe cette représentation pour revenir à la taille d'image d'origine. U-Net utilise des connexions de raccourci entre l'encodeur et le décodeur, ce qui aide à conserver des détails importants pour une segmentation précise.
Modèle Segment Anything Model (SAM)
Le modèle SAM a été conçu pour la segmentation d'images et a été entraîné sur un très grand ensemble de données. Il se compose de trois parties : un encodeur d'images qui traite l'entrée, un encodeur de prompt qui aide à guider le modèle lors de la segmentation, et un décodeur de masque qui produit le masque de segmentation final.
Les deux modèles ont été testés en utilisant une combinaison de scans IRM (T1 et T2) pour créer des entrées plus efficaces pour le processus de segmentation.
Configuration expérimentale
Pour évaluer les modèles, on a utilisé des ensembles de données supplémentaires au-delà de notre ensemble principal de 199 patients. L'un incluait diverses modalités d'imagerie, ce qui a ajouté de la complexité et de la diversité aux tests.
Les IRM ont été traitées à une résolution spécifique et normalisées pour minimiser les effets des valeurs aberrantes. On a regroupé les images en tranches et utilisé la validation croisée pour s'assurer que les résultats étaient fiables et reproductibles. Différentes techniques d'augmentation ont également été appliquées pour améliorer les performances du modèle pendant l'entraînement.
Résultats et analyse des performances
Après avoir terminé les expériences, on a analysé les performances de nos modèles de segmentation. Le modèle U-Net, entraîné sur notre ensemble de données de 199 patients, a obtenu des résultats impressionnants. En particulier, il a excellé dans la segmentation des tumeurs graisseuses et myxoïdes tout en faisant face à des défis avec les types fibreux et vasculaires.
Impact de la taille et de l'emplacement de la tumeur
Un examen de la façon dont la taille de la tumeur a affecté la précision du modèle a révélé que les tumeurs plus grandes étaient plus faciles à segmenter. Les modèles avaient tendance à mieux performer sur les tumeurs situées dans les extrémités plutôt que dans le tronc ou d'autres zones moins courantes, en raison d'un plus grand échantillon lors de l'entraînement.
Difficultés avec certains types de tumeurs
Bien que les modèles aient bien fonctionné dans l'ensemble, certains types de tumeurs posaient des défis importants. Par exemple, les tumeurs fibreuses et vasculaires présentaient souvent des structures plus complexes, rendant difficile leur distinction des tissus environnants.
Conclusions et perspectives d'avenir
En conclusion, nos efforts pour créer un ensemble de données complet pour la segmentation des tumeurs des tissus mous ont montré des promesses. Les modèles de segmentation ont considérablement amélioré notre capacité à identifier et mesurer les tumeurs avec précision. Cependant, les résultats soulignent également des domaines à améliorer.
On recommande d'élargir encore l'ensemble de données, en particulier pour les tumeurs fibreuses et vasculaires. Collecter plus d'images qui représentent une variété d'emplacements anatomiques et de types de tumeurs aidera à créer un modèle plus robuste. De plus, explorer davantage différentes techniques d'imagerie et paramètres pourrait conduire à des performances encore meilleures à l'avenir.
Dans l'ensemble, l'avancement des outils de segmentation automatisés peut renforcer les capacités des professionnels de la santé, rendant l'évaluation des tumeurs plus rapide et plus fiable, apportant finalement des bénéfices aux soins des patients.
Titre: MSTT-199: MRI Dataset for Musculoskeletal Soft Tissue Tumor Segmentation
Résumé: Accurate musculoskeletal soft tissue tumor segmentation is vital for assessing tumor size, location, diagnosis, and response to treatment, thereby influencing patient outcomes. However, segmentation of these tumors requires clinical expertise, and an automated segmentation model would save valuable time for both clinician and patient. Training an automatic model requires a large dataset of annotated images. In this work, we describe the collection of an MR imaging dataset of 199 musculoskeletal soft tissue tumors from 199 patients. We trained segmentation models on this dataset and then benchmarked them on a publicly available dataset. Our model achieved the state-of-the-art dice score of 0.79 out of the box without any fine tuning, which shows the diversity and utility of our curated dataset. We analyzed the model predictions and found that its performance suffered on fibrous and vascular tumors due to their diverse anatomical location, size, and intensity heterogeneity. The code and models are available in the following github repository, https://github.com/Reasat/mstt
Auteurs: Tahsin Reasat, Stephen Chenard, Akhil Rekulapelli, Nicholas Chadwick, Joanna Shechtel, Katherine van Schaik, David S. Smith, Joshua Lawrenz
Dernière mise à jour: Sep 4, 2024
Langue: English
Source URL: https://arxiv.org/abs/2409.03110
Source PDF: https://arxiv.org/pdf/2409.03110
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.