Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Faire avancer la segmentation d'images médicales grâce à l'adaptation de domaine non supervisée

Cette approche améliore la segmentation des images médicales sans avoir besoin de beaucoup de données étiquetées.

― 7 min lire


Améliorer la segmentationAméliorer la segmentationd'images médicalesde données étiquetées.précision de la segmentation avec moinsUne méthode améliorée augmente la
Table des matières

Dans le domaine de l'imagerie médicale, identifier et segmenter correctement les différentes structures dans les images est super important pour le diagnostic et la planification des traitements. Mais, entraîner des modèles pour la segmentation d'images nécessite souvent une grande quantité de données étiquetées, ce qui est difficile et long à obtenir dans le milieu de la santé. Pour relever ce défi, les chercheurs se concentrent sur des techniques qui peuvent aider à transférer des connaissances d'un type d'image médicale à un autre, même quand aucune donnée étiquetée n'est disponible pour le type d'image cible.

Ce processus s'appelle l'Adaptation de domaine non supervisée (UDA). L'objectif est de faire en sorte qu'un modèle entraîné sur un ensemble d'images médicales fonctionne bien sur un autre ensemble, offrant une manière plus pratique d'utiliser l'IA en imagerie médicale.

Qu'est-ce que l'UDA ?

L'adaptation de domaine non supervisée est une stratégie utilisée pour aider les modèles à apprendre à partir d'images qui n'ont pas été étiquetées. L'idée principale est de prendre des modèles entraînés sur un type de données, souvent appelé domaine source, et de les adapter pour qu'ils puissent bien fonctionner sur un autre type de données, connu sous le nom de domaine cible. Par exemple, si un modèle est entraîné sur des images d'un type d'IRM, il peut être ajusté pour fonctionner aussi sur des images d'un autre type d'IRM sans avoir besoin de nouvelles données étiquetées.

Importance en imagerie médicale

En imagerie médicale, différentes modalités d'imagerie offrent diverses vues et détails de l'anatomie. Par exemple, une tomodensitométrie (CT) et une IRM peuvent toutes les deux donner des informations sur le même organe mais peuvent mettre en avant différents aspects. Adapter un modèle entraîné sur un type d'imagerie à un autre peut aider les médecins et les chercheurs à obtenir des informations plus fiables de leurs analyses, améliorant ainsi les résultats pour les patients.

Défis actuels

Les méthodes UDA existantes reposent souvent sur l'alignement des images ou des caractéristiques entre les domaines source et cible. Cependant, plusieurs défis persistent :

  1. Écart de domaine : Différentes modalités d'imagerie peuvent avoir des différences significatives, rendant difficile la généralisation des modèles.
  2. Labels bruités : Lorsqu'on utilise des pseudo-labels générés à partir d'images sources, ces labels peuvent parfois être incorrects, entraînant de mauvais résultats d'entraînement.
  3. Charge computationnelle : Beaucoup de méthodes UDA sont gourmandes en ressources en raison de la nécessité de générer et de traiter plusieurs images.

Méthode proposée

La méthode proposée introduit une nouvelle approche de l'UDA en utilisant des pseudo-labels filtrés. Elle vise à améliorer la performance des modèles sur les images cibles en générant des pseudo-labels de haute qualité et en utilisant efficacement des images étiquetées du domaine source.

Étape 1 : Augmentation des données

Pour booster les données d'entraînement, nous traduisons d'abord des images étiquetées du domaine source en un nouvel ensemble d'entraînement qui comprend à la fois des images de pseudo-domaine source et de pseudo-domaine cible. Cette étape est cruciale car elle offre plus de variété et aide le modèle à apprendre à gérer les différences entre les deux domaines.

Étape 2 : Génération de pseudo-labels

Ensuite, un générateur spécial crée des pseudo-labels de haute qualité pour les images dans le domaine cible. Ce générateur apprend à partir des images augmentées tout en tenant compte des différences entre les domaines. En personnalisant le processus de génération avec des techniques spécifiques, le modèle peut produire des labels plus précis qui réduisent l'impact des erreurs présentes dans les images.

Étape 3 : Apprentissage conjoint

Une fois que nous avons nos images étiquetées du domaine source et les images du domaine cible avec des pseudo-labels, nous entraînons le modèle de segmentation final en utilisant les deux ensembles de données. Cet entraînement conjoint aide le modèle à tirer parti des forces de chaque ensemble de données pour améliorer l'apprentissage.

Étape 4 : Pondération pour la fiabilité

Pour s'attaquer au problème des pseudo-labels bruités, nous introduisons un système de pondération. Ce système évalue la qualité des pseudo-labels et ajuste l'entraînement en conséquence. En accordant plus d'importance aux labels fiables et moins aux non fiables, nous pouvons améliorer la performance du modèle pendant l'entraînement.

Résultats

Nous avons testé notre méthode sur plusieurs ensembles de données liés aux tumeurs cérébrales et aux structures cardiaques. Les résultats montrent que notre approche surpasse constamment les méthodes UDA existantes. Dans certains cas, elle a même fourni de meilleurs résultats que des modèles entraînés avec des données entièrement étiquetées.

Ensemble de données 1 : Segmentation de Schwannome vestibulaire

Dans les tests impliquant des images de Schwannome vestibulaire, notre méthode a montré une amélioration considérable par rapport aux approches UDA traditionnelles. Le modèle a obtenu des scores plus élevés dans les métriques de précision, démontrant son efficacité à s'adapter à différentes modalités d'imagerie.

Ensemble de données 2 : Segmentation de tumeur cérébrale

Lorsque nous avons appliqué la méthode aux images de tumeurs cérébrales, la performance était tout aussi solide. Notre approche non seulement a amélioré la précision, mais a également réduit la variance souvent observée dans les résultats d'autres méthodes.

Ensemble de données 3 : Segmentation du cœur entier

Les expériences avec la segmentation du cœur entier ont confirmé que la méthode proposée peut gérer efficacement des images complexes. Les résultats ont montré un avantage clair à utiliser notre approche systématique par rapport aux pratiques standard.

Discussion

Les résultats suggèrent que la méthode proposée pour l'UDA a un potentiel significatif pour des applications réelles en imagerie médicale. La combinaison de l'augmentation des données, de la génération efficace de pseudo-labels, de l'apprentissage conjoint et de la pondération de la fiabilité crée un cadre robuste qui peut s'adapter à divers types d'imagerie.

Forces

  1. Remplacement efficace des données étiquetées : En utilisant des pseudo-labels, nous réduisons le besoin de vastes ensembles de données étiquetées, rendant le modèle plus facile à entraîner tout en maintenant une haute performance.
  2. Robuste contre les labels bruités : Le mécanisme de pondération aide à réduire l'impact des erreurs dans les pseudo-labels, rendant le processus d'entraînement global plus résilient.

Limites

Malgré les résultats prometteurs, il y a des défis notables :

  1. Demande computationnelle : Le processus peut être gourmand en ressources, nécessitant plus de puissance de calcul que certaines méthodes UDA plus simples.
  2. Qualité des traductions : Le succès des images augmentées dépend fortement de la qualité des techniques de traduction utilisées, qui, si elles sont défaillantes, pourraient affecter la performance globale.

Conclusion

En résumé, la méthode UDA améliorée basée sur des pseudo-labels filtrés montre un grand potentiel pour améliorer les résultats de segmentation dans les images médicales 3D. En générant et en utilisant efficacement des pseudo-labels, cette approche répond à de nombreux défis associés aux techniques UDA traditionnelles. Les résultats positifs à travers divers ensembles de données indiquent que la méthode peut améliorer les applications cliniques en imagerie médicale, ouvrant la voie à des processus de diagnostic plus efficaces et précis.

La direction future devrait se concentrer sur la simplification des demandes computationnelles et le raffinement des processus de traduction d'images pour améliorer encore la performance du modèle sur une gamme plus large de tâches d'imagerie médicale.

Source originale

Titre: FPL+: Filtered Pseudo Label-based Unsupervised Cross-Modality Adaptation for 3D Medical Image Segmentation

Résumé: Adapting a medical image segmentation model to a new domain is important for improving its cross-domain transferability, and due to the expensive annotation process, Unsupervised Domain Adaptation (UDA) is appealing where only unlabeled images are needed for the adaptation. Existing UDA methods are mainly based on image or feature alignment with adversarial training for regularization, and they are limited by insufficient supervision in the target domain. In this paper, we propose an enhanced Filtered Pseudo Label (FPL+)-based UDA method for 3D medical image segmentation. It first uses cross-domain data augmentation to translate labeled images in the source domain to a dual-domain training set consisting of a pseudo source-domain set and a pseudo target-domain set. To leverage the dual-domain augmented images to train a pseudo label generator, domain-specific batch normalization layers are used to deal with the domain shift while learning the domain-invariant structure features, generating high-quality pseudo labels for target-domain images. We then combine labeled source-domain images and target-domain images with pseudo labels to train a final segmentor, where image-level weighting based on uncertainty estimation and pixel-level weighting based on dual-domain consensus are proposed to mitigate the adverse effect of noisy pseudo labels. Experiments on three public multi-modal datasets for Vestibular Schwannoma, brain tumor and whole heart segmentation show that our method surpassed ten state-of-the-art UDA methods, and it even achieved better results than fully supervised learning in the target domain in some cases.

Auteurs: Jianghao Wu, Dong Guo, Guotai Wang, Qiang Yue, Huijun Yu, Kang Li, Shaoting Zhang

Dernière mise à jour: 2024-04-07 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2404.04971

Source PDF: https://arxiv.org/pdf/2404.04971

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires