Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes

Cross-SAM : Faire avancer l'alignement d'images multi-modalités

Une nouvelle méthode améliore l'alignement des scans CT et IRM en imagerie médicale.

― 6 min lire


Cross-SAM : MeilleureCross-SAM : MeilleureAlignement de Scanl'intégration des images CT et IRM.Une méthode révolutionnaire améliore
Table des matières

Dans le monde de l'imagerie médicale, les docs utilisent souvent différents types de scans pour avoir une vision claire du corps du patient. Deux types courants sont les scans CT (tomographie par ordinateur) et les IRM (imagerie par résonance magnétique). Chacun a ses forces. Les scans CT montrent bien la forme des organes et des tissus, tandis que les IRM sont meilleures pour visualiser les tissus mous et détecter des problèmes comme des tumeurs. Les médecins doivent combiner les infos des deux scans pour poser des diagnostics précis et planifier des traitements.

Le défi de l'alignement des images

Quand on utilise les scans CT et IRM ensemble, il est crucial de bien les aligner. Ça veut dire qu'il faut faire correspondre les images afin que la même zone du corps soit représentée dans les deux scans. Ce processus s'appelle l'Enregistrement d'images. Les méthodes traditionnelles d'enregistrement passent souvent par trois étapes : aligner grossièrement les images, faire des ajustements plus détaillés et peaufiner l'alignement. Le défi se pose quand les deux scans ont des zones de focus différentes, appelées champ de vision (FOV). Par exemple, un scan peut capturer une plus grande zone du corps, tandis que l'autre se concentre sur une plus petite région. Aligner des scans avec de telles différences peut causer des problèmes.

Le rôle de l'Apprentissage auto-supervisé

Pour aider à l'alignement des images, on peut utiliser une méthode appelée apprentissage auto-supervisé. Cette technique crée des repères dans les images qui peuvent guider le processus d'enregistrement. Une telle méthode, appelée SAM (Self-supervised Anatomical eMbedding), adopte une approche unique pour détecter ces repères en apprenant à partir des données elles-mêmes, sans avoir besoin d'exemples étiquetés.

Cependant, SAM a une limite : elle fonctionne bien pour des images du même type (comme CT à CT) mais galère avec des images provenant de sources différentes (comme CT à IRM). C'est à cause des différences significatives dans la façon dont les deux modalités d'imagerie représentent la même anatomie.

Introduction de Cross-SAM

Pour résoudre ce problème, des chercheurs ont introduit une nouvelle méthode appelée Cross-SAM. Cette approche vise à créer un ensemble commun de repères qui peut être utilisé à travers différentes modalités d'imagerie. En faisant cela, elle permet un alignement plus efficace des images CT et IRM, même lorsque leurs FOV diffèrent de manière significative.

Le processus de Cross-SAM

La méthode Cross-SAM suit une série d'étapes pour s'assurer que les images CT et IRM peuvent être alignées efficacement :

  1. Augmentation des données : La première étape consiste à préparer les images en modifiant agressivement le contraste et la structure. Cela aide le modèle à apprendre l'anatomie sous-jacente plutôt que juste les apparences superficielles.

  2. Détection des repères : En utilisant les données augmentées, la méthode identifie les régions correspondantes dans les images CT et IRM. Ça se fait par un appariement robuste de points de référence.

  3. Alignement initial : Après avoir détecté les repères, la méthode applique une transformation rigide pour aligner grossièrement les images. Cette étape ne vise pas la précision mais aide à réduire les gros désalignements.

  4. Affinage : Après l'alignement initial, un processus d'enregistrement plus détaillé connu sous le nom d'Enregistrement déformable peaufine l'alignement. Cette étape travaille à faire correspondre les images pixel par pixel, conduisant à un alignement final plus précis.

  5. Apprentissage itératif : Le modèle est entraîné en cycles, affinant continuellement sa capacité à faire correspondre les deux types d'images jusqu'à ce que les résultats se stabilisent.

Évaluation de la méthode

Pour tester l'efficacité de Cross-SAM, les chercheurs l'ont appliquée à des ensembles de données réelles, en se concentrant spécifiquement sur des images de tête et de cou et d'abdomen. Ces ensembles de données comportaient des scans CT et IRM appariés avec des différences significatives en FOV.

La performance a été mesurée en regardant à quel point les repères dans les images enregistrées s'alignaient bien. Une distance plus petite entre les repères indiquait un meilleur alignement. À travers les tests, Cross-SAM a démontré une forte capacité à aligner les scans CT et IRM, surpassant à la fois les méthodes traditionnelles et les techniques basées sur l'apprentissage plus récentes.

Comparaison avec les méthodes existantes

En comparant Cross-SAM à d'autres méthodes, on a constaté que les techniques traditionnelles avaient souvent du mal avec des cas impliquant de grandes différences en FOV. Par exemple, alors que certaines méthodes existantes pouvaient aligner les images raisonnablement bien dans des cas standards, elles étaient à la traîne face à des scénarios plus complexes, comme lorsque les scans capturent différentes parties du corps ou se concentrent sur différentes structures.

En revanche, Cross-SAM offrait non seulement un meilleur alignement initial, mais fonctionnait aussi bien comme un précurseur à des méthodes d'enregistrement plus complexes. Ça en fait un outil précieux dans l'imagerie médicale, permettant des diagnostics plus rapides et plus fiables.

Conclusion

La capacité à aligner des images multi-modalités avec précision est essentielle dans la pratique médicale moderne. Avec des techniques comme Cross-SAM, les médecins peuvent désormais combiner les infos provenant de différents types de scans plus efficacement. Cette avancée aide non seulement à de meilleurs diagnostics mais peut aussi contribuer à des plans de traitement plus adaptés pour les patients.

En résumé, Cross-SAM représente un pas en avant prometteur dans le domaine de l'imagerie médicale, en s'attaquant à des défis de longue date en matière d'alignement d'images et en améliorant la qualité des soins grâce à des techniques d'imagerie avancées. En comblant le fossé entre différentes modalités d'imagerie, Cross-SAM permet une compréhension plus claire des conditions des patients, conduisant à de meilleurs résultats.

Source originale

Titre: Matching in the Wild: Learning Anatomical Embeddings for Multi-Modality Images

Résumé: Radiotherapists require accurate registration of MR/CT images to effectively use information from both modalities. In a typical registration pipeline, rigid or affine transformations are applied to roughly align the fixed and moving images before proceeding with the deformation step. While recent learning-based methods have shown promising results in the rigid/affine step, these methods often require images with similar field-of-view (FOV) for successful alignment. As a result, aligning images with different FOVs remains a challenging task. Self-supervised landmark detection methods like self-supervised Anatomical eMbedding (SAM) have emerged as a useful tool for mapping and cropping images to similar FOVs. However, these methods are currently limited to intra-modality use only. To address this limitation and enable cross-modality matching, we propose a new approach called Cross-SAM. Our approach utilizes a novel iterative process that alternates between embedding learning and CT-MRI registration. We start by applying aggressive contrast augmentation on both CT and MRI images to train a SAM model. We then use this SAM to identify corresponding regions on paired images using robust grid-points matching, followed by a point-set based affine/rigid registration, and a deformable fine-tuning step to produce registered paired images. We use these registered pairs to enhance the matching ability of SAM, which is then processed iteratively. We use the final model for cross-modality matching tasks. We evaluated our approach on two CT-MRI affine registration datasets and found that Cross-SAM achieved robust affine registration on both datasets, significantly outperforming other methods and achieving state-of-the-art performance.

Auteurs: Xiaoyu Bai, Fan Bai, Xiaofei Huo, Jia Ge, Tony C. W. Mok, Zi Li, Minfeng Xu, Jingren Zhou, Le Lu, Dakai Jin, Xianghua Ye, Jingjing Lu, Ke Yan

Dernière mise à jour: 2023-07-07 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2307.03535

Source PDF: https://arxiv.org/pdf/2307.03535

Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Vision par ordinateur et reconnaissance des formesAvancées dans la détection des ganglions lymphatiques pour le traitement du cancer

Une nouvelle méthode améliore la détection des ganglions lymphatiques dans les scans CT du thorax, ce qui renforce le diagnostic du cancer.

― 7 min lire

Articles similaires