Améliorer l'imagerie médicale avec l'apprentissage fédéré
Une méthode pour améliorer l'entraînement des modèles en utilisant des images médicales partiellement étiquetées.
― 7 min lire
Table des matières
Dans le domaine de l'imagerie médicale, l'apprentissage profond a montré un grand potentiel pour identifier et segmenter avec précision diverses structures anatomiques. Cependant, un défi majeur se présente car de nombreux ensembles de données sont seulement partiellement étiquetés. Cela signifie que certaines structures sont marquées dans un ensemble de données, mais pas dans un autre. Cela crée une approche fragmentée pour former des modèles, car différentes institutions n'annotent que les images pertinentes pour leurs recherches. L'objectif de ce travail est d'améliorer la manière dont ces modèles peuvent apprendre à partir de données aussi variées et incomplètes tout en préservant la confidentialité des patients.
Étiquettes partielles
Le Défi desLes images médicales sont souvent complexes et nécessitent une annotation soignée pour être utiles pour former des modèles. Cependant, en raison de contraintes de ressources et de réglementations sur la confidentialité, de nombreuses institutions ne labellisent que les structures spécifiques qui les intéressent. En conséquence, les ensembles de données peuvent avoir des étiquettes très différentes, ce qui rend difficile la création d'un modèle unifié capable de reconnaître toutes les structures pertinentes.
Par exemple, un hôpital pourrait étiqueter des organes comme le foie et les reins, tandis qu'un autre se concentre sur la rate et la colonne vertébrale. Lorsque ces ensembles de données sont gardés séparés, les informations précieuses de chacun ne sont pas totalement utilisées. Par conséquent, les modèles formés sur des données limitées sous-performent souvent lorsqu'ils sont appliqués à différents ensembles de données.
Apprentissage Fédéré : Une Solution
L'apprentissage fédéré est une méthode qui permet à plusieurs institutions de former un modèle de manière collaborative sans partager leurs données. Au lieu d'envoyer toutes les données des patients à un serveur central, chaque institution conserve ses données et ne partage que les mises à jour du modèle appris. Cette approche aide à préserver la confidentialité des patients tout en permettant une formation de modèle améliorée.
Dans cette étude, nous proposons une méthode qui combine l'apprentissage fédéré avec des techniques bayésiennes pour gérer le problème des étiquettes partielles. Chaque institution forme son propre modèle pour identifier les structures qu'elle a étiquetées, mais nous permettons aussi aux modèles d'apprendre de l'Incertitude associée à leurs prédictions. Cela signifie que même si un modèle n'a pas vu une étiquette spécifique, il peut toujours rassembler des informations sur cette étiquette grâce à ses estimations d'incertitude.
La Méthode Proposée
Notre approche consiste à créer une structure de modèle partagé, connue sous le nom de backbone, qui est formée à travers toutes les institutions participantes. À chaque site, une tête de Segmentation unique est créée pour les étiquettes disponibles à cet endroit. Le backbone apprend des caractéristiques générales à partir des données, ce qui peut être utile pour reconnaître des structures même si elles n'étaient pas étiquetées dans cet ensemble de données spécifique.
Lors de l'inférence, les prédictions de chaque tête de segmentation sont combinées, en tenant compte de l'incertitude des prédictions. Cette incertitude reflète à quel point le modèle est confiant dans ses prédictions et nous permet d'améliorer l'exactitude globale en ajustant les poids de chaque prédiction en fonction de la certitude du modèle sur des structures spécifiques.
Processus de Formation et d'Inference
Dans notre processus de formation, chaque institution optimise sa tête de segmentation en fonction des étiquettes disponibles localement. Pendant ce temps, le backbone est mis à jour sur un serveur central via un processus d'averaging fédéré. Cela garantit que le backbone conserve des informations précieuses de tous les ensembles de données.
Lors des prédictions, nous rassemblons toutes les têtes de segmentation et moyennons leurs probabilités softmax. Chaque probabilité est pondérée par le nombre d'institutions qui ont fourni cette étiquette spécifique. En tenant compte de l'incertitude des prédictions, nous pouvons améliorer la segmentation globale, en particulier pour les étiquettes sous-représentées dans les ensembles d'entraînement.
Avantages de l'Approche Proposée
Notre méthode démontre qu'il est possible d'apprendre efficacement à partir de ensembles de données avec des étiquettes diverses. L'utilisation de l'incertitude permet aux modèles de mieux gérer les situations où certaines étiquettes sont complètement manquantes d'un ensemble de données. Cela conduit à une meilleure performance de segmentation, en particulier pour les étiquettes présentes dans moins d'ensembles de données.
En conséquence, notre approche permet de créer un modèle qui fonctionne au même niveau que ceux formés sur des ensembles de données entièrement étiquetés. C'est significatif dans l'imagerie médicale, où les données annotées de haute qualité sont souvent difficiles à obtenir.
Travaux Connus
Il y a un intérêt croissant pour les méthodes qui traitent des ensembles de données partiellement annotées, surtout dans le domaine de la segmentation multi-organes. Certaines approches utilisent les similarités dans l'anatomie humaine, tandis que d'autres exploitent différents encodeurs pour divers ensembles de données. Cependant, beaucoup de ces méthodes n'exploitent pas pleinement les données non annotées, ce qui peut améliorer la qualité prédictive.
Notre méthode s'appuie sur ces approches existantes mais se concentre sur l'apprentissage conjoint à partir de toutes les données disponibles sans jeter l'information potentielle des structures non annotées. En utilisant des techniques bayésiennes pour estimer l'incertitude, nous abordons une des limitations trouvées dans les travaux antérieurs.
Ensembles de Données Utilisés
Dans nos expériences, nous avons utilisé une collection d'ensembles de données disponibles publiquement pour former nos modèles. Ces ensembles varient en termes de nombre d'images, d'étiquettes annotées et de types de structures présentes. Nous avons également intégré quelques ensembles de données internes pour augmenter la diversité de nos données d'entraînement.
Les ensembles incluent des collections bien connues comme la Segmentation de tumeurs du foie et d'autres qui fournissent une large gamme de structures anatomiques. Cette variété aide à simuler des scénarios réels rencontrés dans l'imagerie médicale.
Résultats Expérimentaux
Nous avons évalué notre méthode en la comparant à plusieurs approches de référence. Nos modèles ont été formés sur des ensembles de données partiels et leur performance a été évaluée dans différents scénarios, y compris les cas intra-client et inter-client.
Nos résultats montrent que les modèles formés avec notre méthode proposée ont obtenu des scores DICE plus élevés, une métrique courante pour évaluer la précision de segmentation. En particulier, notre approche a surpassé les méthodes traditionnelles, surtout en ce qui concerne les étiquettes sous-représentées.
De plus, nous avons démontré que l'averaging pondéré par l'incertitude améliore significativement les performances du modèle par rapport à l'averaging régulier. Cela a été particulièrement évident dans les ensembles de données où le surajustement était une préoccupation.
Conclusion
La recherche indique que l'utilisation de l'apprentissage fédéré avec des techniques bayésiennes offre une solution prometteuse aux défis posés par les ensembles de données partiellement étiquetés en imagerie médicale. En tirant parti de l'incertitude prédictive, notre approche améliore la formation des modèles et la performance de segmentation, même face à des annotations incomplètes.
Ce travail ouvre de nouvelles voies pour la collaboration entre institutions, permettant une formation plus robuste et efficace des modèles sans compromettre la confidentialité des patients. Les études futures pourraient explorer des ajustements supplémentaires à notre technique, y compris des applications ciblées de l'incertitude dans des scénarios spécifiques pour améliorer encore la précision des modèles.
Titre: FUNAvg: Federated Uncertainty Weighted Averaging for Datasets with Diverse Labels
Résumé: Federated learning is one popular paradigm to train a joint model in a distributed, privacy-preserving environment. But partial annotations pose an obstacle meaning that categories of labels are heterogeneous over clients. We propose to learn a joint backbone in a federated manner, while each site receives its own multi-label segmentation head. By using Bayesian techniques we observe that the different segmentation heads although only trained on the individual client's labels also learn information about the other labels not present at the respective site. This information is encoded in their predictive uncertainty. To obtain a final prediction we leverage this uncertainty and perform a weighted averaging of the ensemble of distributed segmentation heads, which allows us to segment "locally unknown" structures. With our method, which we refer to as FUNAvg, we are even on-par with the models trained and tested on the same dataset on average. The code is publicly available at https://github.com/Cardio-AI/FUNAvg.
Auteurs: Malte Tölle, Fernando Navarro, Sebastian Eble, Ivo Wolf, Bjoern Menze, Sandy Engelhardt
Dernière mise à jour: 2024-07-10 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2407.07488
Source PDF: https://arxiv.org/pdf/2407.07488
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.