Faire avancer la pathologie avec un modèle fondamental généralisable
Un nouveau modèle améliore les tâches cliniques en pathologie numérique.
― 8 min lire
Table des matières
- Contexte
- C'est quoi GPFM ?
- Caractéristiques clés de GPFM
- Évaluation des performances
- Classification WSI
- Analyse de survie
- Classification ROI
- Recherche d'images
- Réponse à des questions visuelles (VQA)
- Génération de rapports
- Cadre de développement
- Préparation de l'ensemble de données
- Stratégies de préentraînement
- Défis et directions futures
- Conclusion
- Source originale
- Liens de référence
La pathologie est super importante dans la médecine moderne. Ça aide les docs à comprendre les maladies pour prendre de meilleures décisions sur les traitements. Récemment, la pathologie numérique a changé la façon dont les pathologistes bossent, rendant l'analyse et le partage d'infos plus faciles. Ça a donné naissance à un nouveau domaine connu sous le nom de pathologie computationnelle (CPath), qui mélange des images numériques d'échantillons de tissus avec des techniques informatiques avancées pour soutenir les décisions cliniques.
Cet article parle du développement d'un nouveau modèle de fondation en pathologie généralisable (GPFM) pour améliorer la façon dont diverses tâches cliniques en pathologie sont effectuées. GPFM représente les dernières avancées dans l'utilisation de grandes quantités de données provenant de la pathologie numérique, en s'appuyant sur les technologies existantes tout en abordant leurs limites.
Contexte
La médecine continue d'évoluer, et la pathologie joue un rôle crucial dans le diagnostic des maladies. Avec le passage à la pathologie numérique, on peut maintenant analyser les images de diapositives entières (WSIS) de façon plus efficace. Ces images permettent aux pathologistes d'examiner les échantillons de tissus en détail. CPath va encore plus loin en utilisant des images avec des méthodes computationnelles pour améliorer le diagnostic, le pronostic et les décisions de traitement.
Un des principaux défis dans CPath est la grande variété des tâches qu'il couvre. Différentes tâches nécessitent des connaissances et des données spécialisées, rendant difficile la formation de modèles qui fonctionnent bien dans tous les domaines. Créer des modèles séparés pour chaque tâche n'est pas pratique dans le monde réel. Du coup, la communauté CPath cherche des solutions qui peuvent gérer plusieurs tâches avec un seul modèle.
C'est quoi GPFM ?
GPFM est un nouveau type de modèle de fondation conçu spécifiquement pour la pathologie. Il tire parti d'un ensemble de données complet et d'une méthode d'entraînement unique pour améliorer la performance sur une gamme de tâches cliniques. Ce modèle est basé sur l'idée que combiner les forces des modèles existants peut mener à de meilleures performances pour des tâches variées.
On a rassemblé un grand ensemble de données contenant des images de 86 104 diapositives représentant 34 types différents de tissus, totalisant environ 190 millions d'images. En entraînant GPFM sur cet ensemble de données massif, on vise à créer un modèle qui peut bien fonctionner sur diverses tâches en pathologie.
Caractéristiques clés de GPFM
Apprentissage polyvalent : GPFM a été conçu pour gérer une large gamme de tâches. Son approche d'entraînement lui permet de s'adapter à différentes tâches en CPath, améliorant son utilité dans diverses applications cliniques.
Approche basée sur les données : Le modèle est construit sur un grand ensemble de données, offrant une mine d'infos pour l'entraînement. Cette diversité est clé pour obtenir un haut niveau de généralisation, garantissant que GPFM puisse travailler efficacement à travers les tâches.
Distillation de connaissances unifiée : Ce cadre innovant permet à GPFM d'apprendre de plusieurs modèles experts. En tirant parti des forces des modèles existants, GPFM peut améliorer sa performance sans nécessiter de nouvelles données excessives.
Évaluation des performances
Pour évaluer GPFM, on a testé ses capacités sur un ensemble d'évaluation complet comprenant 39 tâches spécifiques couvrant six grandes catégories de tâches en CPath. Ces tâches incluent la classification WSI, l'Analyse de survie, la classification de région d'intérêt (ROI), la recherche d'images, la réponse à des questions visuelles (VQA), et la génération de rapports.
Dans nos résultats, GPFM a obtenu un score de classement moyen impressionnant de 1,36, surpassant d'autres modèles de fondation de pointe, comme UNI et Phikon. Ça montre sa capacité supérieure à généraliser à travers différentes tâches cliniques.
Classification WSI
La classification WSI est cruciale pour diagnostiquer le cancer, car elle aide à identifier le sous-type spécifique de cancer. On a testé les performances de GPFM sur 12 tâches de classification et on a constaté qu'il atteignait toujours une haute précision. Sur ces tâches, GPFM a obtenu un score de classement moyen de 1,08, ce qui est nettement mieux que d'autres modèles.
Les résultats montrent que GPFM peut analyser efficacement les WSIs, améliorant la précision des diagnostics de cancer.
Analyse de survie
L'analyse de survie est utilisée pour prédire le risque d'évolution de la maladie ou de décès d'un patient. On a évalué GPFM sur 12 tâches d'analyse de survie. Son score de classement moyen était de 1,42, ce qui en fait le meilleur dans ce domaine. Ça montre à quel point GPFM peut prédire les résultats des patients en fonction des caractéristiques des tissus.
Classification ROI
Pour les tâches de classification tissulaire au niveau des patches, on a évalué GPFM en utilisant une sonde linéaire. GPFM a obtenu le meilleur score de classement de 1,60 sur diverses tâches. Les résultats confirment encore sa capacité à discerner des types de tissus spécifiques et à améliorer les processus de diagnostic.
Recherche d'images
Dans une tâche de recherche d'images en pathologie, GPFM a comparé de nouvelles images de patients à une base de données de cas déjà diagnostiqués. GPFM a montré une forte performance, atteignant la deuxième meilleure précision top-1 tout en excelling dans les mesures de précision top-3 et top-5. Cela indique son potentiel en tant qu'outil pour aider les pathologistes à prendre des décisions plus éclairées en fonction de cas historiques similaires.
Réponse à des questions visuelles (VQA)
La tâche VQA consistait à évaluer la capacité de GPFM à répondre à des questions sur des images de pathologie. GPFM s'est classé deuxième parmi les modèles testés, démontrant sa capacité à raisonner efficacement sur le contenu visuel. Cette capacité peut être bénéfique pour les cliniciens cherchant des aperçus rapides et précis à partir d'images médicales.
Génération de rapports
Générer des rapports de pathologie est une tâche longue, traditionnellement effectuée par des pathologistes. GPFM vise à automatiser ce processus en utilisant des caractéristiques extraites des WSIs pour créer des rapports précis. Nos résultats ont montré que GPFM a bien performé, se classant comme le deuxième meilleur modèle dans ce domaine. Cette découverte suggère que GPFM peut aider à rationaliser la génération de rapports, facilitant la communication rapide d'informations vitales.
Cadre de développement
Pour créer GPFM, on a établi une approche d'apprentissage auto-supervisée qui incorpore la distillation de connaissances. Ce cadre permet à GPFM de transférer des connaissances à partir de modèles experts tout en s'entraînant sur une large gamme de tâches.
Préparation de l'ensemble de données
L'ensemble de données pour GPFM comprend 47 ensembles de données d'histopathologie disponibles publiquement, montrant une large variété de types de tissus. On a utilisé ces données diverses pour préformer GPFM, lui donnant une base solide pour s'attaquer à diverses tâches.
Stratégies de préentraînement
GPFM utilise une méthode de distillation de connaissances unifiée, s'appuyant sur les forces de divers modèles de fondation existants comme UNI et Phikon. Cela inclut des techniques comme le Modélisation d'Image Masquée et la auto-distillation pour optimiser sa performance.
Défis et directions futures
Bien que GPFM montre du potentiel, il y a encore des défis à surmonter. La validation actuelle de GPFM est limitée à sept tâches externes. Élargir cette validation aidera à confirmer sa généralisabilité à un plus large éventail de tâches.
De plus, même si GPFM a réussi à surpasser les modèles existants, il y a encore du potentiel d'amélioration. La recherche future devrait se concentrer sur le perfectionnement des méthodologies de distillation de connaissances et l'expansion des paramètres du modèle pour améliorer son adaptabilité.
Alors que la pathologie s'appuie de plus en plus sur divers types de données, un modèle de fondation multimodal qui intègre différentes sources d'information, comme les données génomiques et les rapports, pourrait encore améliorer la prise de décision clinique.
Conclusion
GPFM représente une avancée significative en pathologie computationnelle, tirant parti d'un vaste ensemble de données et de méthodes d'entraînement innovantes pour améliorer la performance du modèle sur une gamme de tâches cliniques. Les résultats indiquent que GPFM est bien adapté pour répondre aux divers besoins dans le domaine de la pathologie, offrant le potentiel d'améliorer la précision diagnostique et de rationaliser les flux de travail pour les pathologistes.
Avec un développement et une validation continus, GPFM pourrait devenir un outil précieux dans la pratique clinique, améliorant finalement les soins aux patients et les résultats dans le domaine médical.
Titre: Towards A Generalizable Pathology Foundation Model via Unified Knowledge Distillation
Résumé: Foundation models pretrained on large-scale datasets are revolutionizing the field of computational pathology (CPath). The generalization ability of foundation models is crucial for the success in various downstream clinical tasks. However, current foundation models have only been evaluated on a limited type and number of tasks, leaving their generalization ability and overall performance unclear. To address this gap, we established a most comprehensive benchmark to evaluate the performance of off-the-shelf foundation models across six distinct clinical task types, encompassing a total of 39 specific tasks. Our findings reveal that existing foundation models excel at certain task types but struggle to effectively handle the full breadth of clinical tasks. To improve the generalization of pathology foundation models, we propose a unified knowledge distillation framework consisting of both expert and self knowledge distillation, where the former allows the model to learn from the knowledge of multiple expert models, while the latter leverages self-distillation to enable image representation learning via local-global alignment. Based on this framework, a Generalizable Pathology Foundation Model (GPFM) is pretrained on a large-scale dataset consisting of 190 million images from around 86,000 public H&E whole slides across 34 major tissue types. Evaluated on the established benchmark, GPFM achieves an impressive average rank of 1.36, with 29 tasks ranked 1st, while the the second-best model, UNI, attains an average rank of 2.96, with only 4 tasks ranked 1st. The superior generalization of GPFM demonstrates its exceptional modeling capabilities across a wide range of clinical tasks, positioning it as a new cornerstone for feature representation in CPath.
Auteurs: Jiabo Ma, Zhengrui Guo, Fengtao Zhou, Yihui Wang, Yingxue Xu, Yu Cai, Zhengjie Zhu, Cheng Jin, Yi Lin, Xinrui Jiang, Anjia Han, Li Liang, Ronald Cheong Kin Chan, Jiguang Wang, Kwang-Ting Cheng, Hao Chen
Dernière mise à jour: 2024-08-03 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2407.18449
Source PDF: https://arxiv.org/pdf/2407.18449
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://github.com/birkhoffkiki/GPFM/
- https://huggingface.co/MahmoodLab/UNI
- https://huggingface.co/owkin/phikon
- https://huggingface.co/MahmoodLab/CONCH
- https://github.com/mahmoodlab/CLAM
- https://github.com/Xiyue-Wang/TransPath
- https://github.com/PathologyFoundation/plip
- https://github.com/pengfeiliHEU/MUMC
- https://github.com/dddavid4real/HistGen
- https://github.com/Lightning-AI/torchmetrics
- https://scikit-learn.org/stable/
- https://portal.gdc.cancer.gov/
- https://proteomic.datacommons.cancer.gov/pdc/
- https://www.kaggle.com/c/prostate-cancer-grade-assessment/data
- https://www.cancerimagingarchive.net/collection/nadt-prostate/
- https://bcnb.grand-challenge.org/
- https://camelyon16.grand-challenge.org/Data/
- https://camelyon17.grand-challenge.org/Data/
- https://www.bracs.icar.cnr.it/download/
- https://tiger.grand-challenge.org/
- https://midog.deepmicroscopy.org/download-dataset/
- https://aggc22.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/ovarian-bevacizumab-response/
- https://acrobat.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/aml-cytomorphology_lmu/
- https://warwick.ac.uk/fac/cross_fac/tia/data/arch
- https://zenodo.org/records/3632035
- https://drive.google.com/open?id=1brr8CnU6ddzAYT157wkdXjbSzoiIDF9y
- https://ai-econsilio.diag.pl/
- https://github.com/stanfordmlgroup/DLBCL-Morph
- https://gtexportal.org/home/histologyPage
- https://www.cancerimagingarchive.net/collection/hungarian-colorectal-screening/
- https://andrewjanowczyk.com/use-case-1-nuclei-segmentation/
- https://academictorrents.com/details/7a638ed187a6180fd6e464b3666a6ea0499af4af
- https://imig.science/midog2021/download-dataset/
- https://zenodo.org/record/7844149
- https://www.cancerimagingarchive.net/collection/osteosarcoma-tumor-assessment/
- https://paip2019.grand-challenge.org/
- https://paip2020.grand-challenge.org/
- https://paip2021.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/post-nat-brca/
- https://data.mendeley.com/datasets/9xxm58dvs3/1
- https://www.cancerimagingarchive.net/collection/sln-breast/
- https://breastpathq.grand-challenge.org/
- https://tupac.grand-challenge.org/
- https://www.kaggle.com/competitions/UBC-OCEAN/data
- https://bmirds.github.io/KidneyCancer/
- https://zenodo.org/records/1214456
- https://zenodo.org/records/3832231
- https://zenodo.org/records/7898308
- https://zenodo.org/records/5889558
- https://zenodo.org/records/6604094
- https://zenodo.org/records/7548828
- https://github.com/basveeling/pcam
- https://www.kaggle.com/datasets/ambarish/breakhis
- https://github.com/bupt-ai-cz/HSA-NRL
- https://github.com/UCSD-AI4H/PathVQA