Avanzare nella Patologia con un Modello Fondamentale Generalizzabile
Un nuovo modello migliora i compiti clinici nella patologia digitale.
― 7 leggere min
Indice
- Contesto
- Cos'è GPFM?
- Caratteristiche chiave di GPFM
- Valutazione delle prestazioni
- Classificazione WSI
- Analisi di sopravvivenza
- Classificazione ROI
- Recupero di immagini
- Risposta a Domande Visive (VQA)
- Generazione di rapporti
- Framework per lo sviluppo
- Preparazione del dataset
- Strategie di pre-addestramento
- Sfide e direzioni future
- Conclusione
- Fonte originale
- Link di riferimento
La patologia è una parte importante della medicina moderna. Aiuta i dottori a capire le malattie per prendere decisioni migliori sui trattamenti. Di recente, la patologia digitale ha cambiato il modo di lavorare dei patologi, rendendo più semplice analizzare e condividere informazioni. Questo ha portato a una nuova area conosciuta come patologia computazionale (CPath), che combina immagini digitali di campioni di tessuto con tecniche informatiche avanzate per supportare le decisioni cliniche.
Quest’articolo parla dello sviluppo di un nuovo modello di fondazione per la patologia generalizzabile (GPFM) per migliorare come vengono eseguite varie attività cliniche in patologia. GPFM rappresenta i più recenti progressi nell'uso di grandi quantità di dati dalla patologia digitale, costruendo su tecnologie esistenti mentre affronta i loro limiti.
Contesto
Man mano che la medicina continua a evolversi, la patologia gioca un ruolo fondamentale nella diagnosi delle malattie. Con il passaggio alla patologia digitale, ora possiamo analizzare immagini di interi campioni (WSI) in modo più efficiente. Queste immagini permettono ai patologi di esaminare i campioni di tessuto in dettaglio. CPath porta tutto questo un passo oltre usando le immagini insieme ai metodi computazionali per migliorare diagnosi, prognosi e decisioni sul trattamento.
Una delle principali sfide in CPath è la grande varietà di compiti che copre. Compiti diversi richiedono conoscenze e dati specializzati, rendendo difficile addestrare modelli che funzionino bene in tutte le aree. Creare modelli separati per ogni compito non è praticabile nella realtà. Pertanto, la comunità CPath sta cercando soluzioni che possano gestire più compiti con un solo modello.
Cos'è GPFM?
GPFM è un nuovo tipo di modello di fondazione progettato specificamente per la patologia. Sfrutta un dataset completo e un metodo di addestramento unico per migliorare le prestazioni in una gamma di attività cliniche. Questo modello si basa sull'idea che combinare i punti di forza dei modelli esistenti possa portare a migliori prestazioni per compiti vari.
Abbiamo raccolto un ampio dataset contenente immagini da 86.104 campioni che rappresentano 34 diversi tipi di tessuti, per un totale di circa 190 milioni di immagini. Addestrando GPFM su questo vasto dataset, miriamo a creare un modello che possa performare bene in compiti diversi in patologia.
Caratteristiche chiave di GPFM
Apprendimento versatile: GPFM è stato progettato per gestire una vasta gamma di compiti. Il suo approccio di addestramento gli consente di adattarsi a vari compiti in CPath, migliorando la sua utilità in diverse applicazioni cliniche.
Approccio basato sui dati: Il modello è costruito su un grande dataset, che offre una ricchezza di informazioni per il training. Questa diversità è fondamentale per raggiungere un alto livello di generalizzazione, assicurando che GPFM possa lavorare efficacemente su vari compiti.
Distillazione della conoscenza unificata: Questo framework innovativo consente a GPFM di apprendere da più modelli esperti. Sfruttando i punti di forza dei modelli esistenti, GPFM può migliorare le sue prestazioni senza richiedere eccessivi nuovi dati.
Valutazione delle prestazioni
Per valutare GPFM, abbiamo testato le sue capacità su un benchmark completo che consiste in 39 compiti specifici che coprono sei grandi categorie di compiti in CPath. Questi compiti includono classificazione WSI, analisi di sopravvivenza, classificazione della regione di interesse (ROI), recupero di immagini, risposta a domande visive (VQA) e generazione di rapporti.
Nei nostri risultati, GPFM ha ottenuto un'impressionante media di ranking di 1.36, superando altri modelli di fondazione leader, come UNI e Phikon. Questo dimostra la sua superiore capacità di generalizzare attraverso diversi compiti clinici.
Classificazione WSI
La classificazione WSI è cruciale nella diagnosi del cancro, poiché aiuta a identificare il sottotipo specifico di cancro. Abbiamo testato le prestazioni di GPFM su 12 compiti di classificazione e abbiamo trovato che ha costantemente raggiunto un'alta precisione. Su questi compiti, GPFM ha ottenuto un punteggio medio di ranking di 1.08, che è significativamente migliore rispetto ad altri modelli.
I risultati indicano che GPFM può analizzare efficacemente gli WSI, migliorando la precisione delle diagnosi di cancro.
Analisi di sopravvivenza
L'analisi di sopravvivenza è utilizzata per prevedere il rischio di progressione della malattia o morte di un paziente. Abbiamo valutato GPFM su 12 compiti di analisi di sopravvivenza. Il suo punteggio medio di ranking era 1.42, rendendolo il migliore in questo campo. Questo mostra quanto bene GPFM possa prevedere gli esiti dei pazienti basati sulle caratteristiche del tessuto.
Classificazione ROI
Per i compiti di classificazione del tessuto a livello di patch, abbiamo valutato GPFM usando una sonda lineare. GPFM ha ottenuto il miglior punteggio di ranking di 1.60 su vari compiti. I risultati confermano ulteriormente la sua capacità di discernere specifici tipi di tessuto e migliorare i processi diagnostici.
Recupero di immagini
In un compito di recupero di immagini di patologia, GPFM ha confrontato nuove immagini di pazienti con un database di casi precedentemente diagnosticati. GPFM ha mostrato prestazioni forti, ottenendo il secondo miglior punteggio di accuratezza top-1 mentre eccelleva nelle misure di accuratezza top-3 e top-5. Questo indica il suo potenziale come strumento per aiutare i patologi a prendere decisioni più informate basate su casi storici simili.
Risposta a Domande Visive (VQA)
Il compito VQA ha coinvolto la valutazione della capacità di GPFM di rispondere a domande sulle immagini di patologia. GPFM si è classificato secondo in generale tra i modelli testati, dimostrando la sua capacità di ragionare in modo efficace sui contenuti visivi. Questa abilità può essere utile per i medici che cercano intuizioni rapide e accurate dalle immagini mediche.
Generazione di rapporti
Generare rapporti di patologia è un compito che richiede tempo, tradizionalmente svolto dai patologi. GPFM mira ad automatizzare questo processo usando caratteristiche estratte dagli WSI per creare rapporti accurati. I nostri risultati hanno mostrato che GPFM ha performato bene, classificandosi come il secondo miglior modello in quest'area. Questa scoperta suggerisce che GPFM può aiutare a semplificare la generazione di rapporti, facilitando la comunicazione tempestiva di informazioni vitali.
Framework per lo sviluppo
Per creare GPFM, abbiamo stabilito un approccio di apprendimento auto-supervisionato che incorpora la distillazione della conoscenza. Questo framework consente a GPFM di trasferire conoscenze da modelli esperti mentre si addestra su una varietà di compiti.
Preparazione del dataset
Il dataset per GPFM comprende 47 dataset di istopatologia disponibili al pubblico, mostrando una varietà di tipi di tessuto. Abbiamo utilizzato questi dati diversificati per pre-addestrare GPFM, dandogli una solida base per affrontare vari compiti.
Strategie di pre-addestramento
GPFM impiega un metodo di distillazione della conoscenza unificata, attingendo ai punti di forza di vari modelli di fondazione esistenti come UNI e Phikon. Questo include tecniche come il Modello di Immagine Mascherata e la auto-distillazione per ottimizzare le sue prestazioni.
Sfide e direzioni future
Sebbene GPFM mostri promesse, ci sono ancora sfide da superare. La validazione attuale di GPFM è limitata a sette compiti esterni. Espandere questa validazione aiuterà a confermare la sua generalizzabilità su uno spettro più ampio di compiti.
Inoltre, anche se GPFM è riuscito a superare i modelli esistenti, c’è ancora potenziale per miglioramenti. La ricerca futura dovrebbe concentrarsi sul perfezionamento delle metodologie di distillazione della conoscenza e sull'espansione dei parametri del modello per aumentare l'adattabilità.
Con l'aumento della dipendenza della patologia da vari tipi di dati, un modello di fondazione multimodale che integri diverse fonti di informazioni, come dati genomici e rapporti, potrebbe ulteriormente migliorare il processo decisionale clinico.
Conclusione
GPFM rappresenta un avanzamento significativo nella patologia computazionale, sfruttando un vasto dataset e metodi di addestramento innovativi per migliorare le prestazioni del modello in una gamma di compiti clinici. I risultati indicano che GPFM è ben posizionato per soddisfare le esigenze diversificate nel campo della patologia, offrendo il potenziale per migliorare la precisione diagnostica e semplificare i flussi di lavoro per i patologi.
Con lo sviluppo e la validazione continua, GPFM potrebbe diventare uno strumento prezioso nella pratica clinica, migliorando alla fine la cura e i risultati per i pazienti nel campo medico.
Titolo: Towards A Generalizable Pathology Foundation Model via Unified Knowledge Distillation
Estratto: Foundation models pretrained on large-scale datasets are revolutionizing the field of computational pathology (CPath). The generalization ability of foundation models is crucial for the success in various downstream clinical tasks. However, current foundation models have only been evaluated on a limited type and number of tasks, leaving their generalization ability and overall performance unclear. To address this gap, we established a most comprehensive benchmark to evaluate the performance of off-the-shelf foundation models across six distinct clinical task types, encompassing a total of 39 specific tasks. Our findings reveal that existing foundation models excel at certain task types but struggle to effectively handle the full breadth of clinical tasks. To improve the generalization of pathology foundation models, we propose a unified knowledge distillation framework consisting of both expert and self knowledge distillation, where the former allows the model to learn from the knowledge of multiple expert models, while the latter leverages self-distillation to enable image representation learning via local-global alignment. Based on this framework, a Generalizable Pathology Foundation Model (GPFM) is pretrained on a large-scale dataset consisting of 190 million images from around 86,000 public H&E whole slides across 34 major tissue types. Evaluated on the established benchmark, GPFM achieves an impressive average rank of 1.36, with 29 tasks ranked 1st, while the the second-best model, UNI, attains an average rank of 2.96, with only 4 tasks ranked 1st. The superior generalization of GPFM demonstrates its exceptional modeling capabilities across a wide range of clinical tasks, positioning it as a new cornerstone for feature representation in CPath.
Autori: Jiabo Ma, Zhengrui Guo, Fengtao Zhou, Yihui Wang, Yingxue Xu, Yu Cai, Zhengjie Zhu, Cheng Jin, Yi Lin, Xinrui Jiang, Anjia Han, Li Liang, Ronald Cheong Kin Chan, Jiguang Wang, Kwang-Ting Cheng, Hao Chen
Ultimo aggiornamento: 2024-08-03 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2407.18449
Fonte PDF: https://arxiv.org/pdf/2407.18449
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.
Link di riferimento
- https://github.com/birkhoffkiki/GPFM/
- https://huggingface.co/MahmoodLab/UNI
- https://huggingface.co/owkin/phikon
- https://huggingface.co/MahmoodLab/CONCH
- https://github.com/mahmoodlab/CLAM
- https://github.com/Xiyue-Wang/TransPath
- https://github.com/PathologyFoundation/plip
- https://github.com/pengfeiliHEU/MUMC
- https://github.com/dddavid4real/HistGen
- https://github.com/Lightning-AI/torchmetrics
- https://scikit-learn.org/stable/
- https://portal.gdc.cancer.gov/
- https://proteomic.datacommons.cancer.gov/pdc/
- https://www.kaggle.com/c/prostate-cancer-grade-assessment/data
- https://www.cancerimagingarchive.net/collection/nadt-prostate/
- https://bcnb.grand-challenge.org/
- https://camelyon16.grand-challenge.org/Data/
- https://camelyon17.grand-challenge.org/Data/
- https://www.bracs.icar.cnr.it/download/
- https://tiger.grand-challenge.org/
- https://midog.deepmicroscopy.org/download-dataset/
- https://aggc22.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/ovarian-bevacizumab-response/
- https://acrobat.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/aml-cytomorphology_lmu/
- https://warwick.ac.uk/fac/cross_fac/tia/data/arch
- https://zenodo.org/records/3632035
- https://drive.google.com/open?id=1brr8CnU6ddzAYT157wkdXjbSzoiIDF9y
- https://ai-econsilio.diag.pl/
- https://github.com/stanfordmlgroup/DLBCL-Morph
- https://gtexportal.org/home/histologyPage
- https://www.cancerimagingarchive.net/collection/hungarian-colorectal-screening/
- https://andrewjanowczyk.com/use-case-1-nuclei-segmentation/
- https://academictorrents.com/details/7a638ed187a6180fd6e464b3666a6ea0499af4af
- https://imig.science/midog2021/download-dataset/
- https://zenodo.org/record/7844149
- https://www.cancerimagingarchive.net/collection/osteosarcoma-tumor-assessment/
- https://paip2019.grand-challenge.org/
- https://paip2020.grand-challenge.org/
- https://paip2021.grand-challenge.org/
- https://www.cancerimagingarchive.net/collection/post-nat-brca/
- https://data.mendeley.com/datasets/9xxm58dvs3/1
- https://www.cancerimagingarchive.net/collection/sln-breast/
- https://breastpathq.grand-challenge.org/
- https://tupac.grand-challenge.org/
- https://www.kaggle.com/competitions/UBC-OCEAN/data
- https://bmirds.github.io/KidneyCancer/
- https://zenodo.org/records/1214456
- https://zenodo.org/records/3832231
- https://zenodo.org/records/7898308
- https://zenodo.org/records/5889558
- https://zenodo.org/records/6604094
- https://zenodo.org/records/7548828
- https://github.com/basveeling/pcam
- https://www.kaggle.com/datasets/ambarish/breakhis
- https://github.com/bupt-ai-cz/HSA-NRL
- https://github.com/UCSD-AI4H/PathVQA