Generazione di immagini mediche sintetiche con i GAN
Questo studio esplora l'uso dei GAN per creare immagini MRI sintetiche.
― 5 leggere min
Indice
L'analisi delle immagini mediche aiuta i dottori a capire la salute di un paziente senza dover fare procedure invasive. Di recente, l'uso di modelli di machine learning e deep learning è diventato popolare in questo campo perché analizzare le immagini manualmente richiede molto tempo e sforzo da parte dei professionisti sanitari. Per far funzionare bene questi modelli, hanno bisogno di un sacco di dati di addestramento. Tuttavia, nel settore sanitario, ottenere questi dati può essere difficile a causa delle preoccupazioni sulla privacy e del lungo processo di etichettatura delle immagini.
Anche se ci sono alcuni dataset pubblici di immagini mediche disponibili, sono spesso molto più piccoli rispetto ai dataset usati in altri settori. Ad esempio, un dataset ben noto chiamato ImageNet contiene oltre 14 milioni di immagini, mentre un dataset medico specifico, RadImageNet, ha solo 5 milioni di immagini. Questa differenza evidenzia la necessità di nuovi metodi per raccogliere più dati di addestramento.
Reti Generative Avversarie (GAN)
Un approccio promettente per generare più immagini mediche è l'uso delle Reti Generative Avversarie (GAN). Questi modelli possono creare immagini realistiche, rendendoli preziosi per compiti come la segmentazione e la classificazione delle immagini. I lavori preliminari in quest'area hanno mostrato risultati incoraggianti, soprattutto per le Immagini di risonanza magnetica del cervello. Tuttavia, una sfida con le GAN è che possono richiedere molta potenza di calcolo, portando a tempi di elaborazione più lunghi. Questo è dovuto al modo in cui le GAN apprendono, coinvolgendo due modelli: il Generatore, che crea nuove immagini, e il Discriminatore, che distingue tra immagini reali e false.
Una scoperta importante da lavori precedenti ha suggerito che l'uso di ambienti di calcolo potenti può aiutare ad accelerare l'addestramento e migliorare la stabilità.
Valutazione delle GAN
Un altro punto chiave è che non esiste un modo perfetto per misurare quanto bene funzionano queste GAN. Anche se sono state proposte alcune metriche, tra cui la Fréchet Inception Distance (FID), queste misurazioni potrebbero non catturare completamente la qualità delle immagini generate. Il punteggio FID confronta le immagini reali con quelle sintetiche ma non considera quanto siano varie quelle immagini. In alcuni casi, immagini ad alta risoluzione potrebbero avere un punteggio FID inferiore, anche se mancano di diversità.
A causa di queste sfide, abbiamo reimplementato un precedente modello GAN chiamato Deep Convolutional GAN (DCGAN) e abbiamo anche usato una versione migliorata chiamata WGAN-GP. Il nostro obiettivo era generare immagini di risonanza magnetica del cervello in un’installazione di calcolo distribuito più grande. Abbiamo costruito entrambi i modelli utilizzando TensorFlow e abbiamo utilizzato risorse di calcolo professionali per gestire efficacemente il carico di lavoro.
Dati e Implementazione
Abbiamo condotto una valutazione approfondita dei nostri modelli utilizzando due dataset noti come BraTS 2020 e 2021. Il nostro approccio differiva dai lavori precedenti generando immagini 256×256 e raggiungendo un punteggio FID notevole, indicando che le nostre immagini sintetiche erano vicine a quelle reali.
I DCGAN sono frequentemente usati nell'analisi delle immagini mediche perché possono creare immagini di alta qualità. Usano un tipo specifico di strato chiamato convoluzioni con passo frazionale, che aiuta a generare immagini realistiche. Nel nostro lavoro precedente, abbiamo impiegato un framework diverso ma ora abbiamo allineato la nostra architettura per utilizzare TensorFlow, aggiustando alcune funzioni di attivazione per migliorare le performance.
D'altra parte, i WGAN offrono un modo alternativo di addestrare le GAN usando il clipping dei pesi e l'addestramento asincrono, il che può migliorare la qualità delle immagini e accelerare i tempi di addestramento. I nostri risultati hanno mostrato che entrambi i modelli potevano generare efficacemente immagini di risonanza magnetica, anche se il WGAN-GP ha incontrato alcuni problemi nella gestione di dataset più grandi.
Risultati e Discussione
Nei nostri esperimenti, ogni epoca di addestramento ha prodotto un'immagine di risonanza magnetica del cervello 256×256. Abbiamo valutato le immagini usando la metrica FID, applicando due set di dati di addestramento diversi. I nostri risultati hanno mostrato che i punteggi FID del DCGAN erano generalmente migliori di quelli del WGAN-GP. Questa differenza è probabilmente dovuta alle caratteristiche dei dataset usati per l'addestramento.
Quando abbiamo confrontato i nostri risultati con quelli precedenti, abbiamo osservato che set di immagini più grandi tendono a produrre punteggi FID migliori, il che significa che più immagini portano a immagini sintetiche di qualità più alta. I nostri modelli hanno eguagliato o superato le performance di altri, indicando che gli ambienti di calcolo distribuito potrebbero generare con successo dati di addestramento per varie applicazioni nell'imaging medico.
Le immagini generate dai nostri modelli mostravano meno dettagli rispetto ai campioni originali. Dato che due dei set utilizzati erano focalizzati su un tipo specifico di contrasto MRI, ulteriori esperimenti con diversi tipi di immagini sono necessari per valutare quanto bene i nostri modelli possano adattarsi.
Conclusioni e Lavoro Futuro
La generazione di immagini mediche sintetiche sta diventando uno strumento efficace per affrontare la sfida dei dati limitati. L'uso delle GAN è emerso come un metodo principale per creare immagini di alta qualità per scopi di addestramento. Poiché l'addestramento di questi modelli richiede risorse di calcolo sostanziali, distribuire il carico di lavoro è essenziale per applicazioni pratiche.
In questo studio, abbiamo reimplementato con successo le GAN in un contesto distribuito per generare immagini di risonanza magnetica del cervello. Tuttavia, misurare la qualità di queste immagini sintetiche rimane complesso, poiché varie metriche valutano diversi aspetti dei risultati. La nostra valutazione usando i punteggi FID ha indicato che le immagini generate erano comparabili a quelle riportate in altri studi.
È evidente che l'uso di dataset più grandi può migliorare le performance del modello, poiché i nostri test hanno mostrato punteggi FID migliorati con set di immagini più grandi. Nonostante le sfide associate all'uso della metrica FID per l'imaging medico, abbiamo trovato forti evidenze a supporto del suo utilizzo con i pesi di RadImageNet per misurare la qualità dell'immagine.
La ricerca futura si concentrerà sull'estensione dei nostri test a configurazioni distribuite più grandi e sulla conduzione di ulteriori esperimenti per ottimizzare i modelli. Raffinando gli iperparametri, miriamo a migliorare ulteriormente la qualità delle immagini sintetiche e approfondire la comprensione delle sfide affrontate dal WGAN-GP durante l'addestramento.
Titolo: To FID or not to FID: Applying GANs for MRI Image Generation in HPC
Estratto: With the rapid growth of Deep Learning models and neural networks, the medical data available for training - which is already significantly less than other types of data - is becoming scarce. For that purpose, Generative Adversarial Networks (GANs) have received increased attention due to their ability to synthesize new realistic images. Our preliminary work shows promising results for brain MRI images; however, there is a need to distribute the workload, which can be supported by High-Performance Computing (HPC) environments. In this paper, we generate 256x256 MRI images of the brain in a distributed setting. We obtained an FIDRadImageNet of 10.67 for the DCGAN and 23.54 for the WGAN-GP, which are consistent with results reported in several works published in this scope. This allows us to conclude that distributing the GAN generation process is a viable option to overcome the computational constraints imposed by these models and, therefore, facilitate the generation of new data for training purposes.
Autori: Beatriz Cepa, Cláudia Brito, António Sousa
Ultimo aggiornamento: 2024-09-29 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.09.27.615343
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.09.27.615343.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.