Progressi nell'inpainting dei sinogrammi per le scansioni CT
Un nuovo modello migliora la qualità delle immagini nelle TAC a bassa dose.
Jiaze E, Srutarshi Banerjee, Tekin Bicer, Guannan Wang, Yanfu Zhang, Bin Ren
― 7 leggere min
Indice
- Cos'è un Sinogramma?
- Le Sfide nell'Inpainting del Sinogramma
- Introduzione di un Nuovo Modello
- Performance e Risultati
- Importanza dell'Imaging TC
- Il Processo di Scansione TC
- Confronto con Modelli Precedenti
- Il Nostro Approccio: Convoluzione nel Dominio della Frequenza
- Valutazione delle Prestazioni del Modello
- Risultati del Confronto
- Importanza delle Funzioni di Perdita
- Comprendere i Rapporti di Maschera
- Conclusione e Direzioni Future
- Fonte originale
- Link di riferimento
Ridurre la dose di radiazioni nelle scansioni di tomografia computerizzata (TC) è importante. Una dose più bassa significa meno esposizione alle radiazioni, ma vuol dire anche meno punti dati per creare le immagini. Questo porta a una TC con visione sparsa, che rende difficile produrre immagini chiare. Le proiezioni, che sono i dati della scansione, finiscono per essere incomplete. Per risolvere questo, è necessario un processo chiamato inpainting del Sinogramma. Questo processo aiuta a riempire le parti mancanti dei dati in modo che si possano ricostruire immagini migliori.
Tuttavia, i metodi tradizionali per riempire i vuoti nelle immagini regolari non funzionano bene per i sinogrammi. I sinogrammi hanno caratteristiche uniche che richiedono approcci particolari per un inpainting riuscito. Molti modelli esistenti usano strategie che non considerano le proprietà speciali dei sinogrammi, rendendoli meno efficaci.
Cos'è un Sinogramma?
Un sinogramma è un tipo specifico di disposizione dei dati. Raccoglie tutte le proiezioni effettuate da angolazioni diverse durante una scansione TC. In una scansione regolare, queste proiezioni possono aiutare a creare un'immagine 3D dettagliata. Quando i dati mancano a causa della riduzione della dose di radiazioni o di altri problemi, l'inpainting del sinogramma diventa necessario per avere ricostruzioni accurate.
Le Sfide nell'Inpainting del Sinogramma
I modelli esistenti che funzionano bene su immagini regolari spesso hanno difficoltà con i sinogrammi. Gli approcci standard non considerano gli aspetti unici dei sinogrammi, come le informazioni di frequenza e come le angolazioni diverse si relazionano tra loro. Quando grandi sezioni di dati mancano o quando le proiezioni diventano complesse a causa delle condizioni reali, questi modelli standard non riescono a fornire risultati soddisfacenti.
Introduzione di un Nuovo Modello
Per affrontare queste sfide, proponiamo un nuovo approccio chiamato Modello di Diffusione di Convoluzione in Frequenza (FCDM). Il nostro modello utilizza convoluzioni nel dominio della frequenza per raccogliere informazioni importanti da angolazioni diverse dei dati. Questo aiuta a catturare le relazioni tra le varie angolazioni, che sono cruciali per produrre immagini TC di alta qualità.
Inoltre, abbiamo creato una funzione di perdita personalizzata specifica per i sinogrammi. Questa funzione aiuta il modello a imparare meglio mantenendo costanti le proprietà fisiche, anche quando grandi aree di dati mancano.
Performance e Risultati
Abbiamo testato il nostro metodo FCDM rispetto a nove diversi modelli di inpainting, inclusi due focalizzati sui sinogrammi e sette progettati per immagini regolari. I nostri risultati sono stati molto promettenti. Abbiamo scoperto che FCDM migliora significativamente la qualità dei sinogrammi inpainting, producendo risultati visivi e quantitativi migliori. In termini di metriche specifiche usate per giudicare la qualità dell'immagine, abbiamo raggiunto un punteggio SSIM superiore a 0,95 e un PSNR superiore a 30. Questo rappresenta miglioramenti sostanziali rispetto ai metodi standard.
Importanza dell'Imaging TC
La TC è una tecnica ampiamente utilizzata per creare immagini 3D di oggetti e campioni. È particolarmente utile in vari campi scientifici, consentendo ai ricercatori di esaminare dettagli minuti. Ad esempio, nella ricerca sulle batterie, la TC aiuta a identificare difetti che potrebbero influenzare la durata della batteria. Aiuta anche nello studio del cervello umano, in particolare nella comprensione di malattie come l'Alzheimer. Inoltre, la TC gioca un ruolo chiave nello sviluppo di nuovi materiali e processi produttivi.
Tuttavia, utilizzare alte dosi di radiazioni durante queste scansioni può danneggiare i campioni studiati e influenzare l'interpretazione. Quindi, ridurre le radiazioni pur mantenendo la qualità dell'immagine è una preoccupazione urgente.
Il Processo di Scansione TC
In una scansione TC tipica, un campione è posizionato su un palco rotante ed esposto ai raggi X. Mentre il campione ruota, i raggi X lo penetrano. Alcuni dei raggi vengono assorbiti e i raggi rimanenti vengono rilevati e registrati come proiezioni. Questi dati vengono poi organizzati in sinogrammi per ulteriori ricostruzioni dell'immagine.
Le scansioni a bassa dose sono comunemente utilizzate per ridurre l'esposizione alle radiazioni, ma spesso portano a una qualità dell'immagine inferiore a causa di meno proiezioni e dati incompleti. Qui entrano in gioco le tecniche di inpainting, poiché possono aiutare a migliorare le immagini ricostruite.
Confronto con Modelli Precedenti
Modelli recenti sviluppati per riempire i vuoti nelle immagini regolari hanno avuto successo, ma non hanno funzionato bene con i sinogrammi. I sinogrammi hanno caratteristiche diverse, che li rendono più complessi delle immagini tradizionali. Molti dei nuovi modelli trattano i sinogrammi come immagini regolari, trascurando le loro proprietà uniche e, di conseguenza, portando a un inpainting meno efficace.
Alcuni tentativi di adattare i modelli attuali per i sinogrammi hanno mostrato un certo successo, ma non utilizzano efficacemente le informazioni di frequenza. Altri incorporano solo parzialmente le caratteristiche specifiche dei sinogrammi, il che porta a prestazioni inferiori.
Il Nostro Approccio: Convoluzione nel Dominio della Frequenza
Il Modello di Diffusione di Convoluzione in Frequenza (FCDM) si distingue concentrandosi sul dominio della frequenza. Nel nostro approccio, utilizziamo convoluzioni nel dominio della frequenza per catturare le caratteristiche uniche dei sinogrammi. Questo metodo ci consente di recuperare accuratamente le caratteristiche rilevanti da angolazioni diverse e mantenere le relazioni tra di esse.
Attraverso valutazioni rigorose, abbiamo scoperto che FCDM funziona bene quando testato con dati reali e set di dati simulati. Il design del modello gli consente di gestire meglio i dati mancanti rispetto alle soluzioni precedenti, mostrando grande versatilità.
Valutazione delle Prestazioni del Modello
Per valutare quanto bene si comporta FCDM, abbiamo condotto test su tre diversi set di dati: un set di dati del mondo reale costituito da sinogrammi reali, un set di dati di forme sintetiche e un set di dati simulato Shepp2D. Il set di dati del mondo reale presenta sfide più significative a causa della sua complessità, mentre gli altri set di dati forniscono un ambiente più controllato per testare le capacità di inpainting di base.
Ci siamo concentrati su metriche come l'Indice di Similarità Strutturale (SSIM) e il Rapporto di Picco Segnale-Rumore (PSNR) durante le valutazioni. Queste metriche aiutano a valutare quanto bene le immagini inpainted si confrontano con i dati originali, particolarmente in termini di integrità strutturale e fedeltà complessiva.
Risultati del Confronto
Nelle nostre valutazioni, FCDM ha superato tutte le basi in tutti e tre i set di dati, eccellendo particolarmente nel set di dati del mondo reale, dove ha affrontato condizioni complesse. I set di dati più semplici hanno permesso ai modelli di base di comportarsi decentemente, ma i miglioramenti mostrati dal nostro modello in scenari più complicati erano evidenti.
Importanza delle Funzioni di Perdita
Il successo di FCDM si basa anche fortemente sulle funzioni di perdita progettate specificamente. Queste funzioni di perdita sono essenziali per bilanciare vari aspetti del compito di inpainting. Abbiamo progettato le funzioni di perdita per considerare l'accuratezza dei pixel, la somiglianza percettiva e per imporre coerenza fisica sui dati.
Quando abbiamo testato senza queste funzioni di perdita su misura, la qualità dell'inpainting è diminuita significativamente. Questo ha dimostrato la necessità di funzioni di perdita che affrontino specificamente le sfide uniche dei sinogrammi.
Comprendere i Rapporti di Maschera
Durante i nostri esperimenti, abbiamo notato una tendenza interessante: all'aumentare della percentuale di dati mancanti, anche le prestazioni del modello in termini di SSIM e PSNR tendevano a migliorare. Questo è probabilmente perché, con più dati mancanti, il modello può imparare a concentrarsi di più sulle caratteristiche globali piuttosto che su quelle locali.
Conclusione e Direzioni Future
In conclusione, abbiamo introdotto con successo un nuovo modello per l'inpainting del sinogramma che utilizza convoluzioni nel dominio della frequenza e funzioni di perdita su misura. Questo approccio ha mostrato prestazioni significativamente migliorate su dati reali, segnando un chiaro progresso nel campo.
Ulteriore sviluppo potrebbe potenzialmente estendere il nostro lavoro verso la ricostruzione completa della TC, consentendo la produzione diretta di immagini TC completamente ricostruite dai sinogrammi. Le possibilità di utilizzare questo modello in varie applicazioni scientifiche dove l'imaging TC è cruciale sono vaste e promettenti.
Titolo: FCDM: Sparse-view Sinogram Inpainting with Frequency Domain Convolution Enhanced Diffusion Models
Estratto: Computed tomography (CT) is an imaging technique that uses X-ray projections from multiple rotation angles to create detailed cross-sectional images, widely used in industrial inspection and medical diagnostics. Reducing the projection data in CT scans is often necessary to decrease radiation exposure, scanning time, and computational costs. However, this reduction makes accurate image reconstruction challenging due to the incomplete sinogram. Existing RGB inpainting models struggle with severe feature overlap, while current sinogram-specific models fail to employ efficient feature extraction methods that account for the physical principles underlying the sinogram generation process. To tackle these challenges, we introduce the Frequency Convolution Diffusion Model (FCDM), a novel diffusion-based inpainting framework tailored for sinogram data. FCDM leverages frequency-domain convolutions to capture global and fine-grained structural features, effectively disentangling overlapping components across projection angles. Additionally, we propose a custom loss function that incorporates unique sinogram properties of total absorption consistency and frequency-domain consistency. Extensive experiments on synthetic and real-world datasets demonstrate that FCDM significantly outperforms existing methods, achieving SSIM over 0.95 and PSNR above 30 dB, with improvements of up to 33% in SSIM and 29% in PSNR compared to baselines.
Autori: Jiaze E, Srutarshi Banerjee, Tekin Bicer, Guannan Wang, Yanfu Zhang, Bin Ren
Ultimo aggiornamento: 2024-11-22 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2409.06714
Fonte PDF: https://arxiv.org/pdf/2409.06714
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.