Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli# Apprendimento automatico

Migliorare lo screening per il cancro al seno con la tecnologia

I progressi nella tecnologia puntano ad aumentare i tassi di rilevamento del cancro al seno.

Edward Kendall, Paraham Hajishafiezahramini, Matthew Hamilton, Gregory Doyle, Nancy Wadden, Oscar Meruvia-Pastor

― 8 leggere min


Avanzamenti tecnologiciAvanzamenti tecnologicinella rilevazione delcancro al senoprecoce del tumore al seno.Nuovi metodi migliorano la diagnosi
Indice

Il cancro al seno è una grande preoccupazione, soprattutto man mano che le donne invecchiano. Gli esperti di salute consigliano alle donne sopra i 40 o 50 anni di fare una mammografia ogni paio d'anni. Solo in Canada e USA, si fanno circa 40 milioni di mammografie ogni anno. Di queste, circa due milioni vengono segnalate dai medici come sospette. Tuttavia, solo circa 270.000 di questi casi risultano essere un vero cancro al seno. Questo significa che meno dell'1% degli esami mostra un cancro reale. Stranamente, anche con tutti quei controlli, circa il 20% dei tumori al seno sfugge.

Per cercare di fare meglio, molte strutture stanno provando la doppia lettura (dove due dottori guardano la stessa scansione) e usando l'intelligenza artificiale. Questi sforzi sembrano aiutare un po' con l'accuratezza, ma rendono anche le cose più costose e non risolvono completamente il problema degli allarmi falsi.

Dagli anni '80, quando sono iniziati controlli più regolari, la tecnologia ha fatto grandi passi avanti. Inizialmente, le mammografie venivano ottimizzate usando materiali particolari per i raggi X, e una pellicola speciale rendeva le immagini più chiare. Col tempo, questa tecnologia pellicola è stata sostituita da quella digitale più recente, che ha permesso una migliore conservazione dei dati e ha semplificato tutto il processo. Oggi, le mammografie sono solitamente archiviate in un formato chiamato DICOM, che contiene molti dettagli importanti su come sono state realizzate le immagini.

Le innovazioni nei rivelatori significano che abbiamo telecamere che vedono meglio e catturano anche i più piccoli segni di problemi. Ci sono anche nuovi modi per fare foto del seno che aiutano i dottori a vedere meglio attraverso i tessuti sovrapposti. Con migliaia di terabyte di immagini disponibili, sono stati creati programmi per computer per aiutare a individuare segnali di allerta.

Nei primi tempi, i programmi per computer cercavano macchie luminose nelle mammografie, che di solito significavano aree con calcificazioni che potrebbero suggerire un cancro. Ma non tutti i tumori mostrano questi segni, così i ricercatori hanno iniziato a concentrarsi sulla ricerca di masse, che sono diverse dalle calcificazioni. Queste masse possono essere più difficili da individuare perché spesso non appaiono come blob chiari. Invece, potrebbero avere bordi sfocati che si fondono con il tessuto normale, rendendole difficili da notare, specialmente nelle donne più giovani, il cui tessuto mammario è spesso più denso e fibroso.

Man mano che gli algoritmi informatici diventano più complessi, diventa più difficile migliorare come funzionano nello screening del cancro al seno. In più, nessuno vuole che questi programmi rendano le cose più costose di quanto già non siano. Studi preliminari hanno trovato che questi programmi potrebbero a volte rendere le cose meno efficienti a causa di tutti gli allarmi falsi. Mentre i radiologi esperti non vedono molti benefici dall'uso dell'aiuto informatico, quelli meno esperti sì. È un mix, ma molti sviluppatori continuano a lavorarci, cercando di affinare questi programmi.

Tuttavia, i progressi sono rallentati un po'. I primi software erano spesso più facili da creare perché avevano un focus più ristretto. Man mano che gli sviluppatori cercano di affrontare problemi più difficili, ci sono più possibilità che le cose vadano storte. Inoltre, qualsiasi software usato per la diagnosi deve essere approvato dalle autorità mediche, il che richiede tempo e può rivelare una mancanza di buoni dati di test.

Dataset Esistenti: Una Revisione

Molti tentativi di migliorare questi programmi hanno utilizzato alcuni dataset più vecchi, come il MIAS e il DDSM. Ci sono altri dataset là fuori, ma la maggior parte non è facile da accedere. Il popolare dataset DDSM, per esempio, ha molti più casi anomali rispetto a quelli normali. Questo distorce i dati e può portare a un programma per computer che non funziona bene con pazienti reali.

Inoltre, ci sono vari tipi di immagini in questi dataset. Alcuni usano immagini di pellicola digitalizzate, mentre altri mescolano diversi tipi di immagini digitali. I formati di file sono tutti diversi, e molti di questi dataset non utilizzano nemmeno il formato standard DICOM, il che è frustrante per chi cerca di licenziare software per uso medico.

Quando si tratta di risoluzione, un programma progettato per trovare piccole calcificazioni potrebbe perderle se le immagini non sono abbastanza chiare. Se la risoluzione è troppo alta, potrebbe appesantirsi a causa di file enormi. Abbassare la qualità può aiutare a velocizzare le cose, ma potrebbe fargli perdere alcuni dettagli importanti.

I tipi di immagini e la mancanza di informazioni importanti rendono difficile per i programmatori sviluppare software affidabili. Molti dataset mancano anche di dettagli specifici sull'attrezzatura usata per le mammografie, il che potrebbe aiutare a standardizzare come vengono elaborate le immagini. Il formato DICOM è utile perché contiene queste informazioni nell'intestazione di ciascun file, rendendo tutto più semplice.

Uno dei grandi ostacoli con i programmi per computer che usano deep learning è la necessità di una vasta quantità di dati di immagini per l'addestramento. I dataset per lo screening del cancro al seno spesso non hanno abbastanza casi normali e sospetti. Alcuni dataset comunemente usati includono:

  • DDSM: Contiene oltre 10.000 immagini, ma il numero di casi anomali supera di gran lunga ciò che vedresti in un vero programma di screening.

  • CBIS-DDSM: Una versione più dettagliata del DDSM focalizzata su immagini cancerose.

  • MIAS: Un dataset classico con immagini digitalizzate analizzate per anomalie.

  • InBreast: Un dataset recente con immagini di pazienti, ciascuna annotata con attenzione da specialisti.

  • VinDr: Un dataset dal Vietnam con migliaia di immagini che include anche punteggi per la densità mammaria e altro.

  • CMMD: Un dataset cinese che contiene un mix di casi benigni e maligni.

  • RSNA: Un grande dataset con molte immagini ma meno casi di cancro rispetto agli altri.

  • OPTIMAM: Un significativo dataset del Regno Unito che tiene traccia dei cancri intermedi e dei casi verificati tramite biopsia.

Un dataset interessante è il dataset NL-Breast-Screening (NLBS), che contiene un mix di casi più realistico. L'obiettivo era raccogliere immagini da un programma di screening a Newfoundland con il giusto consenso.

In questo dataset, tutti i pazienti diagnosticati sono stati confermati da ulteriori test. I casi normali sono stati verificati come liberi da cancro per almeno due anni. Hanno raccolto quasi 27.000 immagini rappresentanti circa 6.000 casi. Il loro dataset è una gemma in quanto rispecchia meglio i numeri del mondo reale rispetto a molti altri dataset.

Il Dataset NLBS e le Sue Scoperte

Il dataset NLBS include un mix di casi normali, Falsi Positivi e casi di cancro positivi. L'età media dei pazienti nel gruppo di cancro positivo era leggermente più alta rispetto a quella nel gruppo dei falsi positivi, rivelando che le donne più anziane tendono a essere diagnosticate più frequentemente. Il dataset include anche una varietà di immagini per entrambi i lati del seno e da diversi angoli, il che è necessario per avere un'analisi ben arrotondata.

Anche se hanno una collezione considerevole, c'è preoccupazione che non ci siano abbastanza casi confermati per catturare tutti i tipi di cancro. Prevedono di continuare a raccogliere immagini per risolvere questo problema. Nel frattempo, possono usare immagini di altre fonti per colmare le lacune, tenendo comunque presente che le popolazioni in quei dataset possono differire dalla popolazione canadese.

Il dataset NLBS esclude informazioni sulla densità del tessuto mammario, ma è verificato abbastanza bene da confermare che tutti i casi normali erano liberi da cancro. Le immagini sono in formato DICOM, rendendo più facile per i ricercatori utilizzarle.

Guardando Avanti: Suggerimenti e Miglioramenti

Nel guardare al futuro degli screening per il cancro al seno e della tecnologia, ci sono alcune cose da tenere a mente:

  1. Obiettivi di Sensibilità: Se vogliamo trovare ogni singolo caso positivo, dovremo analizzare più da vicino le immagini normali per individuare eventuali caratteristiche che potrebbero suggerire un cancro.

  2. Uso di Tecnologia Avanzata: Più falsi positivi potrebbero significare un cambiamento nel modo in cui addestriamo i nostri algoritmi per rendere le previsioni più equilibrate.

  3. Confronto dei Metodi di Rilevamento: È importante capire se i falsi positivi dei sistemi AI sono gli stessi di quelli dei radiologi, così possiamo migliorare di conseguenza.

  4. Metriche di Prestazione: Riportare come i sistemi si comportano attraverso varie misure come l'AUC (Area Sotto la Curva) e le matrici di confusione può fornire intuizioni più chiare.

  5. Tecniche di Pre-Processing: Dobbiamo esplorare modi di filtrare i dati irrilevanti per concentrarci su ciò che conta davvero.

  6. Testare Vari Feature: Provare diverse caratteristiche o metodi potrebbe aiutare a identificare ciò che funziona meglio nella rilevazione del cancro al seno.

  7. Considerazioni sulla Radiazione: È fondamentale tenere d'occhio quanta radiazione viene usata in queste procedure.

  8. Affrontare il Contenuto di Grasso: Prevedere il contenuto di grasso nei tessuti mammari potrebbe anche aiutare a ridurre i tassi di errore nelle diagnosi.

  9. Incorporare le Intuizioni dei Radiologi: Inserire i riassunti dei radiologi nei dati di addestramento potrebbe portare a modelli più accurati.

  10. Procedure di Follow-Up: Monitorare i tumori che si manifestano in seguito e riesaminare i casi negativi potrebbe aiutare a migliorare i risultati.

È fondamentale creare un piano solido per i test che affronti specificamente il problema delle perdite di dati che possono distorcere i risultati.

Conclusione

Orientarsi nel panorama dello screening per il cancro al seno e dell'intelligenza artificiale non è affatto semplice. Anche se sono stati fatti progressi nella tecnologia e nella raccolta di dati, ci sono ancora molte sfide da affrontare. Gli sforzi continui per raccogliere dataset di qualità e affinare i metodi diagnostici sono cruciali per migliorare la rilevazione e il trattamento del cancro al seno. Tenendo d'occhio il futuro e adattandosi continuamente a nuove scoperte, l'obiettivo finale rimane: trovare il cancro al seno il prima possibile e salvare più vite. Ricorda, ridere potrebbe non curare il cancro, ma aiuta di certo a rendere più leggera la situazione mentre lavoriamo per sconfiggerlo!

Fonte originale

Titolo: Full Field Digital Mammography Dataset from a Population Screening Program

Estratto: Breast cancer presents the second largest cancer risk in the world to women. Early detection of cancer has been shown to be effective in reducing mortality. Population screening programs schedule regular mammography imaging for participants, promoting early detection. Currently, such screening programs require manual reading. False-positive errors in the reading process unnecessarily leads to costly follow-up and patient anxiety. Automated methods promise to provide more efficient, consistent and effective reading. To facilitate their development, a number of datasets have been created. With the aim of specifically targeting population screening programs, we introduce NL-Breast-Screening, a dataset from a Canadian provincial screening program. The dataset consists of 5997 mammography exams, each of which has four standard views and is biopsy-confirmed. Cases where radiologist reading was a false-positive are identified. NL-Breast is made publicly available as a new resource to promote advances in automation for population screening programs.

Autori: Edward Kendall, Paraham Hajishafiezahramini, Matthew Hamilton, Gregory Doyle, Nancy Wadden, Oscar Meruvia-Pastor

Ultimo aggiornamento: 2024-11-04 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2411.02710

Fonte PDF: https://arxiv.org/pdf/2411.02710

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili