La sfida di vivere le revisioni sistematiche
Uno sguardo alla necessità di database aggiornati per le sperimentazioni cliniche.
Kim Boesen, Lars G Hemkens, Perrine Janiaud, Julian Hirt
― 8 leggere min
Indice
- Entrano in gioco le Revisioni Sistematiche Viventi
- La Necessità di una Migliore Gestione dei Dati
- Come Abbiamo Proceduto
- Criteri di Inclusione
- Trovare le Informazioni Giuste
- Cosa Abbiamo Scoperto
- I Risultati
- Il Quadro Generale
- Perché i Registri Attuali Non Sono Suffici
- Una Possibile Soluzione
- Limitazioni della Nostra Revisione
- Cosa Ci Aspetta
- Fonte originale
Negli ultimi decenni, il numero di studi clinici e recensioni è schizzato alle stelle. Questo significa che per medici e ricercatori che cercano di tenere il passo, è diventato un lavoro a tempo pieno solo per restare informati. Immagina di cercare di bere da un tubo antincendio - le informazioni arrivano troppo velocemente per riuscire a prenderle tutte. Le recensioni regolari possono richiedere un'eternità per essere completate, spesso richiedendo molto tempo per cercare tra i database, passare i titoli degli studi, valutare gli studi stessi e poi estrarre i dati rilevanti. Quando queste recensioni vengono pubblicate, potrebbero essere già superate e si potrebbe dire persino fuorvianti.
Per affrontare questo diluvio di dati, sono emersi nuovi strumenti per semplificare il processo di revisione. Questi strumenti utilizzano tecnologie avanzate, come il text mining e il machine learning, per trovare e raccogliere informazioni dagli studi. Se solo potessero anche fare il caffè!
Entrano in gioco le Revisioni Sistematiche Viventi
Un'idea innovativa che ha guadagnato popolarità è la “revisione sistematica vivente.” Non va confusa con un testamento vivente, questo tipo di revisione dovrebbe essere continuamente aggiornata. L'obiettivo qui è evitare i soliti ritardi e assicurarsi che nuove scoperte importanti non scivolino via. Tuttavia, c'è ancora qualche dibattito su cosa qualifichi esattamente una “revisione vivente.” In teoria, sembra fantastico - ma nella pratica, le cose sono un po' nebulose.
Uno dei primi tentativi di una revisione vivente è stato lanciato dalla Cochrane Collaboration nel 2017. Purtroppo, da allora, non è stata aggiornata affatto, lasciando le persone a chiedersi cosa significhi davvero “vivente” in questo contesto. Poi è arrivata la pandemia di COVID-19, che ha scatenato un'intera ondata di progetti volti a tenere il passo con il rapido afflusso di informazioni. È come se tutti avessero deciso all'improvviso di fare una festa, ma avessero dimenticato di invitare gli aggiornamenti!
La Necessità di una Migliore Gestione dei Dati
Affinché le revisioni viventi funzionino, dobbiamo assicurarci che tutti i dati degli studi clinici siano disponibili in un formato che le macchine possano leggere facilmente. Questo significa trovare un modo per strutturarli in un modo coerente. Il sogno di un sistema che raccolga tutti i dati degli Studi Controllati Randomizzati (RCT) esiste da oltre 25 anni, ma finora rimane un sogno rimandato.
Una delle prime idee per un tale sistema è stata la Global Trial Bank, che era destinata non solo a registrare gli studi ma anche a riportare i risultati in un modo che un computer potesse digerire. Purtroppo, non è mai decollata. Tuttavia, nel 2004, il Comitato Internazionale per i Redattori di Giornali Medici ha deciso che tutti gli studi clinici dovevano essere registrati prima della pubblicazione. Questa spinta è continuata nel 2007, quando è diventato un requisito inviare risultati riassuntivi su ClinicalTrials.gov e successivamente sul Registro degli Studi Clinici dell'Unione Europea nel 2012.
Alcuni ricercatori sostengono che i dati degli studi clinici dovrebbero davvero essere in un formato standard, come il formato del Documento Tecnico Comune usato per le domande di farmaci. Altri credono che le revisioni, come quelle sistematiche, dovrebbero fare affidamento principalmente sui registri degli studi clinici invece che sul metodo tradizionale di estrazione dei dati da pubblicazioni sparse. L'idea è di rendere il processo più veloce e completo.
Ma anche con tutti questi miglioramenti, è ancora poco chiaro se i progetti viventi attuali siano in grado di utilizzare tecnologie avanzate per garantire che i dati degli studi clinici fluiscano in database organizzati senza intoppi. Ecco perché abbiamo deciso di dare un'occhiata più da vicino a ciò che c'è attualmente là fuori - per capire cosa possono fare questi database e come possono essere migliorati.
Come Abbiamo Proceduto
Per cominciare, abbiamo condotto una revisione preliminare. Poiché ci aspettavamo di incontrare molti ostacoli lungo la strada, non abbiamo seguito un piano definito o registrato la nostra revisione. Invece, abbiamo riportato i nostri risultati basandoci su linee guida consolidate per le revisioni sistematiche.
Criteri di Inclusione
Ci siamo concentrati su database che sono continuamente aggiornati e accessibili pubblicamente, estraendo dati da studi controllati randomizzati, indipendentemente da come hanno recuperato le informazioni. Eravamo interessati a database che si concentrassero su campi specifici, come il COVID-19, piuttosto che su database generali e ampi. Lingua, data di rilascio e uso previsto non erano fattori nella nostra valutazione.
Tuttavia, non abbiamo incluso revisioni sistematiche viventi tradizionali che non hanno un database idoneo associato.
Trovare le Informazioni Giuste
La nostra strategia di ricerca aveva due passaggi principali. Il primo è stato una “ricerca a freddo” in cui abbiamo setacciato varie risorse per individuare parole chiave e riferimenti. Questo ci ha aiutato a costruire una ricerca più sistematica in seguito.
Nel secondo passaggio, abbiamo progettato una strategia di ricerca che includeva parole chiave per “vivente,” “biblioteca,” e termini di design dello studio come “RCT” e “studio clinico.” Abbiamo cercato in PubMed e Embase, setacciato i risultati e usato uno strumento di screening per esaminare tutto ciò che abbiamo trovato.
Cosa Abbiamo Scoperto
Abbiamo esaminato da vicino sette caratteristiche di questi database:
-
Modello di Accesso: Come possono gli utenti accedere al database? È aperto a tutti, serve un permesso speciale o è un misto di entrambi?
-
Architettura del Database: Su cosa è basato il database? È un semplice foglio di calcolo o qualcosa di più complesso?
-
Fonti di Input: Da dove provengono i dati? Si parla di studi pubblicati, registri di studi o entrambi?
-
Metodi di Recupero: Come vengono aggiunti gli studi al database? È fatto manualmente, tramite automazione o tramite contributi della comunità?
-
Estrazione dei Dati: Come vengono estratte le informazioni dagli studi? È manuale, totalmente automatizzato o un mix di entrambi?
-
Presentazione degli Studi: Che tipo di informazioni forniscono i database sugli studi? Questo potrebbe variare da metadati di base a risultati dettagliati e valutazioni del rischio.
-
Opzioni di Esportazione: Come possono gli utenti scaricare o riutilizzare i dati? Sono prontamente disponibili, possono solo visualizzarli online o non sono disponibili affatto?
I Risultati
Dopo le nostre ricerche, abbiamo trovato 14 database che erano continuamente aggiornati; sette di essi erano relativi al COVID-19. I database COVID utilizzavano principalmente metodi semi-automatici per trovare ed estrarre dati, mentre la maggior parte dei database non COVID si basava su metodi tradizionali e manuali.
La maggior parte dei database forniva metadati di base, ma solo pochi fornivano informazioni dettagliate sugli studi o valutazioni della qualità degli studi. Interessante, solo un database ha menzionato che poteva condividere dati sui singoli partecipanti.
Il Quadro Generale
La nostra revisione mette in evidenza il fatto che non ci sono molti database continuamente aggiornati focalizzati su argomenti specifici. La maggior parte delle opzioni esistenti utilizza ancora metodi e tecnologie prese in prestito da revisioni sistematiche più vecchie, che possono essere lente e ingombranti.
La principale preoccupazione è che l'estrazione di dati utili da studi clinici pubblicati rimane una sfida significativa poiché molte informazioni si trovano in pubblicazioni non strutturate. E sfortunatamente, nessuna delle piattaforme che abbiamo esaminato è riuscita a risolvere completamente questo problema. C'è un urgente bisogno di dataset strutturati che siano facili da accedere e utilizzare.
Perché i Registri Attuali Non Sono Suffici
Ci sono diverse ragioni che rendono difficile utilizzare i registri degli studi clinici per creare database specifici per argomento:
-
Mancanza di Standardizzazione: I diversi registri di studi hanno formati e strutture di dati variabili. Questo rende difficile mettere insieme le informazioni in modo coerente.
-
Tassi di Errore: Dalla nostra esperienza, sospettiamo che ci siano molti errori quando i dati vengono inseriti nei registri. Questo può portare a molta “pulizia dei dati” prima che le informazioni siano utilizzabili.
-
Limitazioni di Esportazione: Non tutti i registri consentono un facile esportazione dei dati, il che può portare a frustrazioni quando i ricercatori cercano di raccogliere informazioni.
Una Possibile Soluzione
Uno strumento chiamato TrialStreamer potrebbe avere del potenziale. Anche se non è specificamente mirato, raccoglie un gran numero di studi clinici e annota informazioni cruciali su di essi. Questo potrebbe essere utile per studi di alto livello, ma per applicazioni cliniche più dettagliate, abbiamo ancora bisogno di descrizioni degli studi più raffinate.
Il Wellcome Trust ha recentemente offerto un barlume di speranza, impegnandosi a investire fondi per sviluppare migliori infrastrutture per progetti di evidenza vivente. Sembra che potrebbero essere sulla strada giusta!
Limitazioni della Nostra Revisione
La nostra revisione preliminare ha le sue limitazioni. Poiché non abbiamo impostato una metodologia specifica all'inizio, potremmo aver perso alcune fonti di dati preziose. Abbiamo anche riconosciuto che ci sono probabilmente molte soluzioni commerciali “nascoste” là fuori, a cui non abbiamo avuto accesso.
Una soluzione commerciale pubblica si chiama LiveSLR, che combina una biblioteca annotata con un flusso di lavoro per trovare e classificare studi. Tuttavia, i dettagli su tali piattaforme commerciali sono spesso difficili da ottenere.
Cosa Ci Aspetta
In conclusione, questa revisione mette in luce l'urgente necessità di database continuamente aggiornati negli studi clinici. I sistemi esistenti spesso si basano su metodi tradizionali e manuali che non sono attrezzati per tenere il passo con la rapida produzione di nuovi studi e revisioni.
Mentre affrontiamo la sfida di estrarre dati da pubblicazioni di riviste, potrebbe essere il momento di ripensare idee più vecchie come la Global Trial Bank. Se potessimo passare da semplici pubblicazioni di articoli a un sistema completamente digitale e leggibile dalle macchine per i dati degli studi clinici, potremmo essere in grado di tenere il passo con il mondo in evoluzione della sintesi delle prove.
Dopotutto, chi non vorrebbe smettere di inseguire aggiornamenti e prendere invece una tazza di caffè?
Titolo: Publicly available continuously updated topic specific databases of randomised clinical trials: A scoping review
Estratto: Conducting systematic reviews of clinical trials is arduous and resource consuming. One potential solution is to design databases that are continuously and automatically populated with clinical trial data from harmonised and structured datasets. We aimed to map publicly available, continuously updated, topic-specific databases of randomised clinical trials (RCTs). We systematically searched PubMed, Embase, the preprint servers medRxiv, ArXiv, and Open Science Framework, and Google. We described seven features (access model, database architecture, data input sources, retrieval methods, data extraction methods, trial presentation, and export options) and narratively summarised the results. We did not register a protocol for this review. We identified 14 continuously updated clinical trial databases, seven related to COVID-19 (first active in 2020) and seven non-COVID databases (first active in 2009). All databases, except one, were publicly funded and accessible without restrictions. They mainly employed methods similar to those from static article-based systematic reviews and retrieved data from journal publications and trial registries. The COVID-19 databases and some non-COVID databases implemented semi-automated features of data import, which combined automated and manual data curation, whereas the non-COVID databases mainly relied on manual workflows. Most reported information was metadata, such as author names, years of publication, and link to publication or trial registry. Two databases included trial appraisal information (risk of bias assessments). Six databases reported aggregate group level results, but only one database provided individual participant data on request. We identified few continuously updated trial databases, and existing initiatives mainly employ methods known from static article -based reviews. The main limitation to create truly live evidence synthesis is the access and import of machine-readable and harmonised clinical trial data.
Autori: Kim Boesen, Lars G Hemkens, Perrine Janiaud, Julian Hirt
Ultimo aggiornamento: 2024-11-18 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.11.18.24317477
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.11.18.24317477.full.pdf
Licenza: https://creativecommons.org/licenses/by-nc/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.