Gli strumenti AI trasformano le revisioni sistematiche nella ricerca sanitaria
Scopri come l'IA impatta le revisioni sistematiche e migliora l'efficienza della ricerca sanitaria.
― 8 leggere min
Indice
- L’Ascesa dell’AI nelle Revisioni Sistematiche
- Come gli Strumenti AI Aiutano con le Revisioni Sistematiche
- L’Obiettivo della Revisione Scoperta
- Definizione delle Linee Guida
- Raccolta delle Evidenze
- Processo di Selezione
- Estrazione dei Dati
- Risultati Chiave sulle Applicazioni di LLM
- Tipi di Strumenti AI Utilizzati
- Conclusioni Generali
- Valutazione delle Sfide
- Futuro degli LLM nelle Revisioni Sistematiche
- Conclusione
- Fonte originale
- Link di riferimento
Le Revisioni sistematiche (SR) sono un modo per raccogliere tutta la ricerca esistente su un determinato argomento. L’obiettivo è raccogliere e analizzare tutti gli studi disponibili per fornire una panoramica chiara su cosa si conosce riguardo a una questione. Pensala come mettere insieme i pezzi di un puzzle, dove l’immagine finale è la comprensione generale di una specifica domanda nella ricerca sanitaria. Le SR sono essenziali per la medicina basata sull’evidenza, assicurando che le decisioni sanitarie siano supportate da dati solidi.
Tuttavia, condurre una revisione sistematica non è affatto semplice. Può richiedere molto tempo e risorse, spesso richiedendo un team di ricercatori per setacciare innumerevoli studi, il che può sembrare un po' come cercare un ago in un pagliaio. Qui entra in gioco l'intelligenza artificiale (AI), promettendo di rendere la vita un po' più facile per questi ricercatori.
L’Ascesa dell’AI nelle Revisioni Sistematiche
Negli ultimi anni, sono emersi vari strumenti di AI per aiutare i ricercatori con le revisioni sistematiche. Questi strumenti usano principalmente il machine learning (ML), una branca dell’AI che aiuta i computer ad apprendere dai dati e prendere decisioni. Il ML tradizionale richiede addestramento su compiti specifici, ma i modelli più recenti, in particolare i modelli linguistici di grandi dimensioni (LLM), hanno cambiato il panorama.
Gli LLM, come GPT e Claude, possono seguire istruzioni in linguaggio naturale quasi come se avessero una mente propria (ok, non proprio una mente, ma hai capito). Questi modelli elaborano grandi quantità di testo per generare risposte, e questa capacità li ha resi molto popolari in settori come la medicina e la ricerca sanitaria. Tuttavia, bisogna andarci cauti, poiché la loro complessità può portare a risultati inaspettati, come disinformazione o risposte inadeguate.
Come gli Strumenti AI Aiutano con le Revisioni Sistematiche
Diversi strumenti di machine learning sono già utilizzati nella ricerca sanitaria per assistere con le revisioni sistematiche. Alcuni strumenti aiutano con lo screening degli studi, mentre altri assistono in vari passaggi del processo di revisione. Ad esempio, ASReview è un esempio di strumento che aiuta nello screening dei lavori di ricerca, e DistillerSR aiuta con vari compiti delle revisioni sistematiche.
Una recente revisione dell’impatto dell’AI sulle revisioni sistematiche ha messo in luce molti strumenti di ML che migliorano l’efficienza. Tuttavia, ha anche notato una mancanza di applicazioni di LLM in quel momento. Da allora, l’uso degli LLM nelle revisioni sistematiche è aumentato notevolmente, aiutando i ricercatori a formulare domande di revisione, selezionare studi e estrarre dati dalla letteratura. Ma, come per ogni nuova tecnologia, questi approcci sono ancora in fase sperimentale e possono fare errori.
L’Obiettivo della Revisione Scoperta
Lo scopo della recente revisione scoperta era di dare un'occhiata più da vicino a come ML e LLM vengono utilizzati per supportare le revisioni sistematiche, individuando le strategie più promettenti per lo sviluppo futuro. I ricercatori hanno seguito linee guida specifiche per garantire che il processo fosse approfondito e affidabile.
Definizione delle Linee Guida
Per esplorare il ruolo dell’AI nelle revisioni sistematiche, i ricercatori hanno stabilito certi criteri di idoneità. Si sono concentrati specificamente sugli articoli che discutevano l'applicazione del machine learning nelle revisioni sistematiche condotte nel campo della ricerca sanitaria. Gli articoli sono stati inclusi se pubblicati da aprile 2021 in poi e sono stati considerati solo articoli scientifici completi in inglese e tedesco.
I ricercatori volevano assicurarsi di catturare tutte le informazioni pertinenti, quindi hanno escluso altri tipi di fonti, come protocolli di studio o letteratura che non forniva dettagli sugli strumenti AI utilizzati. In questo modo, potevano concentrarsi su dati significativi che avrebbero aiutato a comprendere come l’AI stia cambiando il processo di revisione sistematica.
Raccolta delle Evidenze
I ricercatori hanno cercato in modo sistematico in più basi di dati per trovare studi pertinenti, utilizzando una varietà di fonti, tra cui MEDLINE e Google Scholar. Hanno impiegato una strategia di ricerca che mirava a registrazioni note relative alle applicazioni di ML e LLM nelle revisioni sistematiche. Dopo aver esaminato e organizzato i risultati, sono stati in grado di raccogliere un numero sostanziale di studi per ulteriori analisi.
Processo di Selezione
Il processo di selezione ha coinvolto un gruppo di revisori che ha valutato in modo indipendente gli studi per determinarne l'idoneità. Hanno inizialmente esaminato i titoli e gli abstract, poi sono passati ai testi completi per gli articoli rimanenti, discutendo eventuali disaccordi sorti. Questo processo accurato ha garantito che solo gli studi più pertinenti finissero nella selezione finale.
Estrazione dei Dati
Quando si è trattato di analizzare i dati, i ricercatori hanno fatto una distinzione tra LLM e metodi di ML tradizionali per chiarezza. Hanno sviluppato un foglio di calcolo personalizzato per tenere traccia dei dettagli specifici delle applicazioni di LLM, comprese le tipologie di modelli utilizzati, i passaggi nel processo di revisione sistematica che supportavano e le conclusioni generali tratte dagli autori di ciascun studio.
Per gli approcci di ML tradizionali, è stato utilizzato un metodo separato di estrazione dei dati. I ricercatori hanno elencato strumenti noti e categorizzato i metodi di machine learning in base alla loro funzionalità. Tenendo separate queste metodologie, il team ha potuto comprendere meglio come ciascun tipo di AI supportasse le revisioni sistematiche.
Risultati Chiave sulle Applicazioni di LLM
Dall'indagine, i ricercatori hanno trovato un totale di 196 studi rilevanti per la loro analisi. Di questi, una parte significativa si è concentrata su come gli LLM sono stati utilizzati nelle revisioni sistematiche, indicando un crescente interesse e un potenziale promettente in quest'area.
Un risultato interessante è stato che gli LLM sono stati particolarmente utili in vari passaggi delle revisioni sistematiche. I compiti più frequentemente segnalati in cui gli LLM hanno fornito assistenza comprendevano la ricerca sistematica della letteratura, la selezione degli studi (screening) e l'estrazione dei dati. Questi compiti sono cruciali per garantire che una revisione sistematica sia completa e accurata.
Tipi di Strumenti AI Utilizzati
Tra gli studi esaminati, GPT si è dimostrato il LLM più comunemente impiegato. Anche altri modelli, come Claude e LLaMA, sono stati menzionati, ma GPT ha occupato la parte del leone nel panorama della ricerca. I ricercatori hanno notato i diversi tipi di LLM utilizzati in vari passaggi del processo di revisione sistematica, facendo luce su come ciascun modello contribuisse al compito complessivo.
Conclusioni Generali
Gli autori di questi studi erano abbastanza ottimisti riguardo al ruolo degli LLM nelle revisioni sistematiche. Più della metà degli studi ha classificato le applicazioni di LLM come promettenti. Tuttavia, una parte degli autori ha espresso opinioni neutre o negative riguardo alla loro efficacia. Nonostante i risultati promettenti nella selezione degli studi e nell'estrazione dei dati, incertezze riguardo alla riproducibilità e all'affidabilità sono stati temi comuni.
Valutazione delle Sfide
Sebbene gli LLM mostrino potenziale, ci sono sfide notevoli da superare. Ad esempio, la loro capacità di generare contenuti coerenti e pertinenti è impressionante, ma non forniscono sempre riferimenti o verificano i loro output. Questo può portare a risultati inaffidabili, il che è una questione critica nella letteratura scientifica e nella ricerca sanitaria.
Gli osservatori hanno anche notato che le risposte degli LLM possono variare significativamente a seconda dell'input fornito. Una piccola modifica nell'invito potrebbe generare output drasticamente diversi, sollevando preoccupazioni sulla coerenza. Inoltre, molti LLM hanno date di scadenza per i loro dati di addestramento, il che può comportare l'inserimento di informazioni obsolete nei risultati della ricerca.
Futuro degli LLM nelle Revisioni Sistematiche
Quindi, cosa ci aspetta per gli LLM nelle revisioni sistematiche? Anche se c'è entusiasmo per la loro integrazione nel processo di revisione, è opportuno essere cauti. I ricercatori credono che la supervisione umana sarà cruciale per garantire la qualità e l'accuratezza dei risultati. Modificare e verificare gli output generati da questi modelli aiuterà a mantenere alti standard nella ricerca scientifica.
I risultati della revisione scoperta suggeriscono che, sebbene le applicazioni degli LLM nelle revisioni sistematiche siano ancora in fase di sviluppo, hanno un potenziale significativo per rendere il processo di ricerca più efficiente. I ricercatori incoraggiano ulteriori studi per aumentare la trasparenza e migliorare le metodologie utilizzate, assicurando che mentre abbracciamo questi strumenti di AI, lo facciamo responsabilmente.
Conclusione
In conclusione, l’AI, in particolare sotto forma di LLM, sta aprendo una nuova era di supporto per le revisioni sistematiche nella ricerca sanitaria. Con risultati promettenti in diverse fasi del processo di revisione, questi strumenti stanno gradualmente trovando il loro posto nella cassetta degli attrezzi delle revisioni sistematiche. Tuttavia, con grande potere arriva anche grande responsabilità: i ricercatori devono assicurarsi che gli LLM siano usati saggiamente e con cautela per mantenere intatta l’integrità della scienza.
Mano a mano che il campo continua ad evolversi, possiamo aspettarci di vedere ancora più innovazioni e miglioramenti, rendendo le revisioni sistematiche più veloci e più complete. Quindi, anche se i ricercatori potrebbero sentirsi ancora come se stessero cercando quell’ago testardo sepolto in profondità nel pagliaio, almeno ora hanno un paio di fidati amici AI per dar loro una mano.
Titolo: Large language models for conducting systematic reviews: on the rise, but not yet ready for use - a scoping review
Estratto: BackgroundMachine learning (ML) promises versatile help in the creation of systematic reviews (SRs). Recently, further developments in the form of large language models (LLMs) and their application in SR conduct attracted attention. ObjectiveTo provide an overview of ML and specifically LLM applications in SR conduct in health research. Study designWe systematically searched MEDLINE, Web of Science, IEEEXplore, ACM Digital Library, Europe PMC (preprints), Google Scholar, and conducted an additional hand search (last search: 26 February 2024). We included scientific articles in English or German, published from April 2021 onwards, building upon the results of a mapping review with a related research question. Two reviewers independently screened studies for eligibility; after piloting, one reviewer extracted data, checked by another. ResultsOur database search yielded 8054 hits, and we identified 33 articles from our hand search. Of the 196 included reports, 159 described more traditional ML techniques, 37 focused on LLMs. LLM approaches covered 10 of 13 defined SR steps, most frequently literature search (n=15, 41%), study selection (n=14, 38%), and data extraction (n=11, 30%). The mostly recurring LLM was GPT (n=33, 89%). Validation studies were predominant (n=21, 57%). In half of the studies, authors evaluated LLM use as promising (n=20, 54%), one quarter as neutral (n=9, 24%) and one fifth as non-promising (n=8, 22%). ConclusionsAlthough LLMs show promise in supporting SR creation, fully established or validated applications are often lacking. The rapid increase in research on LLMs for evidence synthesis production highlights their growing relevance. HIGHLIGHTSO_LIMachine learning (ML) offers promising support for systematic review (SR) creation. C_LIO_LIGPT was the most commonly used large language model (LLM) to support SR production. C_LIO_LILLM application included 10 of 13 defined SR steps, most often literature search. C_LIO_LIValidation studies predominated, but fully established LLM applications are rare. C_LIO_LILLM research for SR conduct is surging, highlighting the increasing relevance. C_LI
Autori: Dr. Judith-Lisa Lieberum, Markus Töws, Dr. Maria-Inti Metzendorf, Felix Heilmeyer, Dr. Waldemar Siemens, Dr. Christian Haverkamp, Prof. Dr. Daniel Böhringer, Prof. Dr. Joerg J. Meerpohl, Dr. Angelika Eisele-Metzger
Ultimo aggiornamento: 2024-12-24 00:00:00
Lingua: English
URL di origine: https://www.medrxiv.org/content/10.1101/2024.12.19.24319326
Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.12.19.24319326.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia medrxiv per l'utilizzo della sua interoperabilità ad accesso aperto.