Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Biblioteche digitali

Classificare i lavori accademici tra i database

Uno sguardo a come i database categoricizzano i materiali di ricerca pubblicati.

― 6 leggere min


Insights sullaInsights sullaClassificazione deiDocumenti nel Databasele pubblicazioni di ricerca.Esaminare come i database classificano
Indice

Questo articolo analizza come diverse banche dati classificano i tipi di opere pubblicate. Ci concentriamo su cinque banche dati principali: OpenAlex, Scopus, Web of Science, Semantic Scholar e PubMed. Ognuna di queste banche dati ha il proprio modo di ordinare e categorizzare i documenti, il che può portare a confusione quando si confrontano i risultati tra le piattaforme.

Importanza della Classificazione dei Documenti

Quando si conduce ricerca, è fondamentale sapere come vengono categorizzati i documenti. Diverse banche dati possono considerare opere simili in modo diverso, influenzando l'analisi bibliometrica, che studia la quantità e la qualità della ricerca pubblicata. Questo è particolarmente importante per determinare quali documenti includere negli studi. Ad esempio, alcune banche dati possono categorizzare gli editoriali in modo diverso rispetto agli articoli di ricerca. Queste differenze possono distorcere i risultati quando si valuta con quale frequenza vengono citati gli articoli o quanto siano influenti in specifici campi.

Panoramica della Copertura delle Banche Dati

OpenAlex sta diventando una risorsa importante per gli studiosi poiché è un'alternativa ad accesso aperto alle banche dati a pagamento. Fornisce un'ampia varietà di materiali, rendendolo uno strumento utile per l'analisi bibliometrica in biblioteche e università. La crescita della scienza aperta enfatizza la necessità di metadati aperti, portando a un maggiore focus sulla valutazione delle banche dati aperte rispetto a quelle tradizionali.

Confronto tra Banche Dati Aperte e Proprietarie

Nella nostra analisi, ci siamo concentrati principalmente su come OpenAlex, Semantic Scholar e PubMed si confrontano con banche dati proprietarie come Scopus e Web of Science. Ciascuna banca dati ha il proprio modo di etichettare i documenti, il che può portare a differenze significative nel numero di documenti inclusi nelle loro raccolte. Ad esempio, alcuni articoli possono essere categorizzati come "review" in una banca dati e come "articoli" in un'altra.

Sfide nella Classificazione

Ci sono sfide nel confrontare le classificazioni delle diverse banche dati. Uno studio ha mostrato che circa il 17% delle pubblicazioni in Web of Science aveva classificazioni dei documenti errate. Problemi simili sono stati trovati confrontando le classificazioni delle pubblicazioni di autori russi in Scopus e Web of Science. Pertanto, sapere come ciascuna banca dati categorizza i diversi Tipi di Documenti è essenziale.

Definire Termini Chiave

Per capire queste classificazioni, dobbiamo definire alcuni termini chiave:

  • Tipi di Pubblicazione: Si riferiscono ai vari luoghi dove le opere sono pubblicate, come riviste, libri o atti di conferenze.
  • Tipi di Documento: Si riferisce ai tipi specifici di documenti pubblicati, come articoli, review, editoriali, ecc.
  • Tipi di Studio: Si riferisce ai metodi usati nella ricerca, e può variare significativamente tra le discipline.

Identificare questi tipi aiuta a riflettere le caratteristiche dei documenti di ricerca. Ad esempio, gli articoli sono la forma di pubblicazione più comune, mentre le review riassumono i risultati di ricerche precedenti.

Tipi di Documenti nell'Analisi delle Banche Dati

Nella nostra analisi, abbiamo categorizzato i documenti in tre gruppi principali:

  1. Discorso di Ricerca: Include articoli e review che si concentrano sulla presentazione dei risultati della ricerca.
  2. Discorso Editoriale: Comprende lettere, editoriali e altri elementi che forniscono opinioni o discussioni sulla ricerca.
  3. Non Assegnato: Include opere che non si adattano bene nelle altre due categorie.

Specifiche delle Banche Dati

Ogni banca dati ha il proprio metodo per classificare i documenti. Ad esempio, Web of Science ha un sistema di classificazione molto dettagliato con 87 categorie per i tipi di documento, mentre Scopus ne ha solo 18. OpenAlex e PubMed categorizzano i documenti in modo efficace, ma potrebbero non etichettare sempre ogni tipo di documento in modo distinto. Semantic Scholar, al contrario, ha il minor numero di categorie.

Confrontare i Tipi di Pubblicazione

La classificazione dei tipi di pubblicazione mostra come ciascuna banca dati tratta diversi tipi di opere. Le riviste dominano tipicamente in tutte le banche dati, seguite dagli atti di conferenze e dai libri. Tuttavia, molti elementi rimangono non assegnati a un luogo specifico, soprattutto in Semantic Scholar.

Tipi di Documento e la Loro Distribuzione

La nostra analisi delle pubblicazioni di riviste tra il 2012 e il 2022 ha mostrato che la maggior parte degli elementi in OpenAlex sono stati classificati come articoli di rivista. OpenAlex ha assegnato oltre il 99% degli elementi a questa classificazione, mentre Scopus e Web of Science hanno classificato rispettivamente circa l'80% e il 78%.

Materiali Editoriali e di Ricerca

I materiali editoriali, come lettere e editoriali, erano meno comuni in OpenAlex, costituendo solo circa lo 0,3% degli elementi. Scopus e Web of Science, tuttavia, hanno assegnato una percentuale più alta a questi tipi (circa il 4% e il 7%, rispettivamente). È stata anche notata la proporzione di review, con Semantic Scholar che mostrava la percentuale più alta di articoli di review.

Discorso di Ricerca vs. Editoriale

Quando abbiamo analizzato la relazione tra documenti di ricerca e documenti editoriali, abbiamo scoperto che i materiali editoriali erano significativamente meno comuni in OpenAlex rispetto ad altre banche dati. La maggior parte degli elementi in OpenAlex era focalizzata sulla ricerca, mentre una percentuale più significativa di discorso editoriale è stata trovata in Scopus, Web of Science, Semantic Scholar e PubMed.

Caratteristiche dei Testi di Ricerca e Editoriali

Abbiamo esaminato varie caratteristiche per differenziare tra testi di ricerca e testi editoriali. Gli articoli di ricerca avevano generalmente più autori, citazioni e riferimenti rispetto ai testi editoriali. L'articolo di ricerca medio aveva anche abstract e titoli più lunghi rispetto ai pezzi editoriali.

Limitazioni dello Studio

Ci sono alcune limitazioni nella nostra analisi. Prima di tutto, il sistema di classificazione utilizzato semplifica la distinzione tra contenuti di ricerca e editoriali. Inoltre, alcuni documenti possono apparire più volte in varie banche dati, portando a una sovra-rappresentazione di specifici campi, in particolare nelle scienze della vita a causa del focus di PubMed.

La Necessità di Standardizzazione

Questo studio mostra incoerenze nel modo in cui diverse banche dati classificano i tipi di pubblicazione e documento. L'assenza di un sistema standard in queste piattaforme complica i confronti e le interpretazioni. Gli utenti di queste banche dati dovrebbero riconoscere le differenze nella classificazione e il potenziale impatto sui risultati della ricerca.

Direzioni Future

Per migliorare la qualità dei metadati, sarebbe utile che gli autori specificassero i tipi di documento durante la sottomissione. Ciò potrebbe migliorare l'accuratezza delle classificazioni tra le diverse banche dati. OpenAlex sta già iniziando a separare gli articoli di review e i preprint come tipi distinti, mostrando una tendenza verso una categorizzazione più precisa.

In conclusione, capire come diverse banche dati classificano le pubblicazioni e i documenti è essenziale per chiunque si impegni nella ricerca bibliometrica. Riconoscendo queste differenze, i ricercatori possono interpretare meglio i loro risultati e navigare nelle complessità della pubblicazione accademica.

Fonte originale

Titolo: Analysis of the Publication and Document Types in OpenAlex, Web of Science, Scopus, Pubmed and Semantic Scholar

Estratto: This study compares and analyses publication and document types in the following bibliographic databases: OpenAlex, Scopus, Web of Science, Semantic Scholar and PubMed. The results demonstrate that typologies can differ considerably between individual database providers. Moreover, the distinction between research and non-research texts, which is required to identify relevant documents for bibliometric analysis, can vary depending on the data source because publications are classified differently in the respective databases. The focus of this study, in addition to the cross-database comparison, is primarily on the coverage and analysis of the publication and document types contained in OpenAlex, as OpenAlex is becoming increasingly important as a free alternative to established proprietary providers for bibliometric analyses at libraries and universities.

Autori: Nick Haupka, Jack H. Culbert, Alexander Schniedermann, Najko Jahn, Philipp Mayr

Ultimo aggiornamento: 2024-06-21 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2406.15154

Fonte PDF: https://arxiv.org/pdf/2406.15154

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili