Simple Science

Ciência de ponta explicada de forma simples

# Informática# Bibliotecas digitais

Classificando Trabalhos Acadêmicos Entre Bancos de Dados

Uma olhada em como os bancos de dados categorizam materiais de pesquisa publicados.

― 6 min ler


Insights sobreInsights sobreClassificação deDocumentos em Banco declassificam publicações de pesquisa.Analisando como os bancos de dados
Índice

Este artigo analisa como diferentes bancos de dados classificam tipos de trabalhos publicados. A gente foca em cinco bancos de dados principais: OpenAlex, Scopus, Web of Science, Semantic Scholar e PubMed. Cada um desses bancos tem seu jeitinho de organizar e categorizar documentos, o que pode causar confusão na hora de comparar resultados entre as plataformas.

Importância da Classificação de Documentos

Quando a gente faz pesquisa, é crucial saber como os documentos são categorizados. Bancos de dados diferentes podem considerar trabalhos similares de maneiras diferentes, impactando a análise bibliométrica, que estuda a quantidade e qualidade das pesquisas publicadas. Isso é especialmente importante pra decidir quais documentos incluir nos estudos. Por exemplo, alguns bancos podem classificar editoriais de forma diferente de artigos de pesquisa. Essas diferenças podem distorcer os resultados ao avaliar com que frequência os artigos são citados ou quão influentes eles são em campos específicos.

Visão Geral da Cobertura dos Bancos de Dados

OpenAlex tá se tornando um recurso importante para acadêmicos, já que é uma alternativa de acesso aberto a bancos de dados pagos. Ele oferece uma variedade de materiais, tornando-se uma ferramenta útil pra análise bibliométrica em bibliotecas e universidades. O crescimento da ciência aberta destaca a necessidade de metadados abertos, levando a mais foco na avaliação de bancos de dados abertos em comparação com os tradicionais.

Comparação entre Bancos de Dados Abertos e Proprietários

Na nossa análise, a gente focou principalmente em como o OpenAlex, Semantic Scholar e PubMed se comparam a bancos de dados proprietários como Scopus e Web of Science. Cada banco tem seu jeito de rotular os documentos, o que pode levar a diferenças significativas em quantos documentos estão incluídos nas coleções deles. Por exemplo, alguns artigos podem ser categorizados como "revisões" em um banco e como "artigos" em outro.

Desafios na Classificação

Existem desafios em comparar as classificações de diferentes bancos de dados. Um estudo mostrou que cerca de 17% das publicações no Web of Science tinham classificações de documentos incorretas. Problemas semelhantes foram encontrados ao comparar as classificações das publicações de autores russos no Scopus e no Web of Science. Então, saber como cada banco classifica diferentes Tipos de Documentos é essencial.

Definindo Termos Chave

Pra entender essas classificações, a gente precisa definir alguns termos chave:

  • Tipos de Publicação: Refere-se aos diferentes locais onde os trabalhos são publicados, como revistas, livros ou anais de conferências.
  • Tipos de Documento: Refere-se aos tipos específicos de documentos publicados, como artigos, revisões, editoriais, etc.
  • Tipos de Estudo: Refere-se aos métodos usados na pesquisa, que podem variar bastante entre disciplinas.

Identificar esses tipos ajuda a refletir as características dos documentos de pesquisa. Por exemplo, artigos são a forma mais comum de publicação, enquanto artigos de revisão resumem descobertas anteriores.

Tipos de Documentos na Análise de Banco de Dados

Na nossa análise, categorizar os documentos em três grupos principais:

  1. Discurso de Pesquisa: Inclui artigos e revisões que focam em apresentar descobertas de pesquisa.
  2. Discurso Editorial: Cobre cartas, editoriais e outras coisas que dão opiniões ou discussões sobre pesquisa.
  3. Não Atribuído: Inclui trabalhos que não se encaixam bem nas outras duas categorias.

Especificidades dos Bancos de Dados

Cada banco de dados tem seu próprio método de classificar documentos. Por exemplo, o Web of Science tem um sistema de classificação bem detalhado com 87 categorias de tipos de documentos, enquanto o Scopus tem só 18. OpenAlex e PubMed também categorizam documentos de forma eficaz, mas nem sempre rotulam todos os tipos de documentos de maneira distinta. O Semantic Scholar, por outro lado, tem o menor número de categorias.

Comparando Tipos de Publicação

A classificação dos tipos de publicação mostra como cada banco trata diferentes tipos de trabalhos. Revistas geralmente dominam em todos os bancos, seguidas por anais de conferências e livros. No entanto, muitos itens permanecem sem atribuição a um local específico, especialmente no Semantic Scholar.

Tipos de Documentos e Sua Distribuição

Nossa análise das publicações em revistas entre 2012 e 2022 mostrou que a maioria dos itens no OpenAlex foi classificada como artigos de revistas. O OpenAlex atribuiu essa classificação a mais de 99% dos itens, enquanto o Scopus e o Web of Science classificaram cerca de 80% e 78%, respectivamente.

Materiais Editoriais e de Pesquisa

Materiais editoriais, como cartas e editoriais, foram menos comuns no OpenAlex, representando apenas cerca de 0,3% dos itens. Scopus e Web of Science, por outro lado, atribuíram uma porcentagem maior a esses tipos (cerca de 4% e 7%, respectivamente). A proporção de revisões também foi notada, com o Semantic Scholar mostrando a maior porcentagem de artigos de revisão.

Discurso de Pesquisa vs. Discurso Editorial

Ao analisar a relação entre documentos de pesquisa e editoriais, descobrimos que materiais editoriais eram significativamente menos comuns no OpenAlex em comparação com outros bancos. A maioria dos itens no OpenAlex era focada em pesquisa, enquanto uma porcentagem maior de discurso editorial foi encontrada no Scopus, Web of Science, Semantic Scholar e PubMed.

Características dos Textos de Pesquisa e Editorial

A gente examinou várias características pra diferenciar entre textos de pesquisa e textos editoriais. Artigos de pesquisa geralmente tinham mais autores, citações e referências em comparação com textos editoriais. O artigo de pesquisa médio também tinha resumos e títulos mais longos do que as peças editoriais.

Limitações do Estudo

Tem algumas limitações na nossa análise. Primeiro, o sistema de classificação usado simplifica a distinção entre conteúdo de pesquisa e editorial. Além disso, certos documentos podem aparecer várias vezes em diferentes bancos, levando a uma super-representação de campos específicos, particularmente nas ciências da vida devido ao foco do PubMed.

A Necessidade de Padronização

Este estudo mostra inconsistências em como diferentes bancos de dados classificam tipos de publicação e documentos. A ausência de um sistema padrão em todas essas plataformas complica comparações e interpretações. Os usuários desses bancos devem reconhecer as diferenças na classificação e o possível impacto nos achados da pesquisa.

Direções Futuras

Pra melhorar a qualidade dos metadados, seria bom os autores especificarem os tipos de documentos durante a submissão. Isso poderia aumentar a precisão das classificações entre diferentes bancos de dados. O OpenAlex já está começando a separar artigos de revisão e pré-publicações como tipos distintos, mostrando uma movimentação em direção a uma categorização mais precisa.

No fim das contas, entender como diferentes bancos de dados classificam publicações e documentos é essencial pra quem tá envolvido em pesquisa bibliométrica. Ao reconhecer essas diferenças, os pesquisadores conseguem interpretar melhor suas descobertas e navegar nas complexidades da publicação acadêmica.

Fonte original

Título: Analysis of the Publication and Document Types in OpenAlex, Web of Science, Scopus, Pubmed and Semantic Scholar

Resumo: This study compares and analyses publication and document types in the following bibliographic databases: OpenAlex, Scopus, Web of Science, Semantic Scholar and PubMed. The results demonstrate that typologies can differ considerably between individual database providers. Moreover, the distinction between research and non-research texts, which is required to identify relevant documents for bibliometric analysis, can vary depending on the data source because publications are classified differently in the respective databases. The focus of this study, in addition to the cross-database comparison, is primarily on the coverage and analysis of the publication and document types contained in OpenAlex, as OpenAlex is becoming increasingly important as a free alternative to established proprietary providers for bibliometric analyses at libraries and universities.

Autores: Nick Haupka, Jack H. Culbert, Alexander Schniedermann, Najko Jahn, Philipp Mayr

Última atualização: 2024-06-21 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2406.15154

Fonte PDF: https://arxiv.org/pdf/2406.15154

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes