Classificando Trabalhos Acadêmicos Entre Bancos de Dados
Uma olhada em como os bancos de dados categorizam materiais de pesquisa publicados.
― 6 min ler
Índice
- Importância da Classificação de Documentos
- Visão Geral da Cobertura dos Bancos de Dados
- Comparação entre Bancos de Dados Abertos e Proprietários
- Desafios na Classificação
- Definindo Termos Chave
- Tipos de Documentos na Análise de Banco de Dados
- Especificidades dos Bancos de Dados
- Comparando Tipos de Publicação
- Tipos de Documentos e Sua Distribuição
- Materiais Editoriais e de Pesquisa
- Discurso de Pesquisa vs. Discurso Editorial
- Características dos Textos de Pesquisa e Editorial
- Limitações do Estudo
- A Necessidade de Padronização
- Direções Futuras
- Fonte original
- Ligações de referência
Este artigo analisa como diferentes bancos de dados classificam tipos de trabalhos publicados. A gente foca em cinco bancos de dados principais: OpenAlex, Scopus, Web of Science, Semantic Scholar e PubMed. Cada um desses bancos tem seu jeitinho de organizar e categorizar documentos, o que pode causar confusão na hora de comparar resultados entre as plataformas.
Importância da Classificação de Documentos
Quando a gente faz pesquisa, é crucial saber como os documentos são categorizados. Bancos de dados diferentes podem considerar trabalhos similares de maneiras diferentes, impactando a análise bibliométrica, que estuda a quantidade e qualidade das pesquisas publicadas. Isso é especialmente importante pra decidir quais documentos incluir nos estudos. Por exemplo, alguns bancos podem classificar editoriais de forma diferente de artigos de pesquisa. Essas diferenças podem distorcer os resultados ao avaliar com que frequência os artigos são citados ou quão influentes eles são em campos específicos.
Visão Geral da Cobertura dos Bancos de Dados
OpenAlex tá se tornando um recurso importante para acadêmicos, já que é uma alternativa de acesso aberto a bancos de dados pagos. Ele oferece uma variedade de materiais, tornando-se uma ferramenta útil pra análise bibliométrica em bibliotecas e universidades. O crescimento da ciência aberta destaca a necessidade de metadados abertos, levando a mais foco na avaliação de bancos de dados abertos em comparação com os tradicionais.
Comparação entre Bancos de Dados Abertos e Proprietários
Na nossa análise, a gente focou principalmente em como o OpenAlex, Semantic Scholar e PubMed se comparam a bancos de dados proprietários como Scopus e Web of Science. Cada banco tem seu jeito de rotular os documentos, o que pode levar a diferenças significativas em quantos documentos estão incluídos nas coleções deles. Por exemplo, alguns artigos podem ser categorizados como "revisões" em um banco e como "artigos" em outro.
Desafios na Classificação
Existem desafios em comparar as classificações de diferentes bancos de dados. Um estudo mostrou que cerca de 17% das publicações no Web of Science tinham classificações de documentos incorretas. Problemas semelhantes foram encontrados ao comparar as classificações das publicações de autores russos no Scopus e no Web of Science. Então, saber como cada banco classifica diferentes Tipos de Documentos é essencial.
Definindo Termos Chave
Pra entender essas classificações, a gente precisa definir alguns termos chave:
- Tipos de Publicação: Refere-se aos diferentes locais onde os trabalhos são publicados, como revistas, livros ou anais de conferências.
- Tipos de Documento: Refere-se aos tipos específicos de documentos publicados, como artigos, revisões, editoriais, etc.
- Tipos de Estudo: Refere-se aos métodos usados na pesquisa, que podem variar bastante entre disciplinas.
Identificar esses tipos ajuda a refletir as características dos documentos de pesquisa. Por exemplo, artigos são a forma mais comum de publicação, enquanto artigos de revisão resumem descobertas anteriores.
Tipos de Documentos na Análise de Banco de Dados
Na nossa análise, categorizar os documentos em três grupos principais:
- Discurso de Pesquisa: Inclui artigos e revisões que focam em apresentar descobertas de pesquisa.
- Discurso Editorial: Cobre cartas, editoriais e outras coisas que dão opiniões ou discussões sobre pesquisa.
- Não Atribuído: Inclui trabalhos que não se encaixam bem nas outras duas categorias.
Especificidades dos Bancos de Dados
Cada banco de dados tem seu próprio método de classificar documentos. Por exemplo, o Web of Science tem um sistema de classificação bem detalhado com 87 categorias de tipos de documentos, enquanto o Scopus tem só 18. OpenAlex e PubMed também categorizam documentos de forma eficaz, mas nem sempre rotulam todos os tipos de documentos de maneira distinta. O Semantic Scholar, por outro lado, tem o menor número de categorias.
Comparando Tipos de Publicação
A classificação dos tipos de publicação mostra como cada banco trata diferentes tipos de trabalhos. Revistas geralmente dominam em todos os bancos, seguidas por anais de conferências e livros. No entanto, muitos itens permanecem sem atribuição a um local específico, especialmente no Semantic Scholar.
Tipos de Documentos e Sua Distribuição
Nossa análise das publicações em revistas entre 2012 e 2022 mostrou que a maioria dos itens no OpenAlex foi classificada como artigos de revistas. O OpenAlex atribuiu essa classificação a mais de 99% dos itens, enquanto o Scopus e o Web of Science classificaram cerca de 80% e 78%, respectivamente.
Materiais Editoriais e de Pesquisa
Materiais editoriais, como cartas e editoriais, foram menos comuns no OpenAlex, representando apenas cerca de 0,3% dos itens. Scopus e Web of Science, por outro lado, atribuíram uma porcentagem maior a esses tipos (cerca de 4% e 7%, respectivamente). A proporção de revisões também foi notada, com o Semantic Scholar mostrando a maior porcentagem de artigos de revisão.
Discurso de Pesquisa vs. Discurso Editorial
Ao analisar a relação entre documentos de pesquisa e editoriais, descobrimos que materiais editoriais eram significativamente menos comuns no OpenAlex em comparação com outros bancos. A maioria dos itens no OpenAlex era focada em pesquisa, enquanto uma porcentagem maior de discurso editorial foi encontrada no Scopus, Web of Science, Semantic Scholar e PubMed.
Características dos Textos de Pesquisa e Editorial
A gente examinou várias características pra diferenciar entre textos de pesquisa e textos editoriais. Artigos de pesquisa geralmente tinham mais autores, citações e referências em comparação com textos editoriais. O artigo de pesquisa médio também tinha resumos e títulos mais longos do que as peças editoriais.
Limitações do Estudo
Tem algumas limitações na nossa análise. Primeiro, o sistema de classificação usado simplifica a distinção entre conteúdo de pesquisa e editorial. Além disso, certos documentos podem aparecer várias vezes em diferentes bancos, levando a uma super-representação de campos específicos, particularmente nas ciências da vida devido ao foco do PubMed.
A Necessidade de Padronização
Este estudo mostra inconsistências em como diferentes bancos de dados classificam tipos de publicação e documentos. A ausência de um sistema padrão em todas essas plataformas complica comparações e interpretações. Os usuários desses bancos devem reconhecer as diferenças na classificação e o possível impacto nos achados da pesquisa.
Direções Futuras
Pra melhorar a qualidade dos metadados, seria bom os autores especificarem os tipos de documentos durante a submissão. Isso poderia aumentar a precisão das classificações entre diferentes bancos de dados. O OpenAlex já está começando a separar artigos de revisão e pré-publicações como tipos distintos, mostrando uma movimentação em direção a uma categorização mais precisa.
No fim das contas, entender como diferentes bancos de dados classificam publicações e documentos é essencial pra quem tá envolvido em pesquisa bibliométrica. Ao reconhecer essas diferenças, os pesquisadores conseguem interpretar melhor suas descobertas e navegar nas complexidades da publicação acadêmica.
Título: Analysis of the Publication and Document Types in OpenAlex, Web of Science, Scopus, Pubmed and Semantic Scholar
Resumo: This study compares and analyses publication and document types in the following bibliographic databases: OpenAlex, Scopus, Web of Science, Semantic Scholar and PubMed. The results demonstrate that typologies can differ considerably between individual database providers. Moreover, the distinction between research and non-research texts, which is required to identify relevant documents for bibliometric analysis, can vary depending on the data source because publications are classified differently in the respective databases. The focus of this study, in addition to the cross-database comparison, is primarily on the coverage and analysis of the publication and document types contained in OpenAlex, as OpenAlex is becoming increasingly important as a free alternative to established proprietary providers for bibliometric analyses at libraries and universities.
Autores: Nick Haupka, Jack H. Culbert, Alexander Schniedermann, Najko Jahn, Philipp Mayr
Última atualização: 2024-06-21 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2406.15154
Fonte PDF: https://arxiv.org/pdf/2406.15154
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://webofscience.help.clarivate.com/en-us/Content/document-types.html
- https://docs.openalex.org/api-entities/works/work-object
- https://groups.google.com/g/openalex-users/c/YujaIIjY02A
- https://web.archive.org/web/20240527182403/
- https://assets.ctfassets.net/o78em1y1w4i4/EX1iy8VxBeQKf8aN2XzOp/c36f79db25484cb38a5972ad9a5472ec/Scopus_ContentCoverage_Guide_WEB.pdf
- https://id.nlm.nih.gov/mesh/D052182
- https://www.bibliometrie.info
- https://github.com/ourresearch/openalex-guts/
- https://hal.science
- https://github.com/naustica/openalex