Simple Science

Ciência de ponta explicada de forma simples

# Estatística# Bibliotecas digitais# Aplicações

Analisando Padrões de Citação na Pesquisa

Um olhar sobre como modelos de citação podem melhorar a compreensão do impacto da pesquisa.

― 6 min ler


Técnicas de Análise deTécnicas de Análise deCitaçãosobre citações de pesquisa.Novos modelos melhoram a compreensão
Índice

Na pesquisa científica, a frequência com que os artigos são citados pode mostrar quais são os mais influentes. Quando olhamos para as citações, percebemos que poucos artigos recebem a maior parte da atenção, enquanto muitos outros quase não são notados. Esse padrão é comum em várias áreas, como economia, ecologia e até linguística. Pra entender essa distribuição de citações, os pesquisadores desenvolveram diferentes métodos pra visualizar e analisar isso.

Um desses métodos é conhecido como curva de Leimkuhler. Essa curva ajuda a traçar a relação entre o número total de citações e o número de artigos. No entanto, parece que essa curva pode ser simples demais pra capturar as complexidades dos dados do mundo real. Por isso, tem uma necessidade de um modelo melhor que consiga levar em conta essas complexidades.

O que é uma Curva de Leimkuhler?

Uma curva de Leimkuhler é um tipo de gráfico que mostra como o número total de citações está distribuído entre os artigos. Quando arranjamos os artigos com base em quantas vezes eles foram citados-do mais pro menos-e depois plotamos isso contra a porcentagem cumulativa dos artigos, obtemos uma representação visual da distribuição de citações.

A curva ajuda os pesquisadores a entender quantas citações estão concentradas em alguns poucos artigos, indicando quais artigos são os mais influentes dentro de um campo específico. Entretanto, ela tem suas limitações, especialmente ao lidar com conjuntos de dados variados que mostram padrões diferentes de citações.

A Necessidade de um Modelo Melhor

As curvas padrão de Leimkuhler podem não funcionar bem pra todos os dados porque os padrões reais de citação podem ser complexos. Quando os pesquisadores querem analisar dados de citação de várias áreas, frequentemente percebem que um único modelo não serve pra todos. Essa variabilidade pode levar a resultados enganosos se o modelo for muito rígido.

Pra resolver essas limitações, os pesquisadores sugeriram usar uma mistura de diferentes distribuições pra modelar os dados de citação de forma mais precisa. Ao ajustar curvas que levam em conta vários fatores, como as diferenças no comportamento de citação entre os artigos, podemos ter uma ideia mais clara de como as citações estão distribuídas.

Modelos de Mistura na Análise de Citações

Modelos de mistura combinam diferentes distribuições estatísticas em um só modelo. Isso permite que os pesquisadores considerem melhor a natureza heterogênea dos dados de citação. Usando um modelo de mistura, conseguimos captar as variações de como diferentes artigos recebem citações.

Por exemplo, em alguns campos, pode ter artigos que são citados bastante por causa da relevância com a pesquisa atual, enquanto outros podem ter artigos que são fundamentais mas não são frequentemente citados. Criando um modelo que possa levar em conta tais diferenças, podemos melhorar nossa compreensão dos padrões de citação.

Dados Empíricos e Modelos

Os pesquisadores frequentemente testam seus modelos usando dados reais de citação. Dois campos comuns de estudo que foram analisados incluem Pesquisa Operacional e Estatística. Ao coletar dados de citação dessas áreas, os pesquisadores podem aplicar seus novos modelos pra ver se eles oferecem melhores insights do que os métodos padrão.

Quando analisam esses campos, os pesquisadores olham pra contagem de citações ao longo de períodos específicos. Eles reúnem dados sobre quantos artigos foram citados e o total de citações que cada artigo recebeu. Esses dados podem revelar tendências, como quais artigos são consistentemente influentes ao longo do tempo.

Entendendo a Desigualdade nas Citações

Um aspecto importante de analisar os dados de citação é entender a desigualdade. Assim como a distribuição de renda, a distribuição de citações também pode mostrar como os recursos (neste caso, atenção e citações) estão espalhados. Alguns artigos podem receber muitas citações, enquanto outros quase não recebem nenhuma.

Duas medidas comuns usadas pra estudar essa desigualdade são o Índice de Gini e o índice de Pietra. Esses índices ajudam a quantificar como as citações estão concentradas entre os artigos mais citados. Um índice de Gini alto indica que alguns artigos estão recebendo a maioria das citações, enquanto um índice de Gini baixo sugere uma distribuição mais igualitária.

Aplicação dos Modelos

Depois de desenvolver e refinar seus modelos, os pesquisadores os aplicam a dados reais pra avaliar seu desempenho. Eles podem comparar os novos modelos de mistura com modelos padrão pra ver qual deles se ajusta melhor aos dados.

Ao ajustar esses modelos aos dados empíricos, os pesquisadores podem derivar estatísticas importantes que resumem os padrões de citação. Eles podem avaliar o quão bem o modelo capta os dados reais e se oferece insights melhores sobre o comportamento de citação em comparação com métodos tradicionais.

Analisando os Resultados

Uma vez que os dados foram analisados, os pesquisadores interpretam suas descobertas. Eles olham como vários modelos se saem com base em diferentes critérios. Por exemplo, podem examinar como o modelo prevê as contagens de citações com precisão ou como ele explica os dados observados.

Por meio desse processo, os pesquisadores podem identificar tendências nas citações em diferentes campos. Eles podem descobrir que certos campos mostram uma concentração mais forte de citações do que outros. Isso pode levar a discussões sobre como as práticas de pesquisa diferem entre as disciplinas e quais fatores contribuem pra essas diferenças.

Conclusão

O estudo dos padrões de citação é uma parte essencial pra entender o impacto acadêmico. Ao empregar ferramentas estatísticas avançadas como modelos de mistura, os pesquisadores podem analisar os dados de citação de uma forma mais sutil. Isso não só leva a melhores insights, mas também ajuda a informar futuras práticas de pesquisa e decisões de financiamento.

À medida que as práticas de citação continuam a evoluir, esses modelos vão desempenhar um papel importante em acompanhar as tendências na produtividade e influência da pesquisa. No final das contas, um melhor modelamento e compreensão das distribuições de citação pode aprimorar nossa compreensão de como o conhecimento é produzido e compartilhado em vários campos acadêmicos.

Fonte original

Título: Modeling citation concentration through a mixture of Leimkuhler curves

Resumo: When a graphical representation of the cumulative percentage of total citations to articles, ordered from most cited to least cited, is plotted against the cumulative percentage of articles, we obtain a Leimkuhler curve. In this study, we noticed that standard Leimkuhler functions may not be sufficient to provide accurate fits to various empirical informetrics data. Therefore, we introduce a new approach to Leimkuhler curves by fitting a known probability density function to the initial Leimkuhler curve, taking into account the presence of a heterogeneity factor. As a significant contribution to the existing literature, we introduce a pair of mixture distributions (called PG and PIG) to bibliometrics. In addition, we present closed-form expressions for Leimkuhler curves. {Some measures of citation concentration are examined empirically for the basic models (based on the Power {and Pareto distributions}) and the mixed models derived from {these}.} An application to two sources of informetric data was conducted to see how the mixing models outperform the standard basic models. The different models were fitted using non-linear least squares estimation.

Autores: Emilio Gómez-Déniz, Pablo Dorta-González

Última atualização: 2024-01-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2401.07052

Fonte PDF: https://arxiv.org/pdf/2401.07052

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes