Examinando o viés WEIRD na pesquisa em computação social
Um estudo destaca o foco em populações WEIRD na pesquisa em computação social.
― 7 min ler
Índice
A pesquisa em computação social geralmente analisa dados de plataformas de mídia social. Um problema com essa pesquisa é que ela costuma representar em excesso um grupo específico de pessoas conhecido como WEIRD (Ocidental, Educado, Industrializado, Rico e Democrático). Isso significa que os estudos podem não refletir as experiências de pessoas de diferentes origens ou países. O objetivo dessa pesquisa é ver quanto os estudos de computação social focam em populações WEIRD, analisando os trabalhos apresentados na conferência ICWSM, que é um lugar importante para esse tipo de pesquisa.
O que é WEIRD?
WEIRD se refere a um grupo de países que inclui os EUA, Canadá, Europa Ocidental e Austrália. Esses países costumam ser o foco de estudos acadêmicos, especialmente em psicologia e ciências sociais. Pesquisas que dependem muito de populações WEIRD podem criar uma visão estreita do comportamento e das experiências humanas. Por exemplo, se a maior parte dos estudos é baseada em pessoas dos EUA, os resultados podem não se aplicar a pessoas de outras culturas ou origens.
Diversidade
A Importância daA diversidade na pesquisa é importante porque ajuda a cobrir uma gama mais ampla de experiências humanas. Se a pesquisa só foca em populações WEIRD, perdemos insights valiosos de outras partes do mundo. Por exemplo, um estudo que analisa o comportamento nas mídias sociais pode encontrar padrões diferentes ao incluir dados de usuários na África, Ásia ou América do Sul. Conjuntos de dados diversos ajudam a construir uma compreensão mais completa do comportamento social entre diferentes culturas.
Análise dos Trabalhos da ICWSM
Para ver quanto os trabalhos da ICWSM focam em WEIRD, os pesquisadores analisaram 494 trabalhos publicados de 2018 a 2022. Depois de filtrar os trabalhos que não apresentavam informações claras sobre os países envolvidos, focaram em 420 trabalhos. O objetivo era ver quantos desses trabalhos usaram dados de países WEIRD e se estavam comparando esses dados com outros países.
Os resultados mostraram que 37% dos trabalhos analisados da ICWSM focaram exclusivamente em dados de países ocidentais. Isso é menor do que outras conferências, como CHI e FAccT, onde o foco em países ocidentais foi de até 76% e 84%, respectivamente. Esses números sugerem que a ICWSM está indo melhor em termos de inclusão de conjuntos de dados diversos em comparação com essas outras conferências.
No entanto, mesmo dentro da ICWSM, a maioria dos estudos ainda tendia a usar dados de países mais educados, ricos e industrializados. Isso sugere que, embora a conferência seja mais inclusiva do que outras, ainda há espaço para melhorias.
O Papel dos Dados das Mídias Sociais
As mídias sociais servem como uma fonte crítica de dados na pesquisa de computação social. Plataformas como Twitter e Reddit oferecem uma tonelada de informações sobre interações e comportamentos dos usuários. No entanto, usar dados dessas plataformas pode introduzir vieses, especialmente se os dados vierem principalmente de usuários em países WEIRD. Por exemplo, se um estudo analisa tweets principalmente dos EUA, pode perder nuances culturais importantes para entender a dinâmica das mídias sociais em outras regiões.
Estudos mostraram que muitas pesquisas em psicologia predominantemente se baseiam em populações WEIRD, que representam apenas cerca de 12% da população Global. Essa situação é semelhante nas ciências da computação e sociais, onde uma quantidade significativa de pesquisa é centrada no Ocidente.
Metodologia do Estudo
Os pesquisadores utilizaram uma abordagem de crowdsourcing para coletar dados dos trabalhos da ICWSM. Eles recrutaram 188 participantes para extrair informações dos trabalhos selecionados sobre de onde os dados vieram e quem eram os participantes. Esse método permitiu que eles computassem o que chamaram de "pontuações WEIRD" para os trabalhos analisados.
Os participantes seguiram um processo estruturado, onde foram mostrados exemplos de trabalhos para ajudá-los a entender quais dados precisavam extrair. Eles focaram em variáveis como o número de participantes e os países de origem. Esse cuidadoso processo de coleta de dados ajudou a garantir resultados precisos.
Resultados
Depois de analisar os trabalhos, os pesquisadores encontraram tendências notáveis. Uma parte significativa dos estudos (51%) examinou dados que incluíam tanto países ocidentais quanto não ocidentais. Isso indica que os pesquisadores da ICWSM estão começando a incorporar uma gama mais equilibrada de conjuntos de dados.
Além disso, o estudo revelou que os trabalhos de conjunto de dados e pôsteres tiveram pontuações mais baixas nas categorias "EIRD" (Educado, Industrializado, Rico e Democrático) em comparação com os trabalhos de pesquisa completos. Essa descoberta sugere que esses tipos de trabalhos podem envolver com mais frequência amostras de países menos educados e menos democráticos.
Co-autoria entre Países
O estudo também explorou como a diversidade das afiliações dos autores impactou os conjuntos de dados usados nos trabalhos de pesquisa. Os pesquisadores analisaram se os trabalhos com autores de múltiplos países tendiam a focar em amostras menos WEIRD. Os resultados indicaram uma correlação negativa, ou seja, os trabalhos co-autorados por pesquisadores de diferentes países eram menos propensos a focar em amostras WEIRD.
Isso destaca a importância da colaboração global no trabalho acadêmico. Quando pesquisadores de diferentes regiões se unem, podem trazer perspectivas e fontes de dados diversas que enriquecem a pesquisa e a tornam mais representativa da população global.
Implicações para Pesquisas Futuras
Os resultados deste estudo fornecem insights cruciais sobre como a pesquisa em computação social pode se tornar mais inclusiva. Existem várias implicações e recomendações para estudos futuros:
Expandir a Diversidade em Conjuntos de Dados: Os pesquisadores devem se esforçar para incluir mais dados de regiões sub-representadas, garantindo que seus estudos reflitam uma perspectiva global.
Listas de Verificação para Trabalhos: Incluir perguntas em formulários de submissão de pesquisa sobre a diversidade geográfica dos conjuntos de dados pode ajudar a aumentar a conscientização sobre os vieses WEIRD.
Declarações de IA Responsável: Os trabalhos poderiam se beneficiar da incorporação de declarações sobre o impacto potencial de seus conjuntos de dados, especialmente se forem originados de regiões específicas conhecidas por certos vieses.
Fomentar a Diversidade entre Autores: Iniciativas para promover a diversidade entre os autores podem levar a colaborações mais fortes que abrangem diferentes origens e países, potencialmente reduzindo o foco em amostras WEIRD.
Abordar Limitações: Estudos futuros devem estar cientes de suas limitações, especialmente em como definem e medem diversidade. Explorar métricas e estruturas alternativas pode proporcionar uma compreensão mais nuançada das perspectivas globais.
Conclusão
A pesquisa em computação social ainda tem um longo caminho a percorrer para se tornar mais representativa da população global. Embora descobertas recentes da ICWSM indiquem progresso, ainda há muitas melhorias a serem feitas em termos de inclusão e diversidade em conjuntos de dados. Ao focar em ampliar os horizontes da pesquisa e adotar uma perspectiva mais global, a computação social pode aprimorar sua compreensão do comportamento humano e das experiências únicas de indivíduos em todo o mundo.
Com metodologias diversas e esforços colaborativos, os pesquisadores podem esperar alcançar uma representação mais equilibrada em seus estudos, garantindo que as vozes de pessoas de várias origens sejam ouvidas e valorizadas na pesquisa em computação social.
Título: WEIRD ICWSM: How Western, Educated, Industrialized, Rich, and Democratic is Social Computing Research?
Resumo: Much of the research in social computing analyzes data from social media platforms, which may inherently carry biases. An overlooked source of such bias is the over-representation of WEIRD (Western, Educated, Industrialized, Rich, and Democratic) populations, which might not accurately mirror the global demographic diversity. We evaluated the dependence on WEIRD populations in research presented at the AAAI ICWSM conference; the only venue whose proceedings are fully dedicated to social computing research. We did so by analyzing 494 papers published from 2018 to 2022, which included full research papers, dataset papers and posters. After filtering out papers that analyze synthetic datasets or those lacking clear country of origin, we were left with 420 papers from which 188 participants in a crowdsourcing study with full manual validation extracted data for the WEIRD scores computation. This data was then used to adapt existing WEIRD metrics to be applicable for social media data. We found that 37% of these papers focused solely on data from Western countries. This percentage is significantly less than the percentages observed in research from CHI (76%) and FAccT (84%) conferences, suggesting a greater diversity of dataset origins within ICWSM. However, the studies at ICWSM still predominantly examine populations from countries that are more Educated, Industrialized, and Rich in comparison to those in FAccT, with a special note on the 'Democratic' variable reflecting political freedoms and rights. This points out the utility of social media data in shedding light on findings from countries with restricted political freedoms. Based on these insights, we recommend extensions of current "paper checklists" to include considerations about the WEIRD bias and call for the community to broaden research inclusivity by encouraging the use of diverse datasets from underrepresented regions.
Autores: Ali Akbar Septiandri, Marios Constantinides, Daniele Quercia
Última atualização: 2024-06-11 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2406.02090
Fonte PDF: https://arxiv.org/pdf/2406.02090
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.