Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computadores e sociedade

Crowdsourcing na Luta Contra as Fake News

Usando opiniões coletivas pra combater informações enganosas nas redes sociais.

François t'Serstevens, Roberto Cerina, Giulia Piccillo

― 9 min ler


Combatendo Fake News comCombatendo Fake News comCrowdsourcingnotícias.para melhorar a verificação dasUtilizando as percepções da comunidade
Índice

Fake news virou um baita problema no mundo de hoje, especialmente nas redes sociais. Muita gente tem dificuldade em identificar o que é fake news de verdade e em quem pode confiar pra saber a verdade. As empresas de redes sociais geralmente contam com especialistas pra resolver isso, mas esse método já recebeu críticas por ser tendencioso e pouco confiável. Por isso, alguns pesquisadores e empresas estão buscando um novo jeito de detectar fake news que usa "crowdsourcing". Esse método aproveita as ideias e opiniões de pessoas comuns em vez de depender só de especialistas.

O objetivo desse artigo é mostrar como o crowdsourcing pode ser usado pra identificar fake news com precisão. Vamos explicar como coletamos dados, analisamos essas informações e o que nossos achados revelam sobre o compartilhamento de fake news nos Estados Unidos.

O Desafio de Definir Fake News

Fake news é geralmente definida como uma informação enganosa que parece ser notícia de verdade, mas não é. Essa definição pode ser complicada de aplicar na prática, ainda mais nas plataformas de redes sociais onde as mensagens são compartilhadas rapidinho. As redes sociais não mostram o processo de decisão por trás das postagens, o que dificulta avaliar se algo é verdadeiro ou falso.

Pra lidar com esse problema, surgiram vários métodos pra identificar fake news:

  1. Avaliação de Especialistas: Algumas empresas contratam jornalistas profissionais pra checar fatos. Mas esse método tem problemas, como viés político e falta de confiança em certos grupos.

  2. Avaliação por Crowdsourcing: Esse método coleta opiniões de um grande grupo de pessoas sobre a veracidade de uma notícia. A ideia é que a maioria geralmente sabe mais. Essa abordagem é vista como mais inclusiva e econômica comparada à avaliação de especialistas.

  3. Métodos Computacionais: Algoritmos analisam grandes quantidades de dados das redes sociais pra detectar conteúdo falso com base em várias características, como linguagem usada, fonte da informação e comportamento do usuário.

Enquanto as avaliações de especialistas têm seus benefícios, elas podem ser influenciadas pelas crenças pessoais dos avaliadores. Isso levanta questões sobre sua objetividade. Avaliações por crowdsourcing, quando feitas corretamente, podem ajudar a superar algumas dessas preocupações ao refletir uma gama mais ampla de opiniões.

A Nova Abordagem

Nesse artigo, apresentamos um novo método pra detectar fake news baseado na sabedoria das multidões. Isso significa usar as avaliações coletivas de muitas pessoas pra determinar se uma informação é verdadeira ou falsa. Nossa abordagem envolve várias etapas:

  1. Coleta de Dados: Fizemos uma pesquisa online pra coletar opiniões de pessoas sobre vários tweets relacionados à pandemia. Os tweets foram escolhidos com base em termos-chave de COVID-19 pra garantir que fossem relevantes.

  2. Criação de Personas: Criamos diferentes personas pra representar vários grupos sociais. Isso ajuda a entender como diferentes pessoas podem ver a mesma informação de formas diferentes.

  3. Modelagem Estatística: Usamos um modelo estatístico pra interpretar os dados da pesquisa e prever quão provável é que cada tweet compartilhe informações falsas.

  4. Agregando Resultados: Depois de calcular a veracidade de cada tweet, compilamos os resultados de vários grupos. Essa agregação nos permite ver um panorama mais amplo do compartilhamento de fake news nos EUA.

Coleta de Dados e Configuração Inicial

Pra começar, coletamos milhares de tweets que continham palavras-chave relacionadas ao COVID-19. Focamos em tweets postados em um período específico pra garantir que fossem recentes e relevantes. Os tweets foram então avaliados por participantes que compartilharam suas opiniões sobre a precisão deles.

A pesquisa foi cuidadosamente projetada pra garantir que um grupo diversificado de pessoas participasse. Buscamos uma amostra representativa que incluísse diferentes idades, gêneros e afiliações políticas. Fazendo isso, construímos uma imagem mais precisa de como as pessoas percebem fake news.

Entendendo as Características dos Usuários

Pra melhorar nossa análise, coletamos informações demográficas sobre os participantes da pesquisa. Isso incluiu aspectos como idade, gênero e crenças políticas. Entender essas características é crucial, pois elas podem influenciar como alguém interpreta notícias.

Por exemplo, crenças políticas podem moldar o que as pessoas consideram fake news, o que é importante pra nossa análise. Usamos uma ferramenta pra estimar essas características com base nos perfis dos participantes e suas interações online. Essas informações nos ajudam a avaliar como diferentes grupos compartilham fake news e como suas visões afetam os resultados gerais.

A Sabedoria da Multidão

A ideia central da nossa abordagem é que "a sabedoria da multidão" pode revelar a verdade sobre fake news. Quando muitas pessoas avaliam uma única informação, a média das avaliações tende a estar mais próxima da verdade.

Definimos nossas métricas de veracidade, que medem quão confiável cada tweet é com base nas opiniões da multidão. Estabelecemos vários métodos pra pesar as opiniões dos participantes da pesquisa. Isso significa que levamos em conta as características de cada revisor, garantindo que nossas pontuações finais reflitam uma avaliação justa de uma multidão diversificada.

Principais Descobertas

Depois de analisar os dados, encontramos várias tendências interessantes sobre o compartilhamento de fake news:

  1. Compartilhamento Geral é Raro: Descobrimos que compartilhar fake news é, em geral, incomum. A maioria das pessoas não interage ou compartilha informações enganosas online.

  2. Diferenças Políticas no Compartilhamento: Nossos achados indicaram que os democratas tendem a compartilhar menos fake news em comparação com o usuário médio. Em contrapartida, ao olharmos para os tweets avaliados por republicanos, eles mostraram uma menor probabilidade de compartilhar fake news com base em suas próprias definições.

  3. Diferenças de Gênero: Encontramos evidências sugerindo que mulheres são menos propensas a compartilhar fake news do que homens. Essa descoberta adiciona outra camada à compreensão de como fatores sociais influenciam a disseminação de desinformação.

  4. Fator Idade: Os resultados sobre idade foram mistos. Indivíduos mais velhos pareciam compartilhar fake news com mais frequência em alguns casos, enquanto em outros, essa tendência não foi significativa.

Essas descobertas ilustram como compartilhar fake news é uma questão complicada influenciada por várias características sociais.

Análise em Nível Estadual

Pra oferecer uma compreensão abrangente do compartilhamento de fake news, fizemos uma análise em nível estadual nos Estados Unidos. Aqui, usamos nossos achados sobre o comportamento individual pra estimar quantas pessoas em cada estado podem estar compartilhando fake news.

Apesar da raridade geral do compartilhamento de fake news, encontramos pequenas diferenças entre os estados. Por exemplo, alguns estados como Tennessee tinham uma maior probabilidade de compartilhar fake news, enquanto lugares como Washington, D.C., mostraram taxas mais baixas. Essas informações podem ser valiosas pra formuladores de políticas e empresas de redes sociais tentando lidar com a disseminação de desinformação de forma eficaz.

Implicações para Empresas de Redes Sociais

Nosso método de usar opiniões da multidão pra detectar fake news oferece várias vantagens, especialmente pra empresas de redes sociais. Ao aproveitar a sabedoria coletiva dos usuários, as empresas podem melhorar suas políticas de moderação de conteúdo. Algumas das principais implicações incluem:

  1. Maior Legitimidade: Ao envolver o público geral no processo de avaliação, as empresas podem construir confiança com seus usuários. Fazer a multidão participar deixa claro que as decisões de conteúdo se baseiam em uma gama mais ampla de opiniões.

  2. Maior Transparência: A abordagem de crowdsourcing é transparente, permitindo que os usuários vejam como as decisões sobre moderação de conteúdo são tomadas. Isso pode minimizar sentimentos de viés ou injustiça na forma como as informações são tratadas.

  3. Adaptabilidade: À medida que as tendências de desinformação mudam ao longo do tempo, também mudam as percepções de verdade. As avaliações por crowdsourcing podem se adaptar rapidamente a novas circunstâncias, garantindo que as políticas de moderação permaneçam relevantes.

  4. Equilíbrio Político: Considerar a diversidade política dos participantes pode ajudar a criar uma abordagem mais equilibrada na moderação de conteúdo, reduzindo o risco de viés contra certos grupos.

Limitações e Pesquisas Futuras

Embora nosso estudo forneça insights valiosos, ele também tem suas limitações. Os resultados são baseados em um conjunto específico de tweets relacionados à pandemia, tornando-os dependentes do contexto. Pesquisas futuras devem explorar outros tópicos e contextos pra validar nossas descobertas.

Além disso, nossa modelagem estatística poderia ser aprimorada. Usamos uma abordagem relativamente simples pra captar características em nível individual, mas expandir isso pra incluir interações mais profundas poderia oferecer melhores insights sobre como vários fatores influenciam o compartilhamento de fake news.

Por fim, estudos futuros poderiam investigar a dinâmica do comportamento online em diferentes plataformas. As redes sociais estão em constante evolução, e entender como essas mudanças impactam a disseminação de desinformação é crucial pra uma regulação eficaz.

Conclusão

Fake news continua sendo um problema urgente no nosso mundo cada vez mais digital. Ao implementar uma metodologia de crowdsourcing pra sua detecção, podemos não apenas melhorar a precisão de nossas avaliações, mas também aumentar a legitimidade democrática da moderação de conteúdo nas plataformas de redes sociais. Nossas descobertas sobre o compartilhamento de fake news em várias demografias são essenciais pra entender o panorama mais amplo da desinformação hoje.

Resumindo, envolver pessoas comuns no processo de identificar fake news pode levar a uma abordagem mais representativa e confiável. À medida que as redes sociais evoluem, nossos métodos pra garantir que informações precisas prevaleçam sobre conteúdos enganosos também precisam evoluir. A necessidade de soluções melhores é clara, e o crowdsourcing apresenta uma maneira inovadora de seguir em frente.

Fonte original

Título: Fake News Detection via Wisdom of Synthetic & Representative Crowds

Resumo: Social media companies have struggled to provide a democratically legitimate definition of "Fake News". Reliance on expert judgment has attracted criticism due to a general trust deficit and political polarisation. Approaches reliant on the ``wisdom of the crowds'' are a cost-effective, transparent and inclusive alternative. This paper provides a novel end-to-end methodology to detect fake news on X via "wisdom of the synthetic & representative crowds". We deploy an online survey on the Lucid platform to gather veracity assessments for a number of pandemic-related tweets from crowd-workers. Borrowing from the MrP literature, we train a Hierarchical Bayesian model to predict the veracity of each tweet from the perspective of different personae from the population of interest. We then weight the predicted veracity assessments according to a representative stratification frame, such that decisions about ``fake'' tweets are representative of the overall polity of interest. Based on these aggregated scores, we analyse a corpus of tweets and perform a second MrP to generate state-level estimates of the number of people who share fake news. We find small but statistically meaningful heterogeneity in fake news sharing across US states. At the individual-level: i. sharing fake news is generally rare, with an average sharing probability interval [0.07,0.14]; ii. strong evidence that Democrats share less fake news, accounting for a reduction in the sharing odds of [57.3%,3.9%] relative to the average user; iii. when Republican definitions of fake news are used, it is the latter who show a decrease in the propensity to share fake news worth [50.8%, 2.0%]; iv. some evidence that women share less fake news than men, an effect worth a [29.5%,4.9%] decrease.

Autores: François t'Serstevens, Roberto Cerina, Giulia Piccillo

Última atualização: 2024-08-06 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2408.03154

Fonte PDF: https://arxiv.org/pdf/2408.03154

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes