Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Salute pubblica e globale

Analisando a desinformação sobre vacinas em tweets romenos

Estudo analisa tweets romenos pra identificar desinformação sobre vacinas e a opinião pública.

― 6 min ler


Vacinas vs. DesinformaçãoVacinas vs. Desinformaçãono Twitterromenos.desinformação sobre vacinas em tweetsEstudo revela a disseminação de
Índice

As Vacinas têm um papel chave na prevenção de doenças e salvaram milhões de vidas pelo mundo. Elas ajudaram a eliminar a varíola e reduziram bastante os casos de pólio. Mais recentemente, as vacinas contra a Covid-19 também salvaram muitas vidas, principalmente entre os mais velhos.

Apesar de serem eficazes e seguras, a Desinformação sobre vacinas aumentou, especialmente com as redes sociais. Muitos artigos, posts e mensagens espalham informações falsas, levando a um crescimento do movimento anti-vacinas. Essa desinformação pode afetar negativamente as taxas de vacinação, aumentando as chances de doenças voltarem.

Durante a pandemia, muitas alegações falsas sobre as vacinas da Covid-19 circularam online. Fatores como uso de redes sociais, nível de educação e confiança nas autoridades de saúde estão ligados à decisão das pessoas de se vacinarem. Plataformas como Facebook e Twitter são fundamentais tanto para espalhar informações corretas sobre vacinas quanto desinformação.

Dada a importância de informações precisas, analisar o conteúdo compartilhado nessas plataformas é crucial. Vários estudos olharam para discussões sobre vacinas no Twitter, principalmente em inglês, mas poucos focaram no conteúdo em romeno. Este estudo tem como objetivo analisar Tweets romenos sobre vacinas para identificar desinformação e entender o Sentimento Público.

Coleta de Dados

Para coletar tweets relacionados a vacinas, foi usada uma ferramenta para extrair dados do Twitter. A busca incluiu diversas palavras romenas para "vacina" e termos relacionados. Tweets de quatro períodos específicos durante a pandemia de Covid-19 foram coletados, focando em momentos de mudanças significativas nos esforços de vacinação na Romênia.

Depois de coletar os tweets, os pesquisadores filtraram os dados para manter apenas os que receberam pelo menos um retweet. Esse processo de seleção visava garantir que os tweets fossem amplamente engajados e relevantes para revisão manual. Um lote aleatório de tweets adicionais também foi coletado para validação posterior.

Para a Análise, detalhes importantes foram extraídos de cada tweet, como o conteúdo, número de likes, retweets, respostas e a data. Essas informações são essenciais para entender o alcance e o impacto do tweet.

Anotação Manual

Para analisar os tweets com precisão, os pesquisadores classificaram manualmente em três categorias: verdadeiro, neutro ou falso. Tweets verdadeiros continham informações precisas sobre vacinas, tweets neutros eram irrelevantes ou sarcásticos, e tweets falsos espalhavam informações falsas ou enganosas. A classificação baseou-se em fontes científicas e informações oficiais de saúde.

Nove anotadores participaram desse processo. Para o conjunto de dados externo, todos os anotadores votaram na classificação de cada tweet, enquanto para o conjunto interno maior, votos foram coletados em grupos de três anotadores para chegar a um consenso. Em casos de empate, o tweet foi classificado como neutro.

O acordo entre os anotadores foi medido para garantir consistência. O conjunto de dados interno teve um nível moderado de concordância, enquanto o externo apresentou maior consistência entre os anotadores.

Pré-processamento de Texto

Antes de analisar os tweets, os pesquisadores precisaram limpar os dados textuais. Isso envolveu remover caracteres especiais, palavras comuns mas sem importância (stop words) e converter todo o texto para letras minúsculas. Hipelinks e menções também foram removidos para reduzir o viés.

Não foram feitas tentativas de simplificar as palavras ainda mais, já que diferentes formas de palavras podem ter significados diferentes em romeno. Essa abordagem preservou a riqueza da linguagem nos tweets.

Análise Preliminar

Os pesquisadores realizaram uma análise preliminar para identificar palavras e frases comuns usadas nas diferentes classificações de tweets. Isso envolveu a criação de representações visuais para destacar os termos mais frequentes.

Eles também exploraram relações entre a classificação dos tweets e métricas de engajamento, como número de likes, retweets e respostas. Notou-se que a desinformação geralmente recebia mais engajamento em comparação com informações verdadeiras.

Construindo e Validando os Modelos de Aprendizado de Máquina

Vários modelos de aprendizado de máquina foram desenvolvidos para prever se um tweet era verdadeiro, neutro ou falso. Esses incluíram modelos tradicionais como Máquinas de Vetores de Suporte, Floresta Aleatória e métodos mais novos como modelos de aprendizado profundo, incluindo BERT.

Cada modelo foi treinado com a coleção de tweets e testado para sua capacidade de classificá-los com precisão. Várias métricas foram usadas para avaliar seu desempenho, focando em como eles previam a veracidade dos tweets.

O modelo que teve melhor desempenho foi selecionado com base na sua capacidade de fornecer previsões confiáveis. O Classificador de Vetores de Suporte se destacou como o modelo líder, especialmente em prever as probabilidades associadas a cada classificação.

Resultados da Análise

A análise revelou várias percepções sobre tweets relacionados a vacinas em romeno. Um total de 1.400 tweets foi coletado, com uma parte significativa sendo classificada como verdadeira ou falsa. A análise das métricas de engajamento indicou que tweets falsos atraíam mais atenção online.

Os modelos de aprendizado de máquina tiveram desempenho em níveis variados, com o Classificador de Vetores de Suporte alcançando melhores resultados na previsão da categoria dos tweets. O estudo destaca que a desinformação geralmente se espalha de forma mais eficaz nas redes sociais, ressaltando a urgência de disseminar informações precisas.

Conclusão

A desinformação sobre vacinas é um grande problema, principalmente durante crises de saúde como a pandemia de Covid-19. Este estudo analisou tweets romenos sobre vacinas para entender melhor como a desinformação se espalha e seu impacto na percepção pública. Ao identificar padrões nas notícias falsas e desenvolver modelos de aprendizado de máquina para classificar tweets, a pesquisa visa contribuir para a luta contínua contra a desinformação sobre vacinas.

Futuras iniciativas devem se focar em coletar conjuntos de dados maiores e aprimorar técnicas de aprendizado de máquina para melhorar ainda mais a precisão preditiva. Ao identificar efetivamente a desinformação, campanhas de conscientização pública podem ser melhor direcionadas para combater narrativas falsas e apoiar os esforços de vacinação.

Fonte original

Título: Identification, analysis and prediction of valid and false information related to vaccines from Romanian tweets

Resumo: The online misinformation might undermine the vaccination efforts. Therefore, given the fact that no study specifically analyzed online vaccine related content written in Romanian, the main objective of the study was to detect and evaluate tweets related to vaccines and written in Romanian language. 1400 Romanian vaccine related tweets were manually classified in true, neutral and fake information and analyzed based on wordcloud representations, a correlation analysis between the three classes and specific tweet characteristics and the validation of several predictive machine learning algorithms. The tweets annotated as misinformation showed specific word patterns and were liked and reshared more often as compared to the true and neutral ones. The validation of the machine learning algorithms yielded enhanced results in terms of Area Under the Receiver Operating Characteristic Curve Score (0.744-0.843) when evaluating the Support Vector Classifier. The predictive model estimates in a well calibrated manner the probability that a specific Twitter post is true, neutral or fake. The current study offers important insights regarding vaccine related online content written in an Eastern European language. Future studies must aim at building an online platform for rapid identification of vaccine misinformation and raising awareness for the general population.

Autores: Dragos Paul Mihai, A. Valeanu, C. Andrei, C. Puscasu, A. M. Ionica, M. I. Hinoveanu, V. P. Predoi, E. Bulancea, C. Chirita, S. Negres, C. D. Marineci

Última atualização: 2023-08-25 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2023.08.19.23294319

Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.08.19.23294319.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes