Simple Science

Ciência de ponta explicada de forma simples

# Informática# Aprendizagem de máquinas# Computação e linguagem# Redes Sociais e de Informação

Rotulando as Opiniões dos Usuários nas Redes Sociais

Um método pra classificar as opiniões dos usuários de redes sociais sobre questões importantes através de hashtags e interações.

― 7 min ler


Classificação de PosturasClassificação de Posturasem Mídias Sociaisusuários sobre tópicos controversos.Método para analisar as opiniões dos
Índice

As redes sociais viraram um lugar comum pra compartilhar opiniões e discutir questões políticas. Mas, com as mudanças rápidas e a quantidade enorme de conteúdo nessas plataformas, fica complicado entender o que a galera realmente pensa. Esse trabalho foca em um método pra rotular a Posição dos usuários nas redes sociais, especialmente analisando as hashtags que eles usam e como interagem com os outros na plataforma. Dividindo isso em duas etapas, o objetivo é criar um panorama mais claro das posições dos usuários, principalmente sobre temas importantes como mudanças climáticas e controle de armas.

O Desafio de Entender a Posição dos Usuários

O volume gigante de conteúdo nas redes sociais significa que muitas opiniões coexistem ao mesmo tempo. Enquanto isso pode permitir que opiniões diferentes sejam compartilhadas, também pode criar uma situação onde a galera só conversa com quem pensa igual, formando câmaras de eco. Pesquisas mostram que os usuários se tornam mais polarizados com o tempo, especialmente sobre questões polêmicas. Essa polarização pode afetar áreas importantes, como decisões de financiamento, escolhas de relacionamentos e como as pessoas reagem a informações de saúde pública.

Dois Tipos de Polarização

Quando olham pra polarização online, os pesquisadores geralmente focam em duas formas principais: polarização de interação e Polarização Afetiva.

Polarização de Interação

A polarização de interação rola quando os usuários só falam com outros que compartilham suas opiniões. Isso pode distorcer como eles enxergam diferentes pontos de vista, reforçando suas crenças sem desafiá-las. Essas câmaras de eco tornam difícil ter discussões abertas e podem aumentar as tensões entre os grupos.

Polarização Afetiva

A polarização afetiva diz respeito aos sentimentos que as pessoas têm em relação àqueles com opiniões opostas. Geralmente, envolve sentimentos negativos direcionados a grupos que não compartilham as mesmas opiniões. Esse tipo de polarização pode ser mais complicado de estudar porque normalmente envolve coletar dados manualmente, o que pode ser demorado e difícil.

A Necessidade de Melhorar a Rotulagem de Posições

Rotular as posições dos usuários é uma tarefa complicada porque a linguagem das redes sociais costuma ser informal e caótica. Os usuários podem usar sarcasmo, ironia ou outros elementos que podem confundir os sistemas automatizados. Essa complexidade torna crucial desenvolver métodos que considerem tanto o que as pessoas escrevem quanto como interagem com os outros nas redes sociais.

O Método Proposto

Pra enfrentar esse problema, um método de rotulagem de posição em duas etapas será introduzido.

Etapa Um: Relacionamentos Usuário-Hashtag

Na primeira etapa, um gráfico bipartido será criado conectando os usuários às hashtags que eles usam. Esse gráfico ajuda a capturar como os usuários estão ligados pelas hashtags que postam. Ao examinar essas conexões, é possível começar a rotular os usuários com base nas hashtags que eles usam com frequência. Quanto mais um usuário posta uma hashtag específica associada a uma posição, mais forte essa conexão se torna.

Etapa Dois: Interações dos Usuários

A segunda etapa envolve olhar como os usuários interagem entre si. Isso é feito construindo um gráfico de interação dos usuários, que inclui ações como retweetar, mencionar ou responder a outros. Analisando tanto as hashtags quanto as interações, é possível determinar uma posição mais clara para cada usuário.

Coleta de Dados

Pra colocar o método em prática, dados serão coletados de tweets sobre duas questões importantes: mudanças climáticas e controle de armas. Palavras-chave específicas relacionadas a esses tópicos serão usadas pra reunir tweets em certos períodos de tempo. Assim, capturaremos discussões significativas em torno dessas questões.

Dados sobre Mudanças Climáticas

Pra mudanças climáticas, tweets serão coletados de junho de 2021 a junho de 2022. O conjunto de dados incluirá milhões de tweets e milhares de usuários únicos, permitindo uma análise abrangente de como a galera discute sobre mudanças climáticas.

Dados sobre Controle de Armas

Pra controle de armas, tweets publicados entre janeiro de 2022 e dezembro de 2022 serão coletados. Semelhante ao conjunto de dados de mudanças climáticas, milhões de tweets e uma ampla gama de usuários serão incluídos pra examinar o debate sobre controle de armas.

Analisando a Rotulagem de Posição Usuário-Hashtag

Uma vez que os tweets sejam coletados, o primeiro passo é construir o gráfico bipartido usuário-hashtag. Esse gráfico vai conectar usuários com hashtags com base nos posts deles.

Hashtags Semente

Um pequeno conjunto de hashtags semente será definido pra cada posição. Essas hashtags semente vão servir como ponto de partida pra atribuir rótulos de posição aos usuários que as usam com frequência. À medida que a rotulagem avança, os usuários receberão rótulos de posição específicos com base nas hashtags que usam.

Processo de Propagação

O método envolverá um processo de propagação onde a posição associada às hashtags semente se espalha para os usuários conectados através das hashtags. Os usuários receberão rótulos com base na frequência que usam as hashtags de cada grupo de posição. Esse método permite uma maneira rápida e eficiente de rotular usuários, embora alguns usuários que não usam hashtags possam ficar sem rótulo.

Usando Redes Neurais Gráficas pra Rotulagem de Posição

Depois da primeira etapa, o próximo passo é aprimorar a abordagem usando redes neurais gráficas (GNNs). Esse método permite uma análise mais profunda das interações dos usuários e ajudará a preencher lacunas deixadas pelo método das hashtags.

Construindo o Gráfico de Interação dos Usuários

Esse gráfico vai conectar usuários com base nas interações deles. Cada interação terá um peso atribuído com base no sentimento do tweet. Analisando esse gráfico, a GNN pode aprender a fazer previsões melhores sobre as posições dos usuários.

Treinando a GNN

Treinar a GNN vai envolver combinar as informações das interações dos usuários e os usuários rotulados anteriormente. O modelo será treinado pra classificar as posições dos usuários com base nessas informações combinadas.

Resultados

O método proposto será testado contra abordagens existentes pra ver quão bem ele se sai. A eficácia será medida em termos de precisão, recall e desempenho geral na classificação das posições dos usuários.

Resultados do Conjunto de Dados sobre Controle de Armas

Os resultados do conjunto de dados sobre controle de armas devem mostrar que o método baseado em GNN vai superar outros modelos. Esse conjunto de dados ajudará a ilustrar quão bem a abordagem funciona pra um tópico movido por eventos.

Resultados do Conjunto de Dados sobre Mudanças Climáticas

Os resultados do conjunto de dados sobre mudanças climáticas provavelmente darão uma visão dos desafios da rotulagem de posições em tópicos menos movidos por eventos.

Conclusão

Essa pesquisa tem como objetivo enfrentar o desafio de entender as posições dos usuários nas plataformas de redes sociais. Combinando análise de texto e interações sociais, propõe-se uma estrutura mais abrangente pra rotulagem de posições. À medida que as redes sociais continuam a crescer, entender como medir e analisar opiniões sobre questões importantes se torna vital pra fomentar discussões abertas e melhorar a compreensão social.

As descobertas dessa pesquisa podem fornecer insights valiosos pra melhorar o discurso político e os estudos sobre polarização.

Fonte original

Título: Two-Stage Stance Labeling: User-Hashtag Heuristics with Graph Neural Networks

Resumo: The high volume and rapid evolution of content on social media present major challenges for studying the stance of social media users. In this work, we develop a two stage stance labeling method that utilizes the user-hashtag bipartite graph and the user-user interaction graph. In the first stage, a simple and efficient heuristic for stance labeling uses the user-hashtag bipartite graph to iteratively update the stance association of user and hashtag nodes via a label propagation mechanism. This set of soft labels is then integrated with the user-user interaction graph to train a graph neural network (GNN) model using semi-supervised learning. We evaluate this method on two large-scale datasets containing tweets related to climate change from June 2021 to June 2022 and gun control from January 2022 to January 2023. Our experiments demonstrate that enriching text-based embeddings of users with network information from the user interaction graph using our semi-supervised GNN method outperforms both classifiers trained on user textual embeddings and zero-shot classification using LLMs such as GPT4. We discuss the need for integrating nuanced understanding from social science with the scalability of computational methods to better understand how polarization on social media occurs for divisive issues such as climate change and gun control.

Autores: Joshua Melton, Shannon Reid, Gabriel Terejanu, Siddharth Krishnan

Última atualização: 2024-05-17 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2404.10228

Fonte PDF: https://arxiv.org/pdf/2404.10228

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes