Analisando Opiniões nas Redes Sociais
Um novo modelo prevê as opiniões dos usuários nas redes sociais com pouco esforço de marcação.
― 11 min ler
Índice
- Redes Sociais como uma Ferramenta de Pesquisa
- O Método Proposto
- Pesquisas Anteriores
- Conexões entre Usuários e Grafos Sociais
- A Abordagem de Filtragem Colaborativa
- O Estudo no Chile
- Metodologia e Processamento de Dados
- Classificação de Posições com Base em Hashtags
- Arquitetura do Modelo
- Experimentação e Resultados
- Impacto de Informações Adicionais
- Reduzindo Esforços de Anotação
- Conclusão
- Fonte original
- Ligações de referência
Redes sociais são uma plataforma onde a galera compartilha livremente seus pensamentos, sentimentos e Opiniões sobre vários assuntos. Essa comunicação aberta torna as redes sociais um recurso valioso pra entender o sentimento público, especialmente em eventos polêmicos como eleições. Os Usuários costumam expressar suas visões e incentivar outros a apoiar seu lado usando símbolos específicos, como Hashtags. Mas, alguns usuários não usam hashtags, falam em idiomas diferentes ou insinuam suas opiniões sem serem diretos. Isso dificulta a identificação das suas visões automaticamente.
Pra enfrentar esse desafio, um novo modelo foi proposto. Esse modelo é baseado em uma tecnologia que analisa as conexões entre usuários e o conteúdo que eles compartilham. O objetivo é identificar as opiniões das pessoas com o mínimo de esforço em rotular dados em comparação com métodos mais tradicionais. Apesar da simplicidade, esse modelo mostrou que pode prever com sucesso as visões individuais. O modelo foi testado nas atitudes dos usuários durante dois referendos constitucionais no Chile em 2020 e 2022, e se mostrou melhor do que os métodos anteriores em termos de precisão e recuperação.
Redes Sociais como uma Ferramenta de Pesquisa
Pesquisadores veem as redes sociais, especialmente o Twitter, como uma fonte importante pra pesquisa social. Com mais de 353 milhões de usuários ativos, o Twitter é popular pra discutir eventos atuais e questões sociais. Os pesquisadores usam o Twitter pra estudar muitos aspectos da sociedade, como o impacto da mídia, reações do mercado de ações e tendências políticas.
Um grande desafio ao usar redes sociais pra pesquisa é descobrir o que os usuários pensam sobre tópicos específicos. Por exemplo, saber como as pessoas se posicionam politicamente pode dar pistas sobre movimentos políticos, resultados de eleições e táticas de marketing. Estudos anteriores usaram vários métodos pra determinar as opiniões dos usuários com base em palavras-chave ou hashtags. No entanto, essa abordagem pode levar a viés, já que nem todo mundo usa a mesma linguagem ou tags ao postar. Além disso, esses métodos tendem a ser caros e podem não capturar a verdadeira posição dos usuários.
Além disso, focar só em indicadores óbvios pode deixar de lado dicas valiosas. As pessoas muitas vezes participam de discussões sem declarar diretamente sua opinião. Por exemplo, um usuário pode não tuitar sua posição política, mas pode interagir com conteúdo curtindo ou compartilhando posts de seu político favorito. Portanto, é essencial considerar uma gama mais ampla de interações dos usuários pra ter uma visão completa.
O Método Proposto
A nova abordagem utiliza uma ferramenta de Análise de Rede que foca nas várias conexões entre usuários e hashtags. Como o modelo não depende muito de tags diretas ou palavras-chave, ele requer muito menos esforço em termos de rotulagem dos usuários pra diferentes tópicos. Essa flexibilidade permite que ele seja aplicado com relativa facilidade a problemas do mundo real.
O modelo representa efetivamente as opiniões dos usuários em um espaço que revela suas inclinações pra diferentes pontos de vista. Em vez de simplesmente categorizar opiniões como positivas ou negativas, ele pode mostrar posições mais sutis. Quando testado, o modelo superou os métodos tradicionais, mostrando melhorias tanto em precisão quanto em recuperação.
Pesquisas Anteriores
Pra entender o lugar do novo modelo na pesquisa, precisamos olhar pra trabalhos anteriores. A detecção de posicionamento envolve identificar o que indivíduos ou grupos pensam sobre questões específicas. Essa área ganhou força à medida que mais discussões públicas se mudaram pra plataformas de redes sociais. O Twitter, em particular, é valioso devido à sua vasta base de usuários e debates animados.
No entanto, a natureza informal das redes sociais apresenta desafios únicos. Posts curtos, gírias e linguagem casual podem complicar as técnicas tradicionais de mineração de opiniões. Reconhecendo isso, estudos mais recentes começaram a explorar elementos mais característicos das interações nas redes sociais. Os usuários podem expressar suas visões usando emojis ou hashtags únicas, que podem atuar como indicadores de sua posição.
Conexões entre Usuários e Grafos Sociais
Dada a variedade de opiniões nas redes sociais, é crucial olhar além das palavras-chave. A ideia de "homofilia" sugere que as pessoas têm mais probabilidade de se conectar com outros que compartilham opiniões semelhantes. Os pesquisadores exploraram vários tipos de conexões em plataformas como o Twitter, incluindo relacionamentos de seguimento e interações mútuas.
Estudos recentes criaram diferentes tipos de grafos sociais pra analisar essas relações. Esses grafos podem ser baseados em como os usuários interagem entre si-por exemplo, através de amizades, menções ou interesses compartilhados. A abordagem olha pra mais do que apenas relacionamentos diretos, integrando várias interações dos usuários, como curtidas, retweets e respostas. Essas interações ajudam a construir uma visão abrangente das opiniões dos usuários.
A Abordagem de Filtragem Colaborativa
A maioria dos esforços de mineração de opiniões se concentra em treinar modelos pra classificar opiniões. No entanto, uma perspectiva de sistema de recomendação também pode ser benéfica. Nesse caso, o objetivo muda pra prever como os usuários se sentem sobre tópicos ou opiniões específicas.
Dois métodos principais em sistemas de recomendação incluem métodos de fatoração de matrizes e análise de grafos de usuários-itens. A fatoração de matriz funciona desmembrando interações entre usuários e itens em representações de menor dimensão. Outras estruturas tentaram melhorar esses métodos, mas a fatoração de matriz tradicional muitas vezes continua eficaz.
Por outro lado, usar grafos de usuários-itens permite capturar relações mais sutis. Desenvolvimentos recentes levaram à criação de uma estrutura que captura informações dos vizinhos dos usuários pra melhorar a qualidade das recomendações.
O Estudo no Chile
O estudo de caso se concentrou em dois referendos importantes no Chile que ocorreram em 2020 e 2022. Em 2019, o país enfrentou protestos significativos relacionados a preocupações econômicas e desigualdades sociais. O governo concordou em realizar um referendo sobre a constituição existente, que era muito polêmica.
O primeiro plebiscito em outubro de 2020 perguntou se uma nova constituição deveria ser elaborada. A maioria apoiou isso. No entanto, após uma campanha política extensa, a nova constituição proposta foi rejeitada no segundo plebiscito, com 62% votando contra.
Dada a popularidade do Twitter no Chile, ele foi escolhido como a principal fonte de dados. O estudo começou coletando tweets de veículos de notícias que atendem ao público chileno. Essa abordagem visava reunir insights de usuários informados que provavelmente tinham opiniões bem formadas.
Pra reduzir o barulho na análise, os pesquisadores limitaram seu foco a usuários que seguiam no máximo dez veículos de notícias, ajudando a excluir contas automatizadas. Esses esforços resultaram em um conjunto de dados substancial com milhares de usuários e tweets capturando discussões públicas durante as campanhas políticas.
Metodologia e Processamento de Dados
O processo pra prever as posições dos usuários envolveu analisar as conexões entre usuários do Twitter e hashtags. As relações foram representadas como um grafo, com usuários e hashtags como nós conectados por arestas. As arestas representavam com que frequência os usuários interagiam com certas hashtags, ajudando a criar um conjunto de dados pronto pra análise.
Antes de mergulhar no modelo, os dados passaram por várias etapas de limpeza e processamento, como codificação e remoção de caracteres ou informações irrelevantes. Além disso, lematização e stemming foram aplicados, garantindo que a análise se concentrasse nas palavras raiz.
Classificação de Posições com Base em Hashtags
Enquanto pesquisas anteriores frequentemente se concentraram extensivamente em hashtags pra inferir opiniões, este modelo adota uma abordagem diferente. Apenas um número limitado de hashtags foi anotado manualmente pra economizar tempo e esforço. Os pesquisadores selecionaram as hashtags mais usadas relacionadas aos referendos pra fins de classificação, categorizando-as em grupos com base em sua posição.
Esse método não só reduz a carga de trabalho dos pesquisadores, mas também permite flexibilidade na captura de novas hashtags à medida que surgem nas discussões. Ao focar em hashtags relevantes, o modelo se torna mais eficiente em prever as opiniões dos usuários.
Arquitetura do Modelo
O modelo proposto utilizou uma arquitetura abrangente pra analisar interações usuário-hashtag enquanto integra vários tipos de informações. O objetivo era aprender melhores representações de usuários e suas opiniões através de múltiplas camadas de análise de rede.
A ideia principal era agregar informações de vários tipos de conexões, atualizando as representações de usuários e hashtags iterativamente pra capturar as características mais relevantes. Isso ajudou o modelo a manter uma compreensão clara das preferências e opiniões dos usuários.
Experimentação e Resultados
A eficácia do modelo foi validada através de experimentos extensivos usando os conjuntos de dados do Twitter coletados. Diferentes abordagens foram testadas, comparando o modelo proposto com métodos estabelecidos. Os resultados demonstraram que o novo modelo se saiu consistentemente melhor na previsão das opiniões e afinidades dos usuários.
O desempenho em nível de aresta refletiu quão bem o modelo podia prever preferências com base nas interações dos usuários, enquanto o desempenho em nível de usuário avaliou a precisão geral das previsões de posições. Os resultados sugeriram que a abordagem poderia capturar eficazmente opiniões sutis de forma contínua, em vez de usar classificações simples.
Impacto de Informações Adicionais
Integrar fontes de dados extras ao modelo melhorou significativamente seu desempenho. Ao adicionar informações semânticas de hashtags e conexões sociais entre usuários, as previsões do modelo se tornaram mais precisas.
No entanto, os desafios de combinar múltiplos tipos de informações eram evidentes. As interações não sempre resultavam em melhor desempenho geral, sugerindo que um equilíbrio cuidadoso é necessário. Pesquisas futuras poderiam explorar maneiras melhores de integrar diferentes características pra melhores resultados.
Reduzindo Esforços de Anotação
Uma das vantagens mais notáveis do modelo proposto é a sua necessidade mínima de anotações manuais. Diferente de métodos anteriores que exigiam rotulagem extensiva, este modelo pode operar de forma eficiente com apenas algumas hashtags-chave identificadas por especialistas.
Como a análise mostrou, um aumento no número de hashtags anotadas levou a uma precisão melhorada. No entanto, os ganhos de desempenho começaram a se estabilizar após um certo ponto, indicando que anotações mínimas ainda poderiam resultar em resultados confiáveis.
Conclusão
Em resumo, este estudo buscou prever as opiniões dos usuários de redes sociais sobre tópicos específicos combinando análise de conteúdo e dados de interação social. O modelo proposto demonstrou sua capacidade de inferir eficazmente as atitudes dos usuários com menos esforço de anotação, mostrando melhorias em relação aos métodos tradicionais.
A pesquisa destacou como diferentes tipos de relacionamentos e fontes de informação podem influenciar positivamente as previsões. Embora combinar múltiplos aspectos apresentasse desafios, a abordagem geral forneceu uma base sólida pra uma exploração mais aprofundada na compreensão da dinâmica das redes sociais e das opiniões dos usuários.
Trabalhos futuros vão se concentrar em refinar o modelo e identificar mudanças nas opiniões dos usuários ao longo do tempo. À medida que o cenário das redes sociais continua a evoluir, entender essas dinâmicas será crucial para pesquisadores, profissionais de marketing e formuladores de políticas.
Título: Stance Inference in Twitter through Graph Convolutional Collaborative Filtering Networks with Minimal Supervision
Resumo: Social Media (SM) has become a stage for people to share thoughts, emotions, opinions, and almost every other aspect of their daily lives. This abundance of human interaction makes SM particularly attractive for social sensing. Especially during polarizing events such as political elections or referendums, users post information and encourage others to support their side, using symbols such as hashtags to represent their attitudes. However, many users choose not to attach hashtags to their messages, use a different language, or show their position only indirectly. Thus, automatically identifying their opinions becomes a more challenging task. To uncover these implicit perspectives, we propose a collaborative filtering model based on Graph Convolutional Networks that exploits the textual content in messages and the rich connections between users and topics. Moreover, our approach only requires a small annotation effort compared to state-of-the-art solutions. Nevertheless, the proposed model achieves competitive performance in predicting individuals' stances. We analyze users' attitudes ahead of two constitutional referendums in Chile in 2020 and 2022. Using two large Twitter datasets, our model achieves improvements of 3.4% in recall and 3.6% in accuracy over the baselines.
Autores: Zhiwei Zhou, Erick Elejalde
Última atualização: 2023-03-30 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2303.15532
Fonte PDF: https://arxiv.org/pdf/2303.15532
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.acm.org/publications/taps/whitelist-of-latex-packages
- https://dl.acm.org/ccs.cfm
- https://www.statista.com/statistics/303681/twitter-users-worldwide/
- https://github.com/imzzhou/StanceInferenceInTwitter.git
- https://www.statista.com/topics/6985/social-media-usage-in-chile/
- https://doi.org/10.3030/101021866