Sci Simple

New Science Research Articles Everyday

# Informática # Computação e linguagem

Hostilidade Online Contra Políticos do Reino Unido: Um Mergulho Profundo

Analisando a crescente hostilidade nas redes sociais em relação aos deputados do Reino Unido.

Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard

― 7 min ler


Hostilidade no Discurso Hostilidade no Discurso Político do Reino Unido pesquisas. políticos do Reino Unido através de Desvendando o abuso online contra
Índice

Nos últimos anos, as redes sociais viraram um lugar popular pros políticos do UK interagirem com o público. Eles usam sites como o X (antigo Twitter) pra se conectar com os eleitores, respondendo perguntas e recebendo feedback. Mas essa abertura pode levar a uma atenção indesejada. Os políticos frequentemente enfrentam uma onda de comentários hostis que vão tanto pro lado profissional quanto pro pessoal, fazendo das redes sociais uma espada de dois gumes.

Essa Hostilidade pode prejudicar os políticos e a confiança do público no governo. Alguns comentários são tão pesados que podem incitar violência no mundo real. Por isso, entender e lidar com esse problema é crucial pra manter um discurso político saudável.

O Conjunto de Dados

Pra encarar o problema da hostilidade em comentários online direcionados a políticos, os pesquisadores criaram um conjunto de dados com 3.320 Tweets coletados ao longo de dois anos. Esses tweets foram cuidadosamente revisados e rotulados quanto ao nível de hostilidade em relação aos Membros do Parlamento (MPs) do UK. Além disso, o conjunto de dados inclui detalhes sobre as características de identidade dos alvos, como raça, gênero e religião.

Esse conjunto de dados não é só uma coleção aleatória de tweets. Ele visa destacar a linguagem e os problemas únicos que surgem nas discussões Políticas no UK, que podem ser bem diferentes de outros países. Por exemplo, certas questões como o Brexit são especialmente relevantes no UK, e esse conjunto de dados reflete isso.

Por Que Isso É Importante?

A necessidade desse tipo de conjunto de dados surge da linguagem específica usada na hostilidade política. Modelos existentes pra detectar hostilidade geral frequentemente falham quando aplicados a contextos políticos. Eles perdem as nuances da linguagem e do sentimento público relacionado a questões políticas, tornando essencial ter uma abordagem mais focada.

Sem esse esforço focado, a confiança pública nas instituições políticas pode continuar a se desmoronar. Assim, criar e analisar esse conjunto de dados não só ajuda a classificar tweets hostis, mas também abre portas pra futuras pesquisas sobre abuso online em um contexto político.

Pesquisas Anteriores

Antes desse conjunto de dados ser criado, estudos anteriores já tinham investigado a hostilidade em relação a políticos, mas geralmente de forma ampla. Muitos desses estudos focaram em incidentes específicos ou tendências, em vez de fornecer uma análise abrangente da linguagem e das questões de identidade em jogo.

Pesquisas mostraram que políticas mulheres e aquelas de grupos minoritários tendem a enfrentar mais hostilidade do que os colegas. Ferramentas como análise de sentimento foram utilizadas pra medir o sentimento negativo online, mas nem sempre são eficazes no âmbito político.

Conjuntos de dados existentes muitas vezes careciam de rótulos que identificassem a natureza específica da hostilidade. Alguns conjuntos focavam apenas em um tipo de abuso, como islamofobia, enquanto outros incluíam um espectro mais amplo de discursos de ódio, mas não prestavam atenção às características de identidade.

Metodologia

Coleta de Dados

Os pesquisadores usaram a API de Streaming do X pra coletar tweets relacionados a MPs durante dois anos. Eles acompanharam tanto os tweets originais dos MPs quanto as respostas e retweets. Essa abordagem extensa resultou em mais de 30 milhões de tweets. No entanto, como esse número era esmagador, os pesquisadores tiveram que amostrar um subconjunto menor e mais gerenciável pra uma análise detalhada.

Processo de Amostragem

Pra garantir diversidade, os pesquisadores escolheram tweets de 18 MPs representando diferentes Identidades e partidos políticos. Eles equilibraram a amostra pra incluir grupos de identidade minoritária e majoritária. A amostragem também focou em vários períodos de tempo pra capturar diferentes contextos e eventos.

No total, 3.330 tweets foram coletados pra rotulação manual. Os tweets foram categorizados com base na hostilidade, permitindo que os pesquisadores criassem uma imagem mais clara do cenário de abuso online direcionado a MPs.

Processo de Anotação

Os pesquisadores formularam diretrizes pra ajudar os anotadores a classificar os tweets de forma eficaz. Uma série de sessões de treinamento garantiu que todos envolvidos entendessem as definições e critérios pra identificar hostilidade com precisão. Os anotadores trabalharam em equipes e foram incentivados a consultar recursos externos quando encontravam linguagem desconhecida.

Três anotadores diferentes rotularam cada tweet, proporcionando um certo nível de confiabilidade ao conjunto de dados. Esse processo de múltiplas anotações ajudou a minimizar erros e garantiu que os rótulos fossem o mais precisos possível.

Analisando os Tweets

Padrões Linguísticos

Pra entender a linguagem usada em tweets hostis, os pesquisadores fizeram uma análise linguística. Eles descobriram que tweets hostis frequentemente continham termos e frases negativas destinadas a desacreditar os políticos. Palavras como "mentiroso", "corrupto" e "maligno" eram notavelmente comuns entre os comentários hostis.

Por outro lado, tweets não-hostis tendiam a apresentar frases positivas. Em vez de insultos, esses tweets frequentemente expressavam gratidão ou feedback construtivo, usando uma linguagem que seguia as normas sociais.

Análise de Tópicos

Os pesquisadores também exploraram os tópicos associados a tweets hostis e não-hostis. Eles identificaram que muitos tweets estavam relacionados a eventos políticos atuais, como o Brexit ou a gestão da saúde durante a pandemia. Essa conexão entre eventos atuais e hostilidade online destaca como certas questões podem aumentar a raiva pública contra os políticos.

Identificação de Hostilidade

Os pesquisadores usaram o conjunto de dados pra treinar modelos pra detectar hostilidade em tweets. Isso envolveu duas tarefas principais: primeiro, identificar se um tweet era hostil ou não, e segundo, categorizar o tipo de hostilidade com base em características de identidade como raça, gênero ou religião.

Vários modelos foram testados pra ver qual se saía melhor na identificação tanto da hostilidade binária (hostil vs. não-hostil) quanto dos tipos de hostilidade multi-classe.

Descobertas

Resultados da Detecção de Hostilidade

Ao analisar o desempenho dos modelos, os pesquisadores descobriram que certos modelos, como o RoBERTa-Hate, se saíram particularmente bem na detecção de hostilidade, alcançando uma alta pontuação macro F1. Ficou claro que modelos treinados no conjunto de dados usando scores de confiança apresentaram resultados melhores do que aqueles treinados em conjuntos de dados anteriores.

Tendências em Hostilidade

Uma tendência notável encontrada nos dados é que políticos de certos históricos de identidade, como mulheres e aqueles de raças ou religiões minoritárias, muitas vezes recebiam um volume maior de hostilidade. Isso destaca a interseção de várias identidades, onde a combinação de raça, gênero e religião pode amplificar a quantidade de abuso enfrentada por políticos.

Importância do Contexto

A pesquisa também demonstrou que o contexto em que um tweet foi enviado teve um papel significativo na determinação da linguagem usada. A hostilidade frequentemente atingiu picos em torno de eventos políticos significativos, revelando a relação próxima entre comentário social e política.

Conclusão

A criação desse conjunto de dados é um passo em direção a uma melhor compreensão e identificação da hostilidade online voltada pros políticos do UK. Ele destaca a necessidade de ferramentas especializadas pra lidar efetivamente com esse problema em um contexto político.

Ao focar na linguagem e nas características de identidade envolvidas em comentários hostis, os pesquisadores podem obter insights essenciais que abrem caminho pra futuras pesquisas visando reduzir o abuso online.

À medida que as redes sociais continuam a evoluir, nossas abordagens de interação com o público e de enfrentamento dos sentimentos hostis que podem surgir delas também precisam evoluir.

Agora, se os MPs pudessem só vir preparados com uma pele grossa, um bom humor e talvez um escudo digital, eles poderiam sobreviver ao furacão de comentários online!

Fonte original

Título: Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs

Resumo: Numerous politicians use social media platforms, particularly X, to engage with their constituents. This interaction allows constituents to pose questions and offer feedback but also exposes politicians to a barrage of hostile responses, especially given the anonymity afforded by social media. They are typically targeted in relation to their governmental role, but the comments also tend to attack their personal identity. This can discredit politicians and reduce public trust in the government. It can also incite anger and disrespect, leading to offline harm and violence. While numerous models exist for detecting hostility in general, they lack the specificity required for political contexts. Furthermore, addressing hostility towards politicians demands tailored approaches due to the distinct language and issues inherent to each country (e.g., Brexit for the UK). To bridge this gap, we construct a dataset of 3,320 English tweets spanning a two-year period manually annotated for hostility towards UK MPs. Our dataset also captures the targeted identity characteristics (race, gender, religion, none) in hostile tweets. We perform linguistic and topical analyses to delve into the unique content of the UK political data. Finally, we evaluate the performance of pre-trained language models and large language models on binary hostility detection and multi-class targeted identity type classification tasks. Our study offers valuable data and insights for future research on the prevalence and nature of politics-related hostility specific to the UK.

Autores: Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard

Última atualização: 2024-12-05 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2412.04046

Fonte PDF: https://arxiv.org/pdf/2412.04046

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes