Hostilidad en Línea hacia Políticos del Reino Unido: Un Análisis Profundo
Analizando la creciente hostilidad en las redes sociales hacia los MPs del Reino Unido.
Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard
― 8 minilectura
Tabla de contenidos
- El Conjunto de Datos
- ¿Por Qué Es Esto Importante?
- Investigaciones Previas
- Metodología
- Recopilación de Datos
- Proceso de Muestreo
- Proceso de Anotación
- Análisis de los Tuits
- Patrones Lingüísticos
- Análisis de Temas
- Identificación de Hostilidad
- Hallazgos
- Resultados de la Detección de Hostilidad
- Tendencias en la Hostilidad
- Importancia del Contexto
- Conclusión
- Fuente original
- Enlaces de referencia
En los últimos años, las redes sociales se han vuelto una plataforma popular para que los políticos del Reino Unido interactúen con el público. Usan sitios como X (anteriormente conocido como Twitter) para conectar con sus votantes, respondiendo preguntas y recibiendo comentarios. Sin embargo, esta apertura puede generar atención no deseada. Los políticos a menudo enfrentan una ola de comentarios hostiles dirigidos tanto a sus roles profesionales como a sus Identidades personales, convirtiendo las redes sociales en una doble espada.
Esta Hostilidad puede perjudicar a los políticos y a la confianza del público en el gobierno. Algunos comentarios son tan graves que pueden incitar a la violencia en la vida real. Por eso, entender y abordar este problema es crucial para mantener un discurso político saludable.
El Conjunto de Datos
Para abordar el problema de la hostilidad en los comentarios en línea dirigidos a políticos, los investigadores han creado un conjunto de datos que contiene 3,320 tuits recopilados durante un período de dos años. Estos tuits fueron revisados y etiquetados cuidadosamente según su grado de hostilidad hacia los miembros del Parlamento del Reino Unido (MPs). Además, el conjunto de datos incluye detalles sobre las características de identidad de los objetivos, como raza, género y religión.
Este conjunto de datos no es solo una colección de tuits aleatorios. Busca resaltar el lenguaje único y los temas que surgen en las discusiones Políticas en el Reino Unido, que pueden ser bastante diferentes de los de otros países. Por ejemplo, ciertos temas como el Brexit son especialmente relevantes en el Reino Unido, y este conjunto de datos lo refleja.
¿Por Qué Es Esto Importante?
La necesidad de este tipo de conjunto de datos surge del lenguaje específico utilizado en la hostilidad política. Los modelos existentes para detectar hostilidad general a menudo no son efectivos cuando se aplican a contextos políticos. Se pierden las sutilezas del lenguaje y el sentimiento público relacionados con temas políticos, lo que hace esencial tener un enfoque más centrado.
Sin este esfuerzo específico, la confianza pública en las instituciones políticas podría seguir erosionándose. Así que crear y analizar este conjunto de datos no solo ayuda en la clasificación de tuits hostiles, sino que también abre puertas para futuras investigaciones sobre el abuso en línea en un contexto político.
Investigaciones Previas
Antes de que se estableciera este conjunto de datos, estudios anteriores habían investigado la hostilidad hacia los políticos, pero a menudo de forma general. Muchos de estos estudios se centraron en incidentes específicos o tendencias en lugar de proporcionar un análisis completo del lenguaje y los problemas de identidad en juego.
La investigación destacó que las políticas femeninas y aquellas de minorías a menudo enfrentan más hostilidad que sus contrapartes. Se han utilizado instrumentos como el análisis de sentimientos para medir el sentimiento negativo en línea, pero no siempre son efectivos en el ámbito político.
Los Conjuntos de datos existentes a menudo carecen de etiquetas para identificar la naturaleza específica de la hostilidad. Algunos conjuntos de datos se centraron solo en un tipo de abuso, como el islamofobia, mientras que otros incluyeron un rango más amplio de discurso de odio pero no prestaron atención a las características de identidad.
Metodología
Recopilación de Datos
Los investigadores usaron la API de Streaming de X para recopilar tuits relacionados con MPs durante dos años. Rastrearon tanto los tuits originales de los MPs como las respuestas y retuits posteriores. Este enfoque extenso resultó en más de 30 millones de tuits. Sin embargo, como este número era abrumador, los investigadores tuvieron que muestrear un subconjunto más pequeño y manejable para un análisis detallado.
Proceso de Muestreo
Para asegurar diversidad, los investigadores eligieron tuits de 18 MPs que representaban diferentes identidades y partidos políticos. Balancearon la muestra para incluir tanto grupos de identidad minoritaria como mayoritaria. El muestreo también se centró en varios períodos de tiempo para capturar diferentes contextos y eventos.
En total, se recopilaron 3,330 tuits para etiquetado manual. Los tuits fueron categorizados según la hostilidad, permitiendo a los investigadores crear una imagen más clara del paisaje del abuso en línea dirigido a MPs.
Proceso de Anotación
Los investigadores formularon directrices para ayudar a los anotadores a clasificar los tuits de manera efectiva. Una serie de sesiones de entrenamiento garantizó que todos los involucrados entendieran las definiciones y criterios para identificar la hostilidad con precisión. Los anotadores trabajaron en equipos y se les animó a consultar recursos externos cuando se encontraban con un lenguaje desconocido.
Tres anotadores diferentes etiquetaron cada tuit, proporcionando un cierto nivel de fiabilidad al conjunto de datos. Este proceso de anotación múltiple ayudó a minimizar errores y garantizó que las etiquetas fueran lo más precisas posible.
Análisis de los Tuits
Patrones Lingüísticos
Para entender el lenguaje utilizado en los tuits hostiles, los investigadores realizaron un análisis lingüístico. Encontraron que los tuits hostiles a menudo contenían términos y frases negativas destinadas a desacreditar a los políticos. Palabras como "mentiroso," "corrupto" y "malévolo" eran notablemente comunes entre los comentarios hostiles.
Por otro lado, los tuits no hostiles tendían a presentar frases positivas. En lugar de insultos, estos tuits a menudo expresaban gratitud o retroalimentación constructiva, usando un lenguaje que se adhiere a las normas sociales.
Análisis de Temas
Los investigadores también exploraron los temas asociados con los tuits hostiles y no hostiles. Identificaron que muchos tuits estaban relacionados con eventos políticos actuales, como el Brexit o la gestión de la atención médica durante la pandemia. Esta conexión entre eventos actuales y hostilidad en línea subraya cómo ciertos temas pueden aumentar la ira pública hacia los políticos.
Identificación de Hostilidad
Los investigadores utilizaron el conjunto de datos para entrenar modelos para detectar hostilidad en tuits. Esto involucró dos tareas principales: primero, identificar si un tuit era hostil o no, y segundo, categorizar el tipo de hostilidad según características de identidad como raza, género o religión.
Se probaron múltiples modelos para ver cuál funcionaba mejor en la identificación de hostilidad binaria (hostil vs. no hostil) y tipos de hostilidad de múltiples clases.
Hallazgos
Resultados de la Detección de Hostilidad
Al analizar el rendimiento de los modelos, los investigadores encontraron que ciertos modelos, como RoBERTa-Hate, tuvieron un desempeño particularmente bueno en la detección de hostilidad, alcanzando un alto puntaje macro F1. Quedó claro que los modelos entrenados en el conjunto de datos utilizando puntajes de confianza ofrecían mejores resultados que aquellos entrenados en conjuntos de datos anteriores.
Tendencias en la Hostilidad
Una tendencia notable encontrada en los datos es que los políticos de ciertos antecedentes de identidad, como mujeres y aquellos de razas o religiones minoritarias, a menudo recibían un mayor volumen de hostilidad. Esto resalta la intersección de varias identidades, donde la combinación de raza, género y religión puede amplificar la cantidad de abuso que enfrentan los políticos.
Importancia del Contexto
La investigación también demostró que el contexto en el que se envió un tuit jugaba un papel significativo en determinar el lenguaje utilizado. La hostilidad a menudo alcanzaba su punto máximo alrededor de eventos políticos significativos, revelando la estrecha relación entre el comentario social y la política.
Conclusión
La creación de este conjunto de datos es un paso hacia una mejor comprensión e identificación de la hostilidad en línea dirigida a los políticos del Reino Unido. Destaca la necesidad de herramientas especializadas para abordar eficazmente este problema en un contexto político.
Al centrarse en el lenguaje y las características de identidad involucradas en los comentarios hostiles, los investigadores pueden obtener información vital que abra el camino para futuras investigaciones destinadas a reducir el abuso en línea.
A medida que las redes sociales continúan evolucionando, también deben hacerlo nuestros enfoques para interactuar con el público y abordar los sentimientos hostiles que pueden surgir de ello.
¡Ahora, si tan solo los MPs pudieran venir equipados con una piel gruesa, un sentido del humor y tal vez un escudo digital, tal vez podrían sobrevivir al torbellino de comentarios en línea!
Fuente original
Título: Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs
Resumen: Numerous politicians use social media platforms, particularly X, to engage with their constituents. This interaction allows constituents to pose questions and offer feedback but also exposes politicians to a barrage of hostile responses, especially given the anonymity afforded by social media. They are typically targeted in relation to their governmental role, but the comments also tend to attack their personal identity. This can discredit politicians and reduce public trust in the government. It can also incite anger and disrespect, leading to offline harm and violence. While numerous models exist for detecting hostility in general, they lack the specificity required for political contexts. Furthermore, addressing hostility towards politicians demands tailored approaches due to the distinct language and issues inherent to each country (e.g., Brexit for the UK). To bridge this gap, we construct a dataset of 3,320 English tweets spanning a two-year period manually annotated for hostility towards UK MPs. Our dataset also captures the targeted identity characteristics (race, gender, religion, none) in hostile tweets. We perform linguistic and topical analyses to delve into the unique content of the UK political data. Finally, we evaluate the performance of pre-trained language models and large language models on binary hostility detection and multi-class targeted identity type classification tasks. Our study offers valuable data and insights for future research on the prevalence and nature of politics-related hostility specific to the UK.
Autores: Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard
Última actualización: 2024-12-05 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2412.04046
Fuente PDF: https://arxiv.org/pdf/2412.04046
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://zenodo.org/records/10809695
- https://anonymous.4open.science/r/ohtukmp-21D8
- https://huggingface.co/cardiffnlp/twitter-roberta-base-hate-latest
- https://huggingface.co/meta-llama/Meta-Llama-3-8B
- https://platform.openai.com/docs/models/gpt-3-5-turbo
- https://developer.twitter.com/en/docs/twitter-api/tweets/lookup/api-reference/get-tweets-id