Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Computación y lenguaje

Monitoreo de Mensajes Políticos en el Panorama de Redes Sociales de Polonia

Analizando la agitación electoral en las redes sociales durante la campaña presidencial de Polonia en 2020.

― 6 minilectura


Perspectivas en redesPerspectivas en redessociales políticas dePoloniade 2020.durante las elecciones presidencialesSeguimiento de mensajes electorales
Tabla de contenidos

Las redes sociales son muy utilizadas por los políticos para hacer publicidad durante las campañas electorales. Esto ha provocado un aumento en los mensajes promocionales, lo que dificulta a las autoridades electorales rastrear la difusión y cantidad de esos mensajes. Este tema es especialmente importante en Polonia, donde las reglas sobre el discurso político están definidas en el Código Electoral Polaco. Nuestro trabajo tiene como objetivo abordar esta brecha presentando un nuevo conjunto de datos enfocado en detectar mensajes políticos, conocidos como agitación electoral, específicamente en polaco.

La Importancia de Monitorear la Agitación Electoral

En los últimos años, las redes sociales han influido mucho en cómo se comparten los mensajes políticos. Esto ha resultado en una mezcla de apoyo positivo a los candidatos y campañas negativas contra los opositores. El lado perjudicial de esto incluye el trolling, el discurso de odio y la difusión de información engañosa. Muchos países europeos, incluido Polonia, tienen leyes para lidiar con tales problemas. Por ejemplo, el Comité Nacional de Elecciones en Polonia es responsable de garantizar elecciones justas y monitorear el discurso electoral.

Sin embargo, ha faltado herramientas para rastrear efectivamente estos mensajes. Nuestro conjunto de datos permite la identificación de tipos específicos de mensajes políticos en Twitter que se alinean con las leyes existentes. Esto podría proporcionar información valiosa sobre cuántos mensajes apoyan a un candidato, cuántos violan las reglas electorales y ofrecer recursos para periodistas e investigadores interesados en la política polaca.

Recursos Existentes

Si bien hay algunos recursos disponibles para analizar contenido político en redes sociales de países como España y Francia, Polonia carece de conjuntos de datos similares. Esto crea una demanda de datos bien anotados que sigan las definiciones legales del discurso político. Nuestro objetivo es satisfacer esta necesidad presentando un conjunto de datos que capture mensajes políticamente cargados durante las elecciones presidenciales polacas de 2020.

Proceso de Recolección de Datos

Recopilamos nuestros datos de Twitter durante la campaña electoral presidencial de 2020, que tuvo lugar entre el 5 de febrero y el 12 de julio de 2020. La recolección involucró casi 10 millones de Tweets utilizando hashtags específicos relacionados con la elección. Después de filtrar duplicados y tweets que no eran en polaco, nos quedamos con alrededor de 4.9 millones de tweets. Un refinamiento adicional excluyó tweets más cortos de 100 caracteres y publicaciones que mencionaban directamente a los candidatos, resultando en 15,790 tweets para nuestro análisis principal.

Anotación de Tweets

Para identificar la agitación política, categorizamos los tweets en dos grupos principales: agitados y no agitados. Tras un análisis cuidadoso, definimos cuatro categorías para la anotación:

  1. Inducción – Estos tweets animan explícitamente a votar por o en contra de un candidato.
  2. Fomento – Esto incluye tweets que comparten opiniones sobre candidatos sin pedir directamente votos.
  3. Asistencia a la Votación – Estos tweets tienen como objetivo animar a la gente a votar o desanimarlos de hacerlo.
  4. Normal – Tweets que no encajan en ninguna de las categorías anteriores.

Nuestro proceso involucró a cinco hablantes nativos de polaco que etiquetaron los tweets. Cada tweet fue revisado por dos anotadores, y las discrepancias fueron resueltas por un tercero. Al final, etiquetamos 6,112 tweets y logramos una puntuación que indica un buen acuerdo entre los anotadores.

Entrenamiento del Modelo

Usando el conjunto de datos, entrenamos un clasificador basado en un Modelo de Lenguaje Polaco llamado HerBERT. Este modelo tiene como objetivo identificar y clasificar los tipos de agitación electoral encontrados en nuestros tweets. Nuestro modelo logró una puntuación F1 del 68%, lo que indica un nivel decente de rendimiento para esta tarea.

Análisis de las Elecciones Presidenciales Polacas

Nuestro conjunto de datos permite el análisis de la agitación electoral en redes sociales. Examinamos tweets de las últimas semanas de la campaña presidencial de 2020. Encontramos que una gran parte de los tweets contenía contenido agitado, especialmente durante un período de supuesta "silencio preelectoral", cuando se supone que la campaña debe detenerse por ley.

Curiosamente, incluso durante este silencio, muchos tweets aún promovían a candidatos, lo que sugiere que las regulaciones existentes podrían no estar evitando efectivamente el discurso político en línea. Observamos que alrededor de un tercio de los tweets analizados estaban relacionados con la agitación, revelando una tendencia creciente en las últimas semanas que llevaron a la elección.

Análisis de Sentimientos

Además de identificar los tipos de agitación electoral, también analizamos el sentimiento detrás de los tweets. Los tweets categorizados como normales tendieron a tener un sentimiento neutral, mientras que los tweets agitados, especialmente en la categoría de fomento, a menudo eran negativos. Esto apunta a una tendencia donde el sentimiento negativo juega un papel significativo en cómo se comparten los mensajes políticos en redes sociales.

Los resultados destacan que incluso cuando los medios están involucrados, sus mensajes tienden a ser neutrales en comparación con la naturaleza más cargada del contenido en redes sociales. Esto refuerza la idea de que las redes sociales son a menudo una plataforma para narrativas más polarizadas y negativas durante las elecciones.

Conclusión y Direcciones Futuras

Nuestro conjunto de datos y modelo proporcionan una herramienta esencial para categorizar y analizar publicaciones en redes sociales relacionadas con la agitación electoral. Esto sirve a una variedad de audiencias, incluidos investigadores, periodistas y autoridades electorales, que están interesados en entender la dinámica de las campañas políticas.

Nuestro objetivo es continuar desarrollando esta área de investigación. El trabajo futuro se centrará en ampliar nuestros conjuntos de datos y refinar nuestros modelos para apoyar procesos electorales justos y reducir la propaganda política engañosa en redes sociales. Estas iniciativas pueden ayudar a garantizar que las campañas políticas se mantengan transparentes y confiables para los votantes.

Fuente original

Título: Electoral Agitation Data Set: The Use Case of the Polish Election

Resumen: The popularity of social media makes politicians use it for political advertisement. Therefore, social media is full of electoral agitation (electioneering), especially during the election campaigns. The election administration cannot track the spread and quantity of messages that count as agitation under the election code. It addresses a crucial problem, while also uncovering a niche that has not been effectively targeted so far. Hence, we present the first publicly open data set for detecting electoral agitation in the Polish language. It contains 6,112 human-annotated tweets tagged with four legally conditioned categories. We achieved a 0.66 inter-annotator agreement (Cohen's kappa score). An additional annotator resolved the mismatches between the first two improving the consistency and complexity of the annotation process. The newly created data set was used to fine-tune a Polish Language Model called HerBERT (achieving a 68% F1 score). We also present a number of potential use cases for such data sets and models, enriching the paper with an analysis of the Polish 2020 Presidential Election on Twitter.

Autores: Mateusz Baran, Mateusz Wójcik, Piotr Kolebski, Michał Bernaczyk, Krzysztof Rajda, Łukasz Augustyniak, Tomasz Kajdanowicz

Última actualización: 2023-07-13 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2307.07007

Fuente PDF: https://arxiv.org/pdf/2307.07007

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares