Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Computación y lenguaje

Detectando Agendas Políticas en Redes Sociales

Este artículo examina cómo las redes sociales influyen en las opiniones políticas durante las elecciones.

― 9 minilectura


Influencia de las redesInfluencia de las redessociales en la políticamoldean las agendas políticas.Examinando cómo las redes sociales
Tabla de contenidos

Entender cómo la gente se comunica en las redes sociales, especialmente durante eventos políticos, es clave. Ciertas personas o grupos pueden influir en opiniones al promover ideas o acciones específicas. Esto puede suceder a través de mensajes en plataformas como Twitter. Por ejemplo, durante elecciones importantes, algunos influencers buscan cambiar la opinión pública a favor o en contra de candidatos. Este artículo habla sobre un método para identificar estas influencias en redes sociales con datos limitados y se centra en las Elecciones Presidenciales Francesas de 2022.

La Importancia de las Agendas

Una "agenda" se refiere a un conjunto de temas o ideas que se les da atención en un orden específico. Las agendas pueden afectar cómo actúan las personas, especialmente en conversaciones y relaciones. En este contexto, una agenda podría involucrar los motivos detrás de los mensajes, como guiar una conversación hacia el apoyo o la oposición a un candidato. Quienes controlan una agenda tienen un gran poder sobre su audiencia.

Al mirar campañas en línea, especialmente las relacionadas con asuntos políticos, los investigadores suelen investigar quién establece estas agendas-pueden ser medios tradicionales o grupos secretos en línea que buscan moldear la opinión pública. Hay tres niveles de establecimiento de agendas:

  1. Nivel Uno: Se le dice al público explícitamente qué pensar o hacer, como empujar a la gente a votar por un candidato específico.
  2. Nivel Dos: En lugar de decir a la gente en qué creer, los influencers destacan ciertas características de sus objetivos (por ej., hacer que un candidato parezca bueno o malo), permitiendo que el público forme sus propias opiniones.
  3. Nivel Tres: Esto involucra vincular múltiples objetivos, lo que influye en la percepción pública a través de comparaciones.

En este trabajo, nos enfocamos en los primeros dos niveles de establecimiento de agendas, especialmente durante las recientes elecciones francesas. Nuestro objetivo es identificar instancias donde se promuevan agendas a través de mensajes en redes sociales.

Metodología para la Detección de Agendas

Nos centramos en tuits, que incluyen mensajes originales, retuits, respuestas y citas, principalmente en francés pero también en inglés. La idea es etiquetar cada tuit según su tipo de agenda, incluso si esa agenda no está claramente establecida. Las etiquetas de agenda fueron desarrolladas por expertos en ciencias políticas, enfatizando llamados a la acción. Dadas las limitaciones de datos etiquetados en situaciones del mundo real, usamos muestras pequeñas anotadas por expertos y métodos que requieren pocos o ningún dato de entrenamiento.

Definimos una agenda como la intención detrás de un mensaje. Al demostrar que un tuit implica una agenda específica, podemos asignar la etiqueta apropiada. Para lograr esto, abordamos la detección de agendas como un problema de implicación textual, que ha mostrado resultados prometedores en estudios anteriores.

Trabajo Relacionado

Estudios previos han buscado formas de detectar influencias en mensajes de redes sociales. Los académicos han examinado cómo las agendas de los medios moldean la opinión pública y cómo las redes sociales interactúan con los medios de noticias tradicionales. Muchas veces, los investigadores dependen de análisis manuales para encontrar agendas cuando faltan grandes conjuntos de datos etiquetados. Esto puede implicar una codificación laboriosa de mensajes o artículos de noticias. Otros estudios han intentado métodos automatizados utilizando detección de palabras clave.

Recientemente, han surgido métodos de aprendizaje automático para analizar grandes conjuntos de datos. Un método implica modelar temas para descubrir temas subyacentes, seguido por expertos humanos que desarrollan etiquetas de agenda, que luego se usan para entrenar clasificadores. Muchos de estos enfoques pueden ser costosos e imprácticos, especialmente en situaciones de rápido cambio.

Implicación Textual y Clasificación de Textos

En la clasificación textual, los investigadores han creado marcos que tratan la tarea como una serie de pares de declaraciones, donde una es el texto a clasificar y la otra representa las etiquetas potenciales. Este enfoque imita la toma de decisiones humanas durante el proceso de etiquetado. Al aplicar este método, podemos mejorar la detección de agendas, especialmente en situaciones que carecen de abundantes datos etiquetados.

Para preparar nuestro modelo para la detección de agendas, utilizamos varios conjuntos de datos establecidos para ayudarle a aprender el concepto de implicación. Convertimos todos los datos en problemas de clasificación binaria y fusionamos ejemplos de entrenamiento para desarrollar un conjunto de entrenamiento robusto. Dado que nuestra tarea involucró tuits en inglés y francés, traducimos una parte de nuestros datos de entrenamiento para asegurar una cobertura de lenguaje diversa.

Creando el Conjunto de Datos de Agendas

Para desarrollar nuestro conjunto de datos de agendas, recolectamos tuits sobre las Elecciones Presidenciales Francesas de 2022. De un gran grupo de tuits, muestreamos el 10%. Después de limpiar los datos eliminando espacios en blanco innecesarios, aseguramos que los tuits cumplieran con el límite de caracteres de Twitter.

Para etiquetar los tuits, empleamos un método que calculó similitudes semánticas entre los textos de los tuits y las definiciones de agenda predefinidas. Usamos un modelo de incrustación de oraciones multilingüe para esto, lo que nos permitió asignar automáticamente etiquetas de agenda a los mensajes de mayor puntuación. Dos anotadores humanos revisaron estas asignaciones para confirmar la precisión, y trabajaron juntos para resolver cualquier discrepancia.

Entrenamiento y Evaluación

Creamos tres conjuntos separados para entrenamiento, desarrollo y prueba para asegurar una evaluación adecuada de nuestros modelos. Al examinar el desempeño de varios modelos, ajustamos nuestro proceso para determinar el nivel de confianza de las predicciones, estableciendo un umbral mínimo para etiquetar mensajes según las puntuaciones de probabilidad.

Resultados de los Modelos de Detección de Agendas

Al probar nuestros modelos en un entorno de cero disparos, los comparamos con varios modelos base. Nuestros hallazgos indicaron que los modelos entrenados con nuestros datos de agenda específicos tuvieron un rendimiento significativamente mejor que aquellos que utilizaron datos generales. Esto sugiere la efectividad de nuestro enfoque en la detección de agendas, incluso cuando enfrentamos ejemplos limitados.

En nuestros experimentos, notamos que los modelos que usaron implicación textual produjeron un rendimiento superior en comparación con los modelos de clasificación tradicionales. Esto fue particularmente cierto en el contexto multilingüe, donde un modelo específico entrenado con nuestros datos bilingües destacó en comparación con otros métodos.

Limitaciones y Desafíos

A pesar del éxito, reconocemos desafíos en nuestra investigación. Las fuentes de datos que utilizamos pueden introducir sesgos, y nuestro conjunto de datos de agenda es más pequeño que los típicamente requeridos para un entrenamiento robusto. El enfoque de aprendizaje de cero disparos enfatiza aún más la necesidad de hipótesis de alta calidad y la dificultad para generar una gama diversa de ejemplos.

Además, aunque nuestro modelo tuvo un buen desempeño, algunas predicciones no se alinearon con los mensajes reales, lo que llevó a casos de sobreetiquetado o etiquetas perdidas. Esto sugiere áreas de mejora, especialmente integrando conocimiento externo relevante al contexto.

Conclusión

La metodología desarrollada para detectar agendas a través de redes sociales muestra que es posible trabajar con datos anotados limitados. Nuestro trabajo destaca un ángulo prometedor al tratar la clasificación de textos como un problema de implicación textual. Este enfoque nos permitió clasificar mensajes con una amplia gama de agendas mientras manteníamos flexibilidad para futuras aplicaciones más allá de las redes sociales.

A través de nuestros hallazgos, esperamos contribuir con valiosos conocimientos sobre campañas de influencia, particularmente en contextos políticos, y sentar las bases para futuros estudios en el análisis de la comunicación a través de diferentes formatos mediáticos.

Nuestra investigación indica que entender y detectar agendas no se limita a solo una plataforma. Las técnicas que hemos descrito también pueden explorar cómo se difunden ideas a través de artículos de noticias y blogs. A medida que continuamos investigando este tema, buscamos descubrir insights más profundos y expandir nuestros métodos para incorporar varias formas de comunicación.

Consideraciones Éticas y Prácticas Responsables

A lo largo de nuestro estudio, mantuvimos un fuerte compromiso con consideraciones éticas en la recolección de datos, anotación y desarrollo de modelos. Esto implica asegurarnos de que nuestros esfuerzos estén diseñados para respetar la privacidad y minimizar el sesgo, al mismo tiempo que mantenemos la transparencia en nuestros procesos.

A medida que avanzamos, reconocemos la importancia de una evaluación continua de nuestros modelos y prácticas para asegurar la equidad y la responsabilidad en cómo abordamos la detección de agendas y el análisis de redes sociales. Al reflexionar sobre nuestro trabajo, esperamos contribuir positivamente al campo y apoyar el desarrollo de prácticas de IA responsables en la investigación.

Direcciones Futuras

Viendo hacia adelante, imaginamos varias áreas de crecimiento y exploración. Un camino podría involucrar refinar nuestras etiquetas de agenda y métodos para capturar mejor las sutilezas presentes en contextos variados o en diferentes idiomas. También vemos el potencial para desarrollar aún más nuestros modelos para integrar conocimiento de fuentes externas, lo que podría mejorar su rendimiento y adaptabilidad.

Al buscar diversas avenidas para la colaboración, buscamos seguir mejorando la calidad del discurso en redes sociales mientras aseguramos que nuestra investigación sea relevante y beneficiosa para la sociedad. Con la evolución continua de la tecnología de comunicación, siempre hay espacio para más indagaciones sobre cómo los mensajes influyen en el sentimiento público y las acciones sociales.

Al mantener el enfoque en estos objetivos, esperamos avanzar en el campo del análisis de redes sociales y contribuir a una comprensión más profunda de cómo la comunicación moldea opiniones y comportamientos en la sociedad.

Fuente original

Título: Uncovering Agendas: A Novel French & English Dataset for Agenda Detection on Social Media

Resumen: The behavior and decision making of groups or communities can be dramatically influenced by individuals pushing particular agendas, e.g., to promote or disparage a person or an activity, to call for action, etc.. In the examination of online influence campaigns, particularly those related to important political and social events, scholars often concentrate on identifying the sources responsible for setting and controlling the agenda (e.g., public media). In this article we present a methodology for detecting specific instances of agenda control through social media where annotated data is limited or non-existent. By using a modest corpus of Twitter messages centered on the 2022 French Presidential Elections, we carry out a comprehensive evaluation of various approaches and techniques that can be applied to this problem. Our findings demonstrate that by treating the task as a textual entailment problem, it is possible to overcome the requirement for a large annotated training dataset.

Autores: Gregorios Katsios, Ning Sa, Ankita Bhaumik, Tomek Strzalkowski

Última actualización: 2024-05-01 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2405.00821

Fuente PDF: https://arxiv.org/pdf/2405.00821

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares