Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Redes sociales y de información# Computación y lenguaje

Analizando teorías de conspiración en las discusiones de Twitter

Un estudio revela comportamientos y temas entre los usuarios de teorías de conspiración en Twitter en 2022.

― 9 minilectura


Análisis de usuarios deAnálisis de usuarios deconspiraciones en Twitterrelacionados con teorías decomportamientos de los usuariosEl estudio investiga los
Tabla de contenidos

En tiempos recientes, la discusión sobre teorías de conspiración se ha vuelto bastante común, especialmente por la desinformación que circula en línea. Muchos investigadores están tratando de estudiar estas teorías, enfocándose en dónde aparecen en plataformas de redes sociales como Twitter. Sin embargo, gran parte de esta investigación ha usado conjuntos de datos pequeños, limitando lo que podemos aprender.

En este estudio, introducimos una nueva manera de crear un conjunto de datos de Twitter. Este conjunto incluye cuentas de Twitter conocidas por compartir contenido relacionado con teorías de conspiración durante 2022. Nuestro método no está vinculado a ninguna teoría de conspiración específica ni a esfuerzos por difundir información falsa. También recopilamos un Grupo de Control de usuarios normales para comparar objetivamente con los usuarios de conspiración.

Nuestra recolección de datos resultó en alrededor de 15,000 usuarios y 37 millones de tweets. Al analizar estos dos grupos, observamos temas, perfiles de usuario y comportamientos. Encontramos que, aunque los perfiles de los usuarios de conspiración y los de control son similares, sus comportamientos y los temas que discuten son bastante diferentes. Por ejemplo, los usuarios involucrados en discusiones de conspiración tienden a usar un lenguaje específico y tienen opiniones fuertes sobre temas de tendencia. Curiosamente, la presencia de cuentas automatizadas, a menudo llamadas bots, fue baja en ambos grupos, lo que significa que los usuarios en ambas categorías son principalmente individuos reales.

También creamos un sistema para identificar a los usuarios de conspiración basándonos en varias características, algunas de las cuales los investigadores suelen usar para detectar usuarios problemáticos en línea. Nuestro método identificó con precisión a los usuarios de conspiración, logrando un alto nivel de precisión en nuestras pruebas.

Introducción

Las teorías de conspiración han existido durante mucho tiempo y se han vuelto más populares en las redes sociales en la última década. La propagación de la desinformación y la negación de evidencia científica contribuyen significativamente al aumento de teorías de conspiración. Estas teorías suelen presentar explicaciones alternativas para eventos significativos, alegando tramas secretas por parte de individuos o grupos con motivos poco claros. Ejemplos de tales teorías incluyen ideas inusuales sobre el cambio climático, eventos históricos como los ataques del 11 de septiembre, y reclamos más recientes relacionados con la pandemia de COVID-19.

Las plataformas de redes sociales, especialmente Twitter, han facilitado la rápida difusión de estas ideas de conspiración. Como resultado, muchas creencias de conspiración han surgido alrededor de varios temas, afectando cómo la gente percibe eventos y problemas en la sociedad.

Dado el impacto de estas teorías, a los investigadores les ha interesado entender cómo se difunden en línea y quiénes se involucran con ellas. Comprender las tendencias de las personas hacia estas teorías puede ofrecer información sobre cómo se forman y se transmiten las creencias. Sin embargo, la mayoría de los estudios se han centrado en temas de conspiración específicos, dificultando la comprensión de las tendencias más amplias en el compromiso con las conspiraciones.

Para llenar este vacío, creamos un conjunto de datos grande y equilibrado de 15,000 usuarios, con la mitad identificados como usuarios de conspiración y la otra mitad como un grupo de control de usuarios al azar. Recopilamos líneas de tiempo de 37 millones de tweets de estos usuarios, lo que nos permite explorar sus comportamientos y preferencias.

Estrategia de recolección de datos

Al construir nuestro conjunto de datos, el objetivo era reunir usuarios que probablemente estuvieran involucrados en discusiones sobre teorías de conspiración. Nuestro enfoque se centró en los "me gusta" de Twitter, que indican un respaldo más fuerte al contenido en comparación con compartir o comentar.

Recolección de usuarios de conspiración

Para identificar usuarios que probablemente fueran influenciados por teorías de conspiración, comenzamos con una lista de cuentas de Twitter relacionadas con conspiraciones de confianza. Luego reunimos información sobre los usuarios que han dado "me gusta" a las publicaciones de estas cuentas. Nuestro proceso involucró tres pasos principales:

  1. Identificando fuentes de conspiración: Creamos una lista de sitios web relacionados con conspiraciones calificados por una fuente creíble. Estos sitios fueron nuestro punto de partida para reunir cuentas de Twitter asociadas.

  2. Recolectando "me gusta": Recopilamos usuarios de Twitter que dieron "me gusta" a las publicaciones de nuestra lista de cuentas. Este paso es crucial, ya que dar "me gusta" a una publicación a menudo es un signo de apoyo a las ideas presentadas.

  3. Filtrando usuarios: Aplicamos filtros para garantizar que los usuarios seleccionados tuvieran interacciones consistentes a través de múltiples cuentas de conspiración. Buscamos un conjunto de datos equilibrado manteniendo tanto una variedad de fuentes a las que les dieron "me gusta" como el nivel general de actividad de los usuarios.

Usando este método, identificamos casi 7,400 usuarios de conspiración que dieron "me gusta" a diversas fuentes de conspiración. Recopilamos hasta 3,200 tweets de cada usuario, resultando en un conjunto de datos completo.

Recolección de usuarios aleatorios

Para comparar con nuestros usuarios de conspiración, también recopilamos un grupo de control de usuarios de Twitter al azar. Este grupo fue seleccionado para coincidir con los usuarios de conspiración en términos de temas discutidos y uso de lenguaje. Nuestro método de recolección involucró:

  1. Recolección de discusiones relacionadas con temas: Recopilamos tweets vinculados a hashtags populares usados por usuarios de conspiración.

  2. Extracción de usuarios: A partir de los tweets recopilados, identificamos usuarios distintos que discutieron estos temas.

  3. Filtrando usuarios aleatorios: Excluimos a cualquier usuario que hubiera interactuado con las cuentas de conspiración en nuestra lista original. Este paso garantizó que nuestro grupo de usuarios aleatorios no incluyera a nadie que pudiera clasificarse como conspirador.

A través de este proceso, compilamos otro grupo de 7,400 usuarios aleatorios, recolectando millones de tweets que proporcionan una base equilibrada para la comparación.

Análisis de grupos de usuarios

Después de reunir nuestros dos grupos de usuarios distintos, nos enfocamos en analizar las diferencias en sus comportamientos y preferencias. Consideramos tres áreas principales:

  1. Preferencias temáticas: Exploramos los principales temas discutidos por ambos grupos de usuarios.

  2. Metadatos de perfil: Observamos varias características de los perfiles de usuario, incluyendo cuándo fueron creados y otros rasgos identificables.

  3. Patrones de Comportamiento: Evaluamos cómo los usuarios interactúan en Twitter, incluyendo con qué frecuencia responden a otros y el lenguaje que utilizan en sus tweets.

Preferencias temáticas

Los temas discutidos por los usuarios revelan mucho sobre sus intereses y creencias. Identificamos los principales temas examinando los hashtags que aparecían frecuentemente en los tweets de ambos grupos.

Para los usuarios de conspiración, notamos un fuerte compromiso en discusiones sobre COVID-19, vacunas y varios temas políticos. Su lenguaje era a menudo más intenso, reflejando opiniones fuertes.

Los usuarios aleatorios, por otro lado, tendían a discutir una gama más amplia de temas, con algunos enfocándose en finanzas y criptomonedas. Usaban un lenguaje más moderado, indicando un enfoque más equilibrado en las discusiones.

Metadatos de perfil

A continuación, comparamos los perfiles de los usuarios de conspiración y de los usuarios aleatorios. Encontramos que, aunque sus perfiles a menudo mostraban características similares (como el número de seguidores y la antigüedad de la cuenta), sus interacciones variaban mucho.

Los usuarios de conspiración eran más vocales, participando a menudo en discusiones y respondiendo a otros, lo que refleja una tendencia a participar activamente en conversaciones en línea.

Patrones de comportamiento

Finalmente, analizamos los comportamientos de los usuarios basándonos en su actividad en tweets. Notamos que los usuarios de conspiración tenían una tasa de respuestas más alta en comparación con el grupo de usuarios aleatorios. Este hallazgo indica que los usuarios de conspiración son más propensos a participar en discusiones en lugar de simplemente compartir contenido.

En contraste, los usuarios aleatorios tendían a retuitear o compartir contenido sin tanta interacción directa, indicando un estilo de compromiso diferente.

Clasificación de usuarios de conspiración

Para entender mejor cómo identificar a los usuarios de conspiración, desarrollamos un sistema que utiliza varias características. Entrenamos varios modelos de aprendizaje automático para clasificar usuarios basándonos en sus tweets y actividades.

Nuestros clasificadores evaluaban características como:

  • Metadatos de perfil: Información disponible de los perfiles de usuario.
  • Características de comportamiento: Métricas de actividad del usuario, como la frecuencia de tweets y tasas de respuesta.
  • Características lingüísticas: Análisis de los estilos de lenguaje utilizados en tweets.

Al combinar estas características, pudimos identificar con precisión a los usuarios más involucrados en discusiones sobre teorías de conspiración.

Desempeño de los clasificadores

Los resultados de nuestros clasificadores fueron prometedores. Logramos una alta precisión y pudimos distinguir efectivamente a los usuarios de conspiración de los aleatorios. Las características lingüísticas resultaron ser particularmente valiosas para identificar a los usuarios de conspiración. Por ejemplo, la manera en que los usuarios usaban ciertas palabras y frases facilitó su clasificación correcta.

Conclusión

El auge de las teorías de conspiración en las redes sociales tiene implicaciones significativas tanto para individuos como para la sociedad. Nuestro estudio ofrece una exploración detallada de las características de los usuarios que participan en discusiones relacionadas con conspiraciones en Twitter.

Al crear un conjunto de datos grande, pudimos analizar eficazmente las diferencias entre usuarios de conspiración y usuarios regulares. Nuestros hallazgos destacan la importancia de entender el comportamiento de los usuarios, los temas discutidos y las elecciones lingüísticas al tratar de identificar y abordar las creencias de conspiración en línea.

La metodología que desarrollamos puede servir como modelo para futuras investigaciones, enfocándose en analizar la dinámica y los comportamientos en redes sociales relacionados con las teorías de conspiración. Nuestro trabajo contribuye al esfuerzo en curso por combatir la desinformación y proporciona herramientas para comprender mejor cómo las teorías de conspiración se arraigan en las comunidades en línea.

Fuente original

Título: The Anatomy of Conspirators: Unveiling Traits using a Comprehensive Twitter Dataset

Resumen: The discourse around conspiracy theories is currently thriving amidst the rampant misinformation in online environments. Research in this field has been focused on detecting conspiracy theories on social media, often relying on limited datasets. In this study, we present a novel methodology for constructing a Twitter dataset that encompasses accounts engaged in conspiracy-related activities throughout the year 2022. Our approach centers on data collection that is independent of specific conspiracy theories and information operations. Additionally, our dataset includes a control group comprising randomly selected users who can be fairly compared to the individuals involved in conspiracy activities. This comprehensive collection effort yielded a total of 15K accounts and 37M tweets extracted from their timelines. We conduct a comparative analysis of the two groups across three dimensions: topics, profiles, and behavioral characteristics. The results indicate that conspiracy and control users exhibit similarity in terms of their profile metadata characteristics. However, they diverge significantly in terms of behavior and activity, particularly regarding the discussed topics, the terminology used, and their stance on trending subjects. In addition, we find no significant disparity in the presence of bot users between the two groups. Finally, we develop a classifier to identify conspiracy users using features borrowed from bot, troll and linguistic literature. The results demonstrate a high accuracy level (with an F1 score of 0.94), enabling us to uncover the most discriminating features associated with conspiracy-related accounts.

Autores: Margherita Gambini, Serena Tardelli, Maurizio Tesconi

Última actualización: 2024-02-05 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2308.15154

Fuente PDF: https://arxiv.org/pdf/2308.15154

Licencia: https://creativecommons.org/licenses/by-nc-sa/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares