Analizando opiniones en redes sociales
Un nuevo modelo predice las opiniones de los usuarios en las redes sociales con un mínimo esfuerzo de etiquetado.
― 11 minilectura
Tabla de contenidos
- Las Redes Sociales como Herramienta de Investigación
- El Método Propuesto
- Investigación Anterior
- Conexiones de Usuarios y Grafos Sociales
- El Enfoque de Filtrado Colaborativo
- El Estudio en Chile
- Metodología y Procesamiento de Datos
- Clasificación de Posturas Basada en Hashtags
- Arquitectura del Modelo
- Experimentación y Resultados
- Impacto de Información Adicional
- Reducción de Esfuerzos de Anotación
- Conclusión
- Fuente original
- Enlaces de referencia
Las Redes Sociales son una plataforma donde la gente comparte libremente sus pensamientos, sentimientos y Opiniones sobre varios temas. Esta comunicación abierta hace que las redes sociales sean un recurso valioso para entender el sentimiento público, especialmente durante eventos divisivos como las elecciones. Los Usuarios a menudo expresan sus puntos de vista y animan a otros a apoyar su lado usando símbolos específicos, como los Hashtags. Sin embargo, algunos usuarios no usan hashtags, hablan en diferentes idiomas o insinúan sus opiniones sin ser directos. Esto hace que sea difícil identificar automáticamente sus puntos de vista.
Para abordar este desafío, se propuso un nuevo modelo. Este modelo se basa en una tecnología que analiza las conexiones entre los usuarios y el contenido que comparten. El objetivo es identificar las opiniones de las personas con un esfuerzo mínimo en etiquetar datos en comparación con métodos más tradicionales. A pesar de su simplicidad, este modelo ha demostrado que puede predecir con éxito las opiniones de los individuos. El modelo fue probado en las actitudes de los usuarios durante dos referendos constitucionales en Chile en 2020 y 2022. Se encontró que era mejor que los métodos anteriores en términos de precisión y recuperación.
Las Redes Sociales como Herramienta de Investigación
Los investigadores ven las redes sociales, especialmente Twitter, como una fuente importante para la investigación social. Con más de 353 millones de usuarios activos, Twitter es popular para discutir eventos actuales y problemas sociales. Los investigadores usan Twitter para estudiar muchos aspectos de la sociedad, como el impacto de los medios, las reacciones del mercado de valores y las tendencias políticas.
Un problema clave al usar redes sociales para la investigación es averiguar qué piensan los usuarios sobre temas específicos. Por ejemplo, saber hacia dónde se inclinan políticamente puede ofrecer información sobre movimientos políticos, resultados electorales y tácticas de marketing. Estudios anteriores han utilizado diversos métodos para determinar las opiniones de los usuarios basándose en palabras clave o hashtags. Sin embargo, este enfoque puede llevar a sesgos, ya que no todos usan el mismo lenguaje o etiquetas al publicar. Además, estos métodos suelen ser caros y pueden no captar la verdadera postura de los usuarios.
Además, centrarse solo en indicadores obvios puede pasar por alto pistas valiosas. La gente a menudo participa en discusiones sin declarar directamente su opinión. Por ejemplo, un usuario podría no tuitear su postura política, pero podría interactuar con contenido al darle “me gusta” o compartir publicaciones de su político favorito. Por lo tanto, es esencial considerar una gama más amplia de interacciones de los usuarios para obtener una imagen completa.
El Método Propuesto
El nuevo enfoque utiliza una herramienta de Análisis de Redes que se centra en diversas conexiones entre usuarios y hashtags. Dado que el modelo no depende en gran medida de etiquetas directas o palabras clave, requiere mucho menos esfuerzo en términos de etiquetado de usuarios para diferentes temas. Esta flexibilidad permite aplicarlo con relativa facilidad a problemas del mundo real.
El modelo representa efectivamente las opiniones de los usuarios en un espacio que revela sus inclinaciones hacia diversos puntos de vista. En lugar de simplemente categorizar las opiniones como positivas o negativas, puede mostrar posiciones matizadas. Al ser probado, el modelo superó a los métodos tradicionales, demostrando mejoras tanto en precisión como en recuperación.
Investigación Anterior
Para entender el lugar del nuevo modelo en la investigación, necesitamos mirar trabajos anteriores. La detección de postura implica identificar lo que individuos o grupos piensan sobre temas específicos. Esta área ha ganado tracción a medida que más discusiones públicas se trasladan a plataformas de redes sociales. Twitter, en particular, es valioso debido a su amplia base de usuarios y debates animados.
Sin embargo, la naturaleza informal de las redes sociales presenta desafíos únicos. Publicaciones cortas, jerga y lenguaje casual pueden complicar las técnicas tradicionales de minería de opiniones. Reconociendo esto, estudios más recientes comenzaron a explorar elementos más característicos de las interacciones en redes sociales. Los usuarios pueden expresar sus puntos de vista usando emojis o hashtags únicos, que pueden actuar como indicadores de su postura.
Conexiones de Usuarios y Grafos Sociales
Dada la variedad de opiniones en redes sociales, es crucial mirar más allá de solo palabras clave. La idea de "homofilia" sugiere que las personas son más propensas a conectarse con otros que comparten opiniones similares. Los investigadores han explorado varios tipos de conexiones en plataformas como Twitter, incluidas relaciones de seguimiento e interacciones mutuas.
Estudios recientes han creado diferentes tipos de grafos sociales para analizar estas relaciones. Estos grafos pueden basarse en cómo los usuarios interactúan entre sí, por ejemplo, a través de amistades, menciones o intereses compartidos. El enfoque analiza más que solo relaciones directas, integrando diversas interacciones de usuarios como “me gusta”, retweets y respuestas. Estas interacciones ayudan a construir una visión integral de las opiniones de los usuarios.
El Enfoque de Filtrado Colaborativo
La mayoría de los esfuerzos de minería de opiniones se centran en entrenar modelos para clasificar opiniones. Sin embargo, una perspectiva de sistema de recomendación también puede ser beneficiosa. En este caso, el objetivo cambia a predecir cómo se sienten los usuarios sobre temas u opiniones específicas.
Dos métodos principales en sistemas de recomendación incluyen métodos de factorización de matrices y análisis de grafos usuario-artículo. La factorización de matrices funciona descomponiendo las interacciones entre usuarios y artículos en representaciones de menor dimensión. Otros marcos han intentado mejorar estos métodos, pero la factorización de matrices tradicional a menudo sigue siendo efectiva.
Por otro lado, usar grafos usuario-artículo permite capturar relaciones más sutiles. Desarrollos recientes han llevado a la creación de un marco que captura información de los vecinos de los usuarios para mejorar la calidad de las recomendaciones.
El Estudio en Chile
El estudio de caso se centró en dos referendos importantes en Chile que ocurrieron en 2020 y 2022. En 2019, el país enfrentó protestas significativas relacionadas con preocupaciones económicas e inequidades sociales. El gobierno acordó llevar a cabo un referendo sobre la constitución existente, que fue altamente controvertido.
El primer plebiscito en octubre de 2020 preguntó si debería redactarse una nueva constitución. La mayoría apoyó esto. Sin embargo, después de una extensa campaña política, la propuesta de nueva constitución fue rechazada en el segundo plebiscito, con un 62% votando en contra.
Dada la popularidad de Twitter en Chile, se eligió como la principal fuente de datos. El estudio comenzó recolectando tweets de medios de comunicación que atienden a la audiencia chilena. Este enfoque buscaba recopilar información de usuarios informados que probablemente tengan opiniones bien formadas.
Para reducir el ruido en el análisis, los investigadores limitaron su enfoque a usuarios que seguían un máximo de diez medios de comunicación, ayudando a excluir cuentas automatizadas. Estos esfuerzos resultaron en un conjunto de datos sustancial con miles de usuarios y tweets que capturan discusiones públicas durante las campañas políticas.
Metodología y Procesamiento de Datos
El proceso para predecir las posturas de los usuarios involucró analizar las conexiones entre usuarios de Twitter y hashtags. Las relaciones se representaron como un grafo, con usuarios y hashtags como nodos conectados por aristas. Las aristas representaban con qué frecuencia los usuarios interactuaban con ciertos hashtags, ayudando a crear un conjunto de datos listo para el análisis.
Antes de profundizar en el modelo, los datos pasaron por varios pasos de limpieza y procesamiento, como codificación y eliminación de caracteres o información irrelevante. Además, se aplicaron lematización y stemming, asegurando que el análisis se centrara en las palabras raíz.
Clasificación de Posturas Basada en Hashtags
Mientras que investigaciones previas a menudo se centraban extensamente en los hashtags para inferir opiniones, este modelo toma un enfoque diferente. Solo un número limitado de hashtags fue anotado manualmente para ahorrar tiempo y esfuerzo. Los investigadores seleccionaron los hashtags más comúnmente usados relacionados con los referendos para fines de clasificación, categorizándolos en grupos según su postura.
Este método no solo reduce la carga de trabajo para los investigadores, sino que también permite flexibilidad para capturar nuevos hashtags a medida que surgen en las discusiones. Al centrarse en hashtags relevantes, el modelo se vuelve más eficiente en predecir las opiniones de los usuarios.
Arquitectura del Modelo
El modelo propuesto utilizó una arquitectura integral para analizar interacciones entre usuarios y hashtags mientras integraba varios tipos de información. El objetivo era aprender mejores representaciones de los usuarios y sus opiniones a través de múltiples capas de análisis de redes.
La idea clave era agregar información de varios tipos de conexiones, actualizando las representaciones de usuarios y hashtags de manera iterativa para capturar las características más relevantes. Esto ayudó al modelo a mantener una comprensión clara de las preferencias y opiniones de los usuarios.
Experimentación y Resultados
La efectividad del modelo se validó a través de extensos experimentos utilizando los conjuntos de datos de Twitter recolectados. Se probaron diferentes enfoques, comparando el modelo propuesto con métodos establecidos. Los resultados demostraron que el nuevo modelo superó consistentemente en la predicción de opiniones y afinidades de los usuarios.
El rendimiento a nivel de arista reflejó qué tan bien podía el modelo predecir preferencias basadas en las interacciones de los usuarios, mientras que el rendimiento a nivel de usuario evaluó la precisión general de las predicciones de postura. Los resultados sugirieron que el enfoque podría captar efectivamente opiniones matizadas de manera continua en lugar de usar clasificaciones simples.
Impacto de Información Adicional
Integrar fuentes de datos adicionales en el modelo mejoró significativamente su rendimiento. Al agregar información semántica de hashtags y conexiones sociales entre usuarios, las predicciones del modelo se volvieron más precisas.
Sin embargo, los desafíos de combinar múltiples tipos de información fueron evidentes. Las interacciones no siempre llevaron a un mejor rendimiento general, sugiriendo que es necesario un equilibrio cuidadoso. Investigaciones futuras podrían explorar mejores maneras de integrar diferentes características para mejorar los resultados.
Reducción de Esfuerzos de Anotación
Una de las ventajas más notables del modelo propuesto es su mínima necesidad de anotaciones manuales. A diferencia de métodos anteriores que requerían un etiquetado extenso, este modelo puede operar eficientemente con solo algunos hashtags clave identificados por expertos.
Como mostró el análisis, un aumento en el número de hashtags anotados llevó a una mejor precisión. Sin embargo, las ganancias de rendimiento comenzaron a estabilizarse después de cierto punto, lo que indica que una anotación mínima aún podría generar resultados confiables.
Conclusión
En resumen, este estudio buscó predecir las opiniones de los usuarios de redes sociales sobre temas específicos combinando análisis de contenido y datos de interacción social. El modelo propuesto demostró su capacidad para inferir actitudes de los usuarios de manera efectiva con menos esfuerzo de anotación, mostrando mejoras sobre los métodos tradicionales.
La investigación destacó cómo diferentes tipos de relaciones y fuentes de información pueden influir positivamente en las predicciones. Si bien combinar múltiples aspectos presentó desafíos, el enfoque general proporcionó una base sólida para futuras exploraciones en la comprensión de la dinámica de las redes sociales y las opiniones de los usuarios.
El trabajo futuro se centrará en refinar el modelo e identificar cambios en las opiniones de los usuarios a lo largo del tiempo. A medida que el panorama de las redes sociales continúa evolucionando, entender estas dinámicas será crucial para investigadores, comerciantes y responsables políticos por igual.
Título: Stance Inference in Twitter through Graph Convolutional Collaborative Filtering Networks with Minimal Supervision
Resumen: Social Media (SM) has become a stage for people to share thoughts, emotions, opinions, and almost every other aspect of their daily lives. This abundance of human interaction makes SM particularly attractive for social sensing. Especially during polarizing events such as political elections or referendums, users post information and encourage others to support their side, using symbols such as hashtags to represent their attitudes. However, many users choose not to attach hashtags to their messages, use a different language, or show their position only indirectly. Thus, automatically identifying their opinions becomes a more challenging task. To uncover these implicit perspectives, we propose a collaborative filtering model based on Graph Convolutional Networks that exploits the textual content in messages and the rich connections between users and topics. Moreover, our approach only requires a small annotation effort compared to state-of-the-art solutions. Nevertheless, the proposed model achieves competitive performance in predicting individuals' stances. We analyze users' attitudes ahead of two constitutional referendums in Chile in 2020 and 2022. Using two large Twitter datasets, our model achieves improvements of 3.4% in recall and 3.6% in accuracy over the baselines.
Autores: Zhiwei Zhou, Erick Elejalde
Última actualización: 2023-03-30 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2303.15532
Fuente PDF: https://arxiv.org/pdf/2303.15532
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://www.acm.org/publications/taps/whitelist-of-latex-packages
- https://dl.acm.org/ccs.cfm
- https://www.statista.com/statistics/303681/twitter-users-worldwide/
- https://github.com/imzzhou/StanceInferenceInTwitter.git
- https://www.statista.com/topics/6985/social-media-usage-in-chile/
- https://doi.org/10.3030/101021866