Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico# Calcolo e linguaggio# Reti sociali e informative

Etichettare le posizioni degli utenti sui social media

Un metodo per classificare le opinioni degli utenti dei social media su questioni chiave tramite hashtag e interazioni.

― 6 leggere min


Classificazione dellaClassificazione dellaposizione sui socialmediautenti su argomenti controversi.Metodo per analizzare le opinioni degli
Indice

I social media sono diventati un posto comune per condividere opinioni e discutere di questioni politiche. Tuttavia, i cambiamenti rapidi e l'enorme quantità di contenuti su queste piattaforme possono rendere difficile capire cosa pensano davvero le persone. Questo lavoro si concentra su un metodo per etichettare la Posizione degli utenti dei social media, soprattutto analizzando gli hashtag che usano e come interagiscono con gli altri sulla piattaforma. Spezzando il tutto in due fasi, l'obiettivo è creare un quadro più chiaro delle posizioni degli utenti, specialmente su argomenti importanti come il cambiamento climatico e il controllo delle armi.

La Sfida di Comprendere la Posizione degli Utenti

L'enorme volume di contenuti sui social media significa che molte opinioni esistono contemporaneamente. Anche se questo può permettere la condivisione di diverse opinioni, può anche portare a una situazione in cui le persone interagiscono solo con chi la pensa come loro, creando camere d'eco. La ricerca ha dimostrato che gli utenti diventano più polarizzati col tempo, in particolare su questioni delicate. Questa polarizzazione può influenzare aree importanti come le decisioni di finanziamento, le scelte relazionali e il modo in cui le persone rispondono alle informazioni sulla salute pubblica.

Due Tipi di Polarizzazione

Quando si guarda alla polarizzazione online, i ricercatori si concentrano spesso su due forme principali: polarizzazione interazionale e Polarizzazione Affettiva.

Polarizzazione Interazionale

La polarizzazione interazionale avviene quando gli utenti parlano solo con altri che condividono le loro opinioni. Questo può distorcere il modo in cui vedono diversi punti di vista, rinforzando le loro credenze senza metterle in discussione. Queste camere d'eco possono rendere difficile avere discussioni aperte e possono aumentare le tensioni tra i gruppi.

Polarizzazione Affettiva

La polarizzazione affettiva riguarda i sentimenti che le persone hanno verso chi ha opinioni opposte. Spesso comporta sentimenti negativi rivolti a gruppi che non condividono le stesse opinioni. Questo tipo di polarizzazione può essere più difficile da studiare perché di solito implica la raccolta di dati manualmente, il che può essere lento e complicato.

La Necessità di un Migliore Etichettamento delle Posizioni

Etichettare le posizioni degli utenti è un compito difficile perché il linguaggio sui social media è spesso informale e caotico. Gli utenti potrebbero usare sarcasmo, ironia o altri segnali che possono confondere i sistemi automatizzati. Questa complessità significa che è cruciale sviluppare metodi che possano considerare sia ciò che le persone scrivono sia come interagiscono con gli altri sui social media.

Il Metodo Proposto

Per affrontare questo problema, verrà introdotto un metodo di etichettamento delle posizioni in due fasi.

Fase Uno: Relazioni Utente-Hashtag

Nella prima fase, verrà creato un grafo bipartito che collega gli utenti agli hashtag che usano. Questo grafo aiuta a catturare come gli utenti sono collegati attraverso gli hashtag che postano. Esaminando queste connessioni, è possibile iniziare a etichettare gli utenti in base agli hashtag che usano frequentemente. Più un utente pubblica un determinato hashtag associato a una posizione, più forte diventa quella connessione.

Fase Due: Interazioni degli utenti

La seconda fase coinvolge l'analisi di come gli utenti interagiscono tra di loro. Questo viene fatto costruendo un grafo di interazione degli utenti, che include azioni come retweetare, menzionare o rispondere ad altri. Analizzando sia gli hashtag sia le interazioni, è possibile determinare una posizione più chiara per ogni utente.

Raccolta Dati

Per mettere alla prova il metodo, verranno raccolti dati da tweet su due questioni importanti: cambiamento climatico e controllo delle armi. Verranno utilizzate parole chiave specifiche relative a questi argomenti per raccogliere tweet su determinati periodi. In questo modo, cattureremo discussioni significative riguardanti queste questioni.

Dati sul Cambiamento Climatico

Per il cambiamento climatico, i tweet verranno raccolti da giugno 2021 a giugno 2022. Il dataset includerà milioni di tweet e migliaia di utenti unici, permettendo un'analisi completa di come le persone discutono del cambiamento climatico.

Dati sul Controllo delle Armi

Per il controllo delle armi, verranno raccolti tweet pubblicati tra gennaio 2022 e dicembre 2022. Simile al dataset sul cambiamento climatico, includerà milioni di tweet e un'ampia gamma di utenti per esaminare il discorso sul controllo delle armi.

Analizzare l'Etichettamento della Posizione Utente-Hashtag

Una volta raccolti i tweet, il primo passo sarà costruire il grafo bipartito utente-hashtag. Questo grafo collegherà gli utenti con gli hashtag in base ai loro post.

Hashtag Seed

Verrà definito un piccolo set di hashtag seed per ogni posizione. Questi hashtag seed serviranno come punto di partenza per assegnare etichette di posizione agli utenti che li usano frequentemente. Con il progresso dell'etichettamento, agli utenti verranno assegnate etichette di posizione specifiche in base agli hashtag che usano.

Processo di Propagazione

Il metodo prevede un processo di propagazione dove la posizione associata agli hashtag seed si diffonde agli utenti connessi attraverso gli hashtag. Agli utenti verranno assegnate etichette in base a quanto spesso usano gli hashtag di ciascun gruppo di posizioni. Questo metodo consente un modo rapido ed efficiente per etichettare gli utenti, sebbene alcuni utenti che non usano hashtag possano rimanere non etichettati.

Utilizzare le Reti Neurali di Grafo per l'Etichettamento delle Posizioni

Dopo la prima fase, il passo successivo sarà migliorare l'approccio utilizzando reti neurali di grafo (GNN). Questo metodo consente un'analisi più profonda delle interazioni degli utenti e aiuterà a colmare le lacune lasciate dal metodo degli hashtag.

Costruire il Grafo di Interazione degli Utenti

Questo grafo collegherà gli utenti in base alle loro interazioni. Ogni interazione avrà un peso assegnato in base al sentimento del tweet. Analizzando questo grafo, la GNN può imparare a fare previsioni migliori sulle posizioni degli utenti.

Addestramento della GNN

Addestrare la GNN comporterà combinare le informazioni delle interazioni degli utenti e degli utenti etichettati in precedenza. Il modello sarà addestrato per classificare le posizioni degli utenti in base a queste informazioni combinate.

Risultati

Il metodo proposto sarà testato rispetto agli approcci esistenti per vedere quanto bene performa. L'efficacia sarà misurata in termini di precisione, richiamo e performance complessiva nella classificazione delle posizioni degli utenti.

Risultati del Dataset sul Controllo delle Armi

I risultati per il dataset sul controllo delle armi si aspettano di mostrare che il metodo basato sulla GNN supererà altri modelli. Questo dataset aiuterà a illustrare quanto bene funziona l'approccio per un argomento guidato da eventi.

Risultati del Dataset sul Cambiamento Climatico

I risultati per il dataset sul cambiamento climatico probabilmente forniranno spunti sulle sfide dell'etichettamento delle posizioni su argomenti meno guidati da eventi.

Conclusione

Questa ricerca mira ad affrontare la sfida di comprendere le posizioni degli utenti sulle piattaforme social. Combinando l'analisi del testo e le interazioni sociali, si propone un quadro più completo per l'etichettamento delle posizioni. Man mano che i social media continuano a crescere, capire come misurare e analizzare le opinioni su questioni importanti diventa vitale per promuovere discussioni aperte e migliorare la comprensione sociale.

I risultati di questa ricerca potrebbero fornire preziose intuizioni per migliorare il dibattito politico e gli studi sulla polarizzazione.

Fonte originale

Titolo: Two-Stage Stance Labeling: User-Hashtag Heuristics with Graph Neural Networks

Estratto: The high volume and rapid evolution of content on social media present major challenges for studying the stance of social media users. In this work, we develop a two stage stance labeling method that utilizes the user-hashtag bipartite graph and the user-user interaction graph. In the first stage, a simple and efficient heuristic for stance labeling uses the user-hashtag bipartite graph to iteratively update the stance association of user and hashtag nodes via a label propagation mechanism. This set of soft labels is then integrated with the user-user interaction graph to train a graph neural network (GNN) model using semi-supervised learning. We evaluate this method on two large-scale datasets containing tweets related to climate change from June 2021 to June 2022 and gun control from January 2022 to January 2023. Our experiments demonstrate that enriching text-based embeddings of users with network information from the user interaction graph using our semi-supervised GNN method outperforms both classifiers trained on user textual embeddings and zero-shot classification using LLMs such as GPT4. We discuss the need for integrating nuanced understanding from social science with the scalability of computational methods to better understand how polarization on social media occurs for divisive issues such as climate change and gun control.

Autori: Joshua Melton, Shannon Reid, Gabriel Terejanu, Siddharth Krishnan

Ultimo aggiornamento: 2024-05-17 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2404.10228

Fonte PDF: https://arxiv.org/pdf/2404.10228

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili