Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Reti sociali e informative# Computer e società

Analizzando il Comportamento degli Utenti su Bluesky Social

Un dataset completo che mostra le interazioni e le tendenze degli utenti su Bluesky Social.

― 6 leggere min


Tendenze degli utenti suTendenze degli utenti suBluesky Socialcondivisione dei contenuti.interazioni degli utenti e laUno studio rivela informazioni sulle
Indice

I social media sono una parte importante delle nostre vite oggi, ma affrontano seri problemi come la disinformazione e le fake news. Non è solo una preoccupazione per gli utenti; anche i ricercatori faticano a studiare queste questioni. Una delle principali ragioni di questa difficoltà è che molti siti di social media hanno recentemente cambiato le loro regole, rendendo difficile accedere ai dati che possono aiutare a capire il comportamento online.

Per risolvere questo, presentiamo un grande dataset di Bluesky Social, che è una piattaforma relativamente nuova. Questo dataset include Post e interazioni di milioni di utenti, rendendolo una risorsa preziosa per studiare il comportamento sui social media.

Comprendere Bluesky Social

Bluesky Social è stata lanciata a febbraio 2023 e ha rapidamente attirato l'attenzione, soprattutto da parte di utenti che cercavano di migrare da altre piattaforme come Twitter. All'inizio, gli utenti potevano unirsi alla piattaforma solo su invito, ma presto si è aperta a tutti. Entro novembre 2023, Bluesky aveva oltre tre milioni di utenti. A febbraio 2024, quel numero era salito a cinque milioni.

La piattaforma consente agli utenti di postare messaggi brevi, condividere immagini e interagire con altri utenti mettendo "mi piace", condividendo o commentando i post. Una caratteristica unica di Bluesky è la sua funzionalità di feed. Gli utenti possono scegliere diversi algoritmi per personalizzare i loro feed in base ai loro interessi. Questo apre possibilità per studiare come queste scelte influenzano cosa vedono le persone e come interagiscono con i contenuti.

Il Dataset

Il nostro dataset include una ricchezza di informazioni da Bluesky Social. Copre:

  • Oltre 4 milioni di account Utente.
  • 235 milioni di post fatti da questi utenti.
  • Dettagli su come gli utenti interagiscono, inclusi "mi piace", condivisioni e commenti.

Questi dati ci permettono di studiare come le persone si comportano online, come condividono contenuti e come gli algoritmi influenzano la loro esperienza.

Processo di Raccolta Dati

La raccolta di questi dati è avvenuta in alcuni passaggi:

  1. Raccolta Informazioni sugli Utenti: Nel primo passaggio, abbiamo raccolto informazioni sui follower dall'account ufficiale di Bluesky. Abbiamo usato un metodo che ci ha permesso di trovare nuovi utenti esplorando i follower di quelli che avevamo già trovato.

  2. Raccolta Post: Nella seconda fase, abbiamo raccolto i post degli utenti che avevamo identificato. Abbiamo fatto in modo di includere tutti i post condivisi durante un certo periodo, totalizzando oltre 237 milioni di post.

  3. Monitoraggio delle Interazioni: Nella fase finale, abbiamo esaminato come gli utenti interagivano con i post. Questo includeva informazioni su chi ha messo "mi piace" a un post e quando lo ha fatto.

Raccogliendo attentamente questi dati, ci siamo assicurati che fossero utili per una varietà di scopi di ricerca.

Considerazioni Etiche

Quando si tratta di dati online, la privacy è fondamentale. Bluesky ha una chiara politica sulla privacy che afferma che tutte le informazioni condivise dagli utenti sono pubbliche. Ci siamo assicurati di rispettare la privacy degli utenti rimuovendo i nomi utente dal nostro dataset e sostituendoli con ID numerici. Non abbiamo raccolto dettagli identificativi personali per mantenere i dati il più sicuri possibile.

Analisi dei Dati

Con il dataset a disposizione, possiamo analizzare vari aspetti del comportamento degli utenti e della dinamica della piattaforma:

Coinvolgimento degli Utenti

Circa il 58% degli utenti su Bluesky ha condiviso almeno un post. In media, questi utenti hanno creato circa 99 post ciascuno, con una mediana di soli 8 post. Questo indica che mentre alcuni utenti sono molto attivi, molti altri non lo sono così tanto.

Condivisione dei Contenuti

Dei post totali, circa il 27% erano condivisioni di contenuti di altri utenti, e circa il 5% erano citazioni. Questo mostra che gli utenti interagiscono frequentemente con i contenuti degli altri, favorendo un senso di comunità. Abbiamo anche identificato 20 milioni di thread di discussione con 88 milioni di risposte, suggerendo che le conversazioni avvengono regolarmente sulla piattaforma.

Tendenze dei Post

Abbiamo osservato tendenze nell'Attività di posting quotidiano. I post sono generalmente aumentati da marzo a novembre e si sono stabilizzati attorno a un milione di post giornalieri. Si è verificato un picco significativo a febbraio 2024 quando è stata sollevata la politica dell'invito solo, raddoppiando il coinvolgimento degli utenti.

Attività degli Utenti

Analizzando più in profondità l'attività degli utenti, abbiamo scoperto che il 50% degli utenti era attivo per almeno 50 giorni. Coloro che si sono uniti durante la fase dell'invito-only erano generalmente più attivi per periodi più lunghi rispetto ai nuovi utenti che si sono uniti successivamente.

Diversità Linguistica

Bluesky supporta più lingue, e abbiamo trovato post in 227 tag diversi. L'inglese era la lingua più comune, seguita dal giapponese e dal tedesco. La presenza di post multilingue rende la piattaforma adatta a vari studi linguistici.

Funzionalità del Feed

I generatori di feed su Bluesky consentono agli utenti di personalizzare cosa vedere. Abbiamo raccolto post da 11 feed diversi coprendo argomenti che vanno dalla politica alla scienza e anche interessi di nicchia come il gaming. Questo serve come una finestra su come gli utenti interagiscono con argomenti specifici.

Analisi del Sentiment

Abbiamo anche esaminato il sentimento dietro ai post. Dei post in inglese analizzati, il 32% erano positivi, il 27% negativi e il 41% neutrali. I tassi di sentimento giornalieri mostravano che le persone esprimevano più sentimenti positivi in generale, anche se ci sono stati picchi di sentiment negativi durante eventi particolari.

Reazione agli Eventi

Abbiamo notato che alcuni picchi di attività e sentimento coincidevano con eventi del mondo reale. Ad esempio, le discussioni su questioni razziali sono aumentate dopo un incidente riportato sulla piattaforma. Queste reazioni forniscono spunti su come fattori esterni influenzano il comportamento degli utenti online.

Visualizzazione dei Dati

Per comunicare efficacemente i nostri risultati, abbiamo prodotto visualizzazioni che mostrano interazioni degli utenti, conteggi dei post e l'intera rete di relazioni su Bluesky. Queste visualizzazioni possono aiutare altri a capire la dinamica della piattaforma a colpo d'occhio.

Struttura della Rete Sociale

Abbiamo modellato le connessioni tra gli utenti in base a chi segue chi. Il grafico risultante mostra che alcuni account hanno un numero vasto di follower, mentre la maggior parte degli utenti ha solo poche connessioni. Questo rispecchia i modelli visti in altri social network, come Facebook o Twitter.

Reti di Interazione

Analizzando come gli utenti interagiscono attraverso repliche, repost e citazioni, possiamo costruire una mappa del coinvolgimento sulla piattaforma. Questo consente ai ricercatori di studiare come le idee e i contenuti si diffondono nella rete.

Direzioni Future di Ricerca

Il dataset apre numerose strade per la ricerca. I ricercatori possono esaminare argomenti come:

  • L'impatto delle scelte algoritmiche sull'esperienza degli utenti.
  • Come si diffonde la disinformazione e come gli utenti la rilevano.
  • I modelli di migrazione degli utenti da altre piattaforme a Bluesky.

Studi futuri possono anche esplorare se i sentimenti e le tendenze osservate in inglese si riflettono in altre lingue, offrendo una visione più completa del coinvolgimento degli utenti.

Conclusione

Il nostro dataset di Bluesky Social fornisce una base solida per studiare il comportamento online nel contesto dei social media. È una risorsa preziosa per i ricercatori che mirano a capire come gli utenti interagiscono, condividono informazioni e rispondono ai contenuti in un ambiente digitale in rapida evoluzione.

Rendendo disponibile questo dataset al pubblico, speriamo di incoraggiare ulteriori esplorazioni e analisi, promuovendo una migliore comprensione delle comunità online e delle loro complessità.

Fonte originale

Titolo: "I'm in the Bluesky Tonight": Insights from a Year Worth of Social Data

Estratto: Pollution of online social spaces caused by rampaging d/misinformation is a growing societal concern. However, recent decisions to reduce access to social media APIs are causing a shortage of publicly available, recent, social media data, thus hindering the advancement of computational social science as a whole. We present a large, high-coverage dataset of social interactions and user-generated content from Bluesky Social to address this pressing issue. The dataset contains the complete post history of over 4M users (81% of all registered accounts), totalling 235M posts. We also make available social data covering follow, comment, repost, and quote interactions. Since Bluesky allows users to create and bookmark feed generators (i.e., content recommendation algorithms), we also release the full output of several popular algorithms available on the platform, along with their timestamped ``like'' interactions and time of bookmarking. This dataset allows unprecedented analysis of online behavior and human-machine engagement patterns. Notably, it provides ground-truth data for studying the effects of content exposure and self-selection and performing content virality and diffusion analysis.

Autori: Andrea Failla, Giulio Rossetti

Ultimo aggiornamento: 2024-04-29 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2404.18984

Fonte PDF: https://arxiv.org/pdf/2404.18984

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili