Esaminare il bias e la propaganda sui social media
Uno studio sui post multilingue di Facebook relativi alla guerra israelo-palestinese.
― 4 leggere min
Indice
- L'importanza di rilevare pregiudizi e propaganda
- Creare il corpus multilingue
- Processo di Annotazione
- Accordo tra annotatori
- Composizione e formazione del team
- Partecipazione al FigNews Challenge
- Analisi dei risultati
- Errori e sfide
- Piani futuri
- Considerazioni etiche
- Conclusione
- Fonte originale
- Link di riferimento
I social media sono diventati una fonte importante di informazioni, ma diffondono anche pregiudizi e Propaganda. L'obiettivo di questo articolo è discutere una raccolta multilingue di post di Facebook che sono stati esaminati per pregiudizi e propaganda. Questa raccolta è stata creata per aiutare a comprendere meglio la narrazione attorno alla Guerra di Israele su Gaza, che si è svolta da ottobre a gennaio.
L'importanza di rilevare pregiudizi e propaganda
I pregiudizi e la propaganda possono influenzare le opinioni delle persone e creare divisione. La disinformazione può portare a fraintendimenti e persino violenza. Quindi, trovare modi per rilevare automaticamente pregiudizi e propaganda sui social media è fondamentale per mantenere la fiducia nelle informazioni che le persone condividono.
Creare il corpus multilingue
Per creare la raccolta di post di Facebook, i ricercatori hanno raccolto commenti in varie lingue: arabo, ebraico, inglese, francese e hindi. I post coprivano eventi legati alla guerra e includevano diversi punti di vista. Gli studenti laureati specializzati in Giurisprudenza hanno aiutato ad annotare i post, etichettandoli per pregiudizi e propaganda.
Annotazione
Processo diIl processo di annotazione ha coinvolto la comprensione di cosa significano Pregiudizio e propaganda. Il pregiudizio è stato definito come una preferenza ingiusta per o contro un gruppo specifico. I ricercatori hanno identificato diverse classi di pregiudizio, come essere di parte contro Palestina o Israele, e hanno anche categorizzato post che erano imparziali o poco chiari.
La propaganda è stata definita come informazioni fuorvianti che mirano a promuovere un'agenda particolare. Può assumere varie forme, come esagerare i fatti o usare un linguaggio vago. I ricercatori hanno classificato la propaganda in diversi tipi, indicando se doveva essere cancellata o poteva rimanere online in base al suo potenziale danno.
Accordo tra annotatori
Per assicurarsi della qualità delle annotazioni, i ricercatori hanno valutato quanto bene diversi annotatori fossero d'accordo tra loro. Hanno usato metodi per calcolare questo accordo e hanno trovato un alto livello di coerenza, soprattutto riguardo alle annotazioni sui pregiudizi.
Composizione e formazione del team
Il team di ricerca era composto da studenti di Master specializzati in Giurisprudenza. Poiché parlavano tutti arabo e conoscevano bene l'inglese, riuscivano a comprendere meglio i post. Il team ha partecipato a sessioni di formazione per familiarizzare con le linee guida per annotare i post. Sono stati organizzati laboratori per discutere delle Sfide affrontate e per trovare soluzioni insieme.
Partecipazione al FigNews Challenge
I ricercatori hanno partecipato a una sfida chiamata FigNews, che mirava a migliorare i metodi per identificare pregiudizi e propaganda. Il loro team ha ottenuto buoni risultati, guadagnando riconoscimenti in diverse categorie. I risultati hanno evidenziato il loro impegno per produrre lavori di alta qualità.
Analisi dei risultati
I risultati hanno mostrato un chiaro schema di pregiudizi. Un numero significativo di post mostrava pregiudizi contro la Palestina, in particolare tra i post francesi. I ricercatori hanno notato che molti post di propaganda provenivano anche da fonti francesi.
Errori e sfide
Nonostante la formazione e le linee guida, gli annotatori hanno comunque affrontato difficoltà. Alcuni post sono stati classificati erroneamente come pregiudizievoli quando erano neutrali. Ad esempio, un estratto di notizie sui fatti militari è stato etichettato per sbaglio come di parte, anche se era semplicemente informativo.
In alcuni casi, post che contenevano propaganda sono stati classificati erroneamente come dannosi, quando non rappresentavano alcun rischio diretto per individui o gruppi. È fondamentale categorizzare accuratamente i contenuti per evitare etichette sbagliate che possono portare a problemi in futuro.
Piani futuri
In futuro, i ricercatori pianificano di espandere il loro corpus per includere più eventi della guerra. Inoltre, mirano a utilizzare tecnologie avanzate per automatizzare il processo di rilevamento di pregiudizi e propaganda, il che potrebbe portare a un'analisi più efficiente dei contenuti sui social media.
Considerazioni etiche
La sensibilità degli argomenti discussi nel contesto della Guerra di Israele su Gaza richiede una gestione attenta. Gli annotatori, che sono avvocati formati, hanno prestato molta attenzione per garantire che le loro etichette fossero giuste. Hanno esaminato approfonditamente le traduzioni per ridurre al minimo eventuali pregiudizi che potrebbero derivare dalle differenze linguistiche.
Conclusione
In conclusione, analizzare i social media per pregiudizi e propaganda è essenziale nell'era digitale attuale. I ricercatori hanno gettato una solida base per gli sforzi futuri creando una raccolta multilingue di post di Facebook. Questo lavoro mira a migliorare la nostra comprensione di come le narrazioni siano costruite e diffuse attraverso diverse lingue e piattaforme. Continuando a perfezionare i loro metodi, sperano di contribuire a un discorso più informato e accurato riguardo a questioni sensibili.
Titolo: Sina at FigNews 2024: Multilingual Datasets Annotated with Bias and Propaganda
Estratto: The proliferation of bias and propaganda on social media is an increasingly significant concern, leading to the development of techniques for automatic detection. This article presents a multilingual corpus of 12, 000 Facebook posts fully annotated for bias and propaganda. The corpus was created as part of the FigNews 2024 Shared Task on News Media Narratives for framing the Israeli War on Gaza. It covers various events during the War from October 7, 2023 to January 31, 2024. The corpus comprises 12, 000 posts in five languages (Arabic, Hebrew, English, French, and Hindi), with 2, 400 posts for each language. The annotation process involved 10 graduate students specializing in Law. The Inter-Annotator Agreement (IAA) was used to evaluate the annotations of the corpus, with an average IAA of 80.8% for bias and 70.15% for propaganda annotations. Our team was ranked among the bestperforming teams in both Bias and Propaganda subtasks. The corpus is open-source and available at https://sina.birzeit.edu/fada
Autori: Lina Duaibes, Areej Jaber, Mustafa Jarrar, Ahmad Qadi, Mais Qandeel
Ultimo aggiornamento: 2024-07-12 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2407.09327
Fonte PDF: https://arxiv.org/pdf/2407.09327
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.