Pregiudizio Linguistico nei Commenti dei Tifosi NFL
Esaminando come i fan della NFL esprimono i loro pregiudizi attraverso il linguaggio durante le partite.
― 7 leggere min
Indice
- Contesto
- Pregiudizio Intergruppo
- Uso del Linguaggio nello Sport
- Raccolta Dati
- Comprendere i Commenti dei Tifosi
- Tagging dei Riferimenti
- Annotazioni
- Analizzando il Pregiudizio nei Commenti
- Schemi nell’Uso del Linguaggio
- Linguaggio ed Emozione
- Modelli di Linguaggio di Grandi Dimensioni nell'Analisi
- Prestazioni del Modello
- Intuizioni dalle Prestazioni
- Conclusione
- Fonte originale
- Link di riferimento
Negli ultimi anni, la gente è diventata sempre più consapevole di come il nostro linguaggio influisca sulle nostre opinioni riguardo a diversi gruppi. Il modo in cui parliamo delle squadre, per esempio, può mostrare il nostro pregiudizio verso la nostra squadra rispetto a quella avversaria. Questo può succedere in molti sport, specialmente nel calcio, dove i tifosi esprimono i loro sentimenti nei forum online. I commenti possono mostrare pregiudizi, sia attraverso le parole usate che il modo in cui si riferiscono ai giocatori.
In questo studio, abbiamo analizzato i commenti dei tifosi durante le partite della NFL. Abbiamo raccolto una colossale quantità di oltre sei milioni di commenti che i tifosi hanno fatto mentre le partite erano in diretta. Esaminando come i tifosi parlano della propria squadra rispetto a quella avversaria, vogliamo capire come il linguaggio rifletta i pregiudizi e come le emozioni giochino un ruolo in questi commenti.
Contesto
Pregiudizio Intergruppo
Il pregiudizio intergruppo si riferisce alla preferenza che le persone mostrano per il proprio gruppo rispetto ad altri gruppi. Questo si può vedere nel modo in cui gli individui esprimono il loro supporto o le loro critiche quando discutono delle squadre. La gente tende a parlare più positivamente della propria squadra e usa un linguaggio meno favorevole quando si riferisce alla squadra avversaria. Comprendere questi pregiudizi nel linguaggio può aiutarci a vedere perché certi stereotipi persistano nella comunicazione.
Uso del Linguaggio nello Sport
Lo sport è un'area unica per studiare il linguaggio perché i tifosi sono spesso molto coinvolti e emotivamente investiti nelle loro squadre. Durante le partite, condividono i loro pensieri sui social media, permettendoci di esaminare come si riferiscono alla propria squadra e a quella avversaria. Il linguaggio usato può rivelare atteggiamenti e pregiudizi sottostanti di cui le persone potrebbero nemmeno essere consapevoli.
Nel nostro studio, ci siamo concentrati sui commenti delle partite NFL su una piattaforma come Reddit, dove i tifosi si riuniscono in thread per discutere degli eventi in corso. Analizzando questi commenti, possiamo esplorare come il linguaggio rifletta e influisca sul pregiudizio intergruppo.
Raccolta Dati
Per raccogliere i nostri dati, ci siamo concentrati sui thread di Reddit durante la stagione NFL. Ogni partita NFL ha thread dedicati all’interno dei subreddit di ogni squadra, permettendo ai tifosi di commentare durante la partita in diretta. Questa configurazione ha fornito una ricca fonte di commenti per la nostra analisi, poiché potevamo ottenere prospettive da entrambe le squadre coinvolte in una partita.
Abbiamo raccolto commenti sia dalle stagioni NFL 2021-22 che 2022-23, filtrando per commenti fatti durante il tempo attivo della partita. Il nostro dataset grezzo include oltre sei milioni di commenti provenienti da diverse partite, ciascuno collegato alle probabilità di vincita in tempo reale per le squadre coinvolte. Questa base nei progressi reali della partita ci consente di analizzare come lo stato del gioco influisca su ciò che dicono i tifosi.
Comprendere i Commenti dei Tifosi
Tagging dei Riferimenti
Un aspetto chiave della nostra analisi è stato quello di etichettare i commenti in base a chi i tifosi si stavano riferendo: se parlavano della propria squadra, della squadra avversaria o di altre squadre. Abbiamo categorizzato questi riferimenti in tre gruppi:
- In-group: Si riferisce alla squadra che il commentatore supporta.
- Out-group: Si riferisce alla squadra avversaria nella partita specifica.
- Altro: Si riferisce a qualsiasi altra squadra non coinvolta nella partita.
Taggando i riferimenti, possiamo analizzare successivamente tendenze e schemi in come i tifosi comunicano riguardo alle loro squadre e agli avversari.
Annotazioni
Per garantire l’accuratezza nel tagging, abbiamo lavorato con annotatori che comprendessero sia il football americano che il contesto dei commenti. Hanno evidenziato parole o frasi che si riferivano a persone, squadre o sotto-gruppi e assegnato i tag appropriati. Questo processo ha coinvolto una valutazione attenta del significato dietro i commenti per determinare come i tifosi vedevano il loro in-group rispetto all’out-group.
Attraverso il processo di annotazione, abbiamo scoperto che molti commenti contenevano riferimenti impliciti, cioè commenti che non nominavano direttamente una squadra ma indicavano chiaramente quale gruppo fosse discusso in base al contesto. Per esempio, un tifoso potrebbe dire: "Dobbiamo segnare punti", indicando il suo supporto per la sua squadra senza nominarla esplicitamente.
Analizzando il Pregiudizio nei Commenti
Schemi nell’Uso del Linguaggio
Una volta che abbiamo etichettato una parte significativa dei commenti, abbiamo iniziato ad analizzare gli schemi nell’uso del linguaggio. Una osservazione sorprendente è stata come la probabilità di riferirsi all’in-group o all’out-group cambiasse in base alla probabilità di vittoria della squadra. Man mano che la probabilità di vittoria di una squadra aumentava, i tifosi tendevano a riferirsi meno alla propria squadra e più alla squadra avversaria o esprimere commenti senza riferimenti diretti del tutto.
Questo suggerisce che quando i tifosi sentono che la loro squadra sta andando bene, potrebbero spostare il loro focus dall’identificazione diretta con la squadra. Al contrario, quando la loro squadra sta lottando, potrebbero identificarsi di più con la squadra e commentare di più sulle loro prestazioni.
Linguaggio ed Emozione
Il modo in cui i tifosi si esprimono nei commenti è anche strettamente legato alle loro emozioni durante la partita. Quando una squadra sta vincendo, i commenti spesso riflettono eccitazione, fiducia e un certo grado di astrazione nel discutere della partita. I tifosi potrebbero dire cose come: "Siamo inarrestabili!" invece di nominare giocatori o azioni specifiche.
D'altra parte, quando una squadra sta perdendo, i commenti tendono a essere più critici e dettagliati. I tifosi sono più propensi a menzionare giocatori e giocate specifici, riflettendo la loro frustrazione e delusione. Questo aspetto emotivo del linguaggio evidenzia ulteriormente il pregiudizio intergruppo, poiché i sentimenti che circondano il gioco influenzano come i tifosi si riferiscono alle loro squadre e agli avversari.
Modelli di Linguaggio di Grandi Dimensioni nell'Analisi
Per assisterci nel tagging esteso dei commenti, abbiamo impiegato modelli di linguaggio di grandi dimensioni (LLMs). Questi modelli possono analizzare il linguaggio su larga scala e identificare schemi, aiutandoci a taggare i commenti rapidamente ed efficientemente. Addestrando i modelli con il nostro dataset, miravamo a migliorare la nostra comprensione di come il linguaggio rifletta il pregiudizio nelle discussioni sportive.
Prestazioni del Modello
Abbiamo testato diverse configurazioni del modello per vedere quanto bene potessero etichettare i commenti con etichette di in-group, out-group e altro. Gli LLMs hanno mostrato prestazioni solide, spesso superando l'accuratezza di tagging degli annotatori umani. Tuttavia, abbiamo trovato che i modelli faticavano ad incorporare la probabilità di vittoria in modo efficace come speravamo. Anche se potevano identificare i pregiudizi, collegarli allo stato del gioco era meno efficace.
Intuizioni dalle Prestazioni
Attraverso la sperimentazione con i modelli, abbiamo identificato che i commenti dei tifosi variavano in base alle probabilità di vittoria. Quando le probabilità di vittoria erano più basse per una squadra, i tifosi tendevano a esprimere la loro lealtà facendo riferimento direttamente alla loro squadra più spesso. Al contrario, a probabilità di vittoria più alte, la tendenza a distaccarsi dai riferimenti specifici aumentava.
Questi risultati riflettono come il linguaggio non solo trasmetta informazioni sul gioco, ma riveli anche gli stati emotivi e i pregiudizi dei tifosi verso le loro squadre.
Conclusione
In sintesi, il nostro studio mette in evidenza come il linguaggio usato dai tifosi NFL durante le partite rifletta pregiudizi sottostanti e risposte emotive. Esaminando un ricco dataset di commenti provenienti da forum online, abbiamo illustrato come i tifosi articolano il loro supporto e le loro critiche per le proprie squadre. L'uso di modelli di linguaggio di grandi dimensioni ci ha aiutato ad analizzare questi commenti su larga scala, rivelando tendenze e schemi che sarebbero difficili da scoprire manualmente.
I risultati sottolineano che il linguaggio è uno strumento potente per esprimere pregiudizi, e comprendere queste dinamiche può informare discussioni più ampie su come comunichiamo riguardo a diversi gruppi in vari contesti. Man mano che procediamo, speriamo di esplorare schemi linguistici simili in altri sport e interazioni sociali per approfondire la nostra comprensione del pregiudizio intergruppo nel linguaggio.
Titolo: Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias
Estratto: The variations between in-group and out-group speech (intergroup bias) are subtle and could underlie many social phenomena like stereotype perpetuation and implicit bias. In this paper, we model the intergroup bias as a tagging task on English sports comments from forums dedicated to fandom for NFL teams. We curate a unique dataset of over 6 million game-time comments from opposing perspectives (the teams in the game), each comment grounded in a non-linguistic description of the events that precipitated these comments (live win probabilities for each team). Expert and crowd annotations justify modeling the bias through tagging of implicit and explicit referring expressions and reveal the rich, contextual understanding of language and the world required for this task. For large-scale analysis of intergroup variation, we use LLMs for automated tagging, and discover that some LLMs perform best when prompted with linguistic descriptions of the win probability at the time of the comment, rather than numerical probability. Further, large-scale tagging of comments using LLMs uncovers linear variations in the form of referent across win probabilities that distinguish in-group and out-group utterances. Code and data are available at https://github.com/venkatasg/intergroup-nfl .
Autori: Venkata S Govindarajan, Matianyu Zang, Kyle Mahowald, David Beaver, Junyi Jessy Li
Ultimo aggiornamento: 2024-10-31 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2406.17947
Fonte PDF: https://arxiv.org/pdf/2406.17947
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.