Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Rechnen und Sprache

Sprachliche Vorurteile in NFL-Fankommentaren

Untersuchen, wie NFL-Fans während der Spiele Vorurteile durch Sprache ausdrücken.

― 7 min Lesedauer


NFL-Fans undNFL-Fans undSprachvorurteileNFL-Fans.Eine Analyse der Sprachverwendung unter
Inhaltsverzeichnis

In den letzten Jahren ist den Leuten immer mehr bewusst geworden, wie unsere Sprache unsere Sichtweisen auf verschiedene Gruppen beeinflusst. Zum Beispiel kann die Art und Weise, wie wir über Teams sprechen, unsere Voreingenommenheit gegenüber unserem eigenen Team im Vergleich zum gegnerischen Team zeigen. Das passiert in vielen Sportarten, besonders im Fussball, wo Fans ihre Gefühle in Online-Foren ausdrücken. Die Kommentare können Vorurteile zeigen, sei es durch die verwendeten Worte oder wie sie sich auf Spieler beziehen.

In dieser Studie haben wir uns Kommentare von Fans während NFL-Spielen angesehen. Wir haben eine riesige Sammlung von über sechs Millionen Kommentaren gesammelt, die Fans während der Live-Spiele gemacht haben. Indem wir untersuchen, wie Fans über ihr eigenes Team im Vergleich zum gegnerischen Team sprechen, wollen wir verstehen, wie Sprache Vorurteile widerspiegelt und wie Emotionen eine Rolle in diesen Kommentaren spielen.

Hintergrund

Intergruppen-Voreingenommenheit

Intergruppen-Voreingenommenheit bezieht sich auf die Bevorzugung, die Menschen ihrer eigenen Gruppe gegenüber anderen Gruppen zeigen. Das zeigt sich darin, wie Individuen ihre Unterstützung oder Kritik beim Diskutieren über Teams äussern. Die Leute sprechen oft positiver über ihr eigenes Team und verwenden weniger günstige Sprache, wenn sie sich auf das gegnerische Team beziehen. Das Verstehen dieser Vorurteile in der Sprache kann uns helfen zu sehen, warum bestimmte Stereotypen in der Kommunikation bestehen bleiben.

Sprachgebrauch im Sport

Sport ist ein einzigartiger Bereich, um Sprache zu studieren, weil Fans oft sehr engagiert und emotional in ihre Teams investiert sind. Während der Spiele teilen sie ihre Gedanken in sozialen Medien, was uns erlaubt zu untersuchen, wie sie sich auf ihr Team und das gegnerische Team beziehen. Die verwendete Sprache kann grundlegende Einstellungen und Vorurteile offenbaren, von denen die Leute sich vielleicht nicht einmal bewusst sind.

In unserer Forschung haben wir uns auf Kommentare von NFL-Spielen auf einer Plattform wie Reddit konzentriert, wo Fans in Threads die aktuellen Ereignisse diskutieren. Durch die Analyse dieser Kommentare können wir erkunden, wie Sprache sowohl intergruppen-Voreingenommenheit widerspiegelt als auch beeinflusst.

Datensammlung

Um unsere Daten zu sammeln, haben wir uns auf Reddit-Threads während der NFL-Saison konzentriert. Jedes NFL-Spiel hat spezielle Thread-Diskussionen in Subreddits für jedes Team, die es Fans ermöglichen, während des Live-Spiels Kommentare abzugeben. Dieses Setup bot eine reiche Quelle von Kommentaren für unsere Analyse, da wir Perspektiven von beiden Teams, die an einem Spiel beteiligt sind, erhalten konnten.

Wir haben Kommentare aus den NFL-Saisons 2021-22 und 2022-23 gesammelt und gefiltert, um Kommentare während aktiver Spielzeit zu erhalten. Unser Rohdatensatz umfasst über sechs Millionen Kommentare aus verschiedenen Spielen, die jeweils mit aktuellen Gewinnwahrscheinlichkeiten der beteiligten Teams verknüpft sind. Diese Verankerung im aktuellen Spielverlauf ermöglicht es uns, zu analysieren, wie der Zustand des Spiels beeinflusst, was Fans sagen.

Verständnis der Fan-Kommentare

Taggen von Referenzen

Ein wichtiger Aspekt unserer Analyse war es, Kommentare zu taggen, basierend darauf, worauf sich die Fans bezogen – ob sie über ihr eigenes Team, das gegnerische Team oder andere Teams sprachen. Wir haben diese Referenzen in drei Gruppen kategorisiert:

  • In-Gruppe: Bezieht sich auf das Team, das der Kommentator unterstützt.
  • Out-Gruppe: Bezieht sich auf das gegnerische Team im spezifischen Spiel.
  • Andere: Bezieht sich auf jedes andere Team, das nicht am Spiel beteiligt ist.

Durch das Taggen von Referenzen konnten wir später Trends und Muster in der Kommunikation der Fans über ihre Teams und Gegner analysieren.

Annotationen

Um die Genauigkeit beim Taggen sicherzustellen, haben wir mit Annotatoren gearbeitet, die sowohl American Football als auch den Kontext der Kommentare verstanden. Sie haben Wörter oder Phrasen hervorgehoben, die sich auf Personen, Teams oder Untergruppen bezogen, und passende Tags zugewiesen. Dieser Prozess beinhaltete sorgfältige Überlegungen zur Bedeutung hinter den Kommentaren, um zu bestimmen, wie Fans ihre In-Gruppe im Vergleich zur Out-Gruppe sahen.

Durch den Annotierungsprozess haben wir entdeckt, dass viele Kommentare implizite Referenzen enthielten – also Kommentare, die kein Team direkt benannten, aber klar anzeigten, über welche Gruppe im Kontext gesprochen wurde. Zum Beispiel könnte ein Fan sagen: "Wir müssen Punkte machen," was seine Unterstützung für sein Team anzeigt, ohne es ausdrücklich zu benennen.

Analyse der Vorurteile in Kommentaren

Muster im Sprachgebrauch

Sobald wir einen signifikanten Teil der Kommentare getaggt hatten, begannen wir, die Muster im Sprachgebrauch zu analysieren. Eine auffällige Beobachtung war, wie die Wahrscheinlichkeit, sich auf die In-Gruppe oder Out-Gruppe zu beziehen, je nach Gewinnwahrscheinlichkeit des Teams variierte. Je höher die Wahrscheinlichkeit, dass ein Team gewinnt, desto weniger neigen die Fans dazu, sich auf ihr eigenes Team zu beziehen und mehr auf das gegnerische Team oder äussern Kommentare ohne direkte Referenzen.

Das deutet darauf hin, dass wenn Fans das Gefühl haben, ihr Team macht gute Fortschritte, sie möglicherweise ihren Fokus von der direkten Identifikation mit dem Team abwenden. Im Gegensatz dazu, wenn ihr Team Schwierigkeiten hat, neigen sie dazu, mehr mit dem Team zu identifizieren und mehr über dessen Leistung zu kommentieren.

Sprache und Emotion

Die Art und Weise, wie Fans sich in Kommentaren ausdrücken, ist auch eng mit ihren Emotionen während des Spiels verbunden. Wenn ein Team gewinnt, spiegeln Kommentare oft Aufregung, Selbstbewusstsein und eine gewisse Abstraktion wider, wenn sie über das Spiel sprechen. Fans könnten sagen: "Wir sind unaufhaltbar!", anstatt spezifische Spieler oder Aktionen zu benennen.

Andererseits, wenn ein Team verliert, tendieren die Kommentare dazu, kritischer und detaillierter zu sein. Fans erwähnen eher spezifische Spieler und Spielzüge, was ihren Frust und ihre Enttäuschung widerspiegelt. Dieser emotionale Aspekt der Sprache hebt die intergruppen-Voreingenommenheit hervor, da die Gefühle rund um das Spiel beeinflussen, wie Fans sich auf ihre Teams und Gegner beziehen.

Grosse Sprachmodelle in der Analyse

Um bei der umfangreichen Tagging der Kommentare zu helfen, haben wir grosse Sprachmodelle (LLMs) eingesetzt. Diese Modelle können Sprache im grossen Stil analysieren und Muster identifizieren, was uns hilft, Kommentare schnell und effizient zu taggen. Indem wir die Modelle mit unserem Datensatz trainiert haben, wollten wir unser Verständnis darüber verbessern, wie Sprache Vorurteile in sportbezogenen Diskussionen widerspiegelt.

Modellleistung

Wir haben verschiedene Modell-Setups getestet, um zu sehen, wie gut sie Kommentare mit In-Gruppe, Out-Gruppe und anderen Labels taggen konnten. Die LLMs zeigten eine starke Leistung und übertrafen oft die Tagging-Genauigkeit menschlicher Annotatoren. Allerdings stellten wir fest, dass die Modelle Schwierigkeiten hatten, die Gewinnwahrscheinlichkeit so effektiv einzubeziehen, wie wir es uns erhofft hatten. Während sie Vorurteile identifizieren konnten, war das Verknüpfen mit dem Zustand des Spiels weniger erfolgreich.

Einsichten aus der Leistung

Durch Experimente mit den Modellen haben wir erkannt, dass die Kommentare der Fans je nach Gewinnwahrscheinlichkeiten variieren. Wenn die Gewinnwahrscheinlichkeiten für ein Team niedriger waren, neigten die Fans dazu, ihre Loyalität auszudrücken, indem sie sich häufiger direkt auf ihr Team bezogen. Im Gegensatz dazu nahm bei höheren Gewinnwahrscheinlichkeiten die Tendenz zu, sich von spezifischen Referenzen zu abstrahieren, zu.

Diese Erkenntnisse spiegeln wider, wie Sprache nicht nur Informationen über das Spiel vermittelt, sondern auch die emotionalen Zustände und Vorurteile der Fans gegenüber ihren Teams offenbart.

Fazit

Zusammenfassend hebt unsere Studie hervor, wie die Sprache, die von NFL-Fans während der Spiele verwendet wird, zugrunde liegende Vorurteile und emotionale Reaktionen widerspiegelt. Durch die Untersuchung eines umfangreichen Datensatzes von Kommentaren aus Online-Foren haben wir veranschaulicht, wie Fans ihre Unterstützung und Kritik für ihre Teams artikulieren. Der Einsatz grosser Sprachmodelle half uns, diese Kommentare im grossen Stil zu analysieren und Trends und Muster zu erkennen, die manuell schwer zu entdecken wären.

Die Erkenntnisse betonen, dass Sprache ein kraftvolles Werkzeug zur Ausdruck von Vorurteilen ist und das Verständnis dieser Dynamiken kann breitere Diskussionen darüber informieren, wie wir über verschiedene Gruppen in unterschiedlichen Kontexten kommunizieren. Während wir weiterarbeiten, hoffen wir, ähnliche Sprachmuster in anderen Sportarten und sozialen Interaktionen zu erkunden, um unser Verständnis von intergruppen-Voreingenommenheit in der Sprache zu vertiefen.

Originalquelle

Titel: Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias

Zusammenfassung: The variations between in-group and out-group speech (intergroup bias) are subtle and could underlie many social phenomena like stereotype perpetuation and implicit bias. In this paper, we model the intergroup bias as a tagging task on English sports comments from forums dedicated to fandom for NFL teams. We curate a unique dataset of over 6 million game-time comments from opposing perspectives (the teams in the game), each comment grounded in a non-linguistic description of the events that precipitated these comments (live win probabilities for each team). Expert and crowd annotations justify modeling the bias through tagging of implicit and explicit referring expressions and reveal the rich, contextual understanding of language and the world required for this task. For large-scale analysis of intergroup variation, we use LLMs for automated tagging, and discover that some LLMs perform best when prompted with linguistic descriptions of the win probability at the time of the comment, rather than numerical probability. Further, large-scale tagging of comments using LLMs uncovers linear variations in the form of referent across win probabilities that distinguish in-group and out-group utterances. Code and data are available at https://github.com/venkatasg/intergroup-nfl .

Autoren: Venkata S Govindarajan, Matianyu Zang, Kyle Mahowald, David Beaver, Junyi Jessy Li

Letzte Aktualisierung: 2024-10-31 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2406.17947

Quell-PDF: https://arxiv.org/pdf/2406.17947

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel