Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Maschinelles Lernen# Rechnen und Sprache# Soziale und Informationsnetzwerke

Labeling Nutzerhaltungen in sozialen Medien

Eine Methode, um die Meinungen von Social-Media-Nutzern zu wichtigen Themen durch Hashtags und Interaktionen zu klassifizieren.

― 6 min Lesedauer


Soziale Medien HaltungSoziale Medien HaltungKlassifizierungzu kontroversen Themen.Methode zur Analyse von Nutzermeinungen
Inhaltsverzeichnis

Soziale Medien sind mittlerweile ein ganz normaler Ort, um Meinungen zu teilen und über politische Themen zu diskutieren. Aber die schnellen Veränderungen und die riesige Menge an Inhalten auf diesen Plattformen machen es oft schwer zu verstehen, was die Leute wirklich denken. Diese Arbeit konzentriert sich auf eine Methode, um die Meinung von Nutzern in sozialen Medien zu kennzeichnen, besonders indem wir schauen, welche Hashtags sie verwenden und wie sie mit anderen auf der Plattform interagieren. Das Ziel ist es, ein klareres Bild der Meinungen der Nutzer zu bekommen, besonders zu wichtigen Themen wie Klimawandel und Waffenkontrolle.

Die Herausforderung, die Nutzermeinung zu verstehen

Das riesige Volumen an Inhalten in sozialen Medien bedeutet, dass viele Ansichten gleichzeitig existieren. Auch wenn das verschiedene Meinungen ermöglicht, kann es auch dazu führen, dass Menschen nur mit denen kommunizieren, die gleich denken, was zu Echokammern führt. Forschungen haben gezeigt, dass Nutzer über die Zeit polarisiert werden, vor allem bei strittigen Themen. Diese Polarisierung kann wichtige Bereiche wie Finanzierungsentscheidungen, Beziehungsentscheidungen und die Reaktion auf öffentliche Gesundheitsinformationen beeinflussen.

Zwei Arten von Polarisierung

Wenn es um Polarisierung online geht, konzentrieren sich Forscher oft auf zwei Hauptformen: interaktive Polarisierung und Affektive Polarisierung.

Interaktive Polarisierung

Interaktive Polarisierung passiert, wenn Nutzer nur mit anderen sprechen, die ihre Ansichten teilen. Das kann verzerren, wie sie verschiedene Perspektiven sehen, und ihre Überzeugungen ohne Herausforderu ng verstärken. Solche Echokammern können es schwierig machen, offene Diskussionen zu führen und Spannungen zwischen Gruppen zu erhöhen.

Affektive Polarisierung

Affektive Polarisierung bezieht sich auf die Gefühle, die Menschen gegenüber denen mit gegensätzlichen Ansichten haben. Oft sind dabei negative Gefühle gegenüber Gruppen, die nicht die gleiche Meinung haben. Diese Art der Polarisierung ist schwerer zu untersuchen, weil sie oft manuell Daten sammeln muss, was langsam und schwierig sein kann.

Der Bedarf an besserer Meinungskennzeichnung

Die Kennzeichnung der Meinungen von Nutzern ist eine Herausforderung, weil die Sprache in sozialen Medien oft informell und chaotisch ist. Nutzer könnten Sarkasmus, Ironie oder andere Hinweise verwenden, die automatisierte Systeme verwirren können. Diese Komplexität macht es wichtig, Methoden zu entwickeln, die sowohl das, was die Leute schreiben, als auch wie sie mit anderen in sozialen Medien interagieren, berücksichtigen können.

Die vorgeschlagene Methode

Um dieses Problem anzugehen, wird ein zweistufiger Verfahren zur Meinungskennzeichnung vorgestellt.

Stufe eins: Nutzer-Hashtag-Beziehungen

In der ersten Stufe wird ein bipartiter Graph erstellt, der Nutzer mit den Hashtags verbindet, die sie verwenden. Dieser Graph hilft, zu erfassen, wie Nutzer durch die Hashtags, die sie posten, verknüpft sind. Indem wir diese Verbindungen untersuchen, ist es möglich, Nutzer basierend auf den Hashtags, die sie häufig verwenden, zu kennzeichnen. Je mehr ein Nutzer einen bestimmten Hashtag postet, der mit einer Meinung verbunden ist, desto stärker wird diese Verbindung.

Stufe zwei: Nutzerinteraktionen

Die zweite Stufe beinhaltet die Betrachtung, wie Nutzer miteinander interagieren. Das geschieht durch den Aufbau eines Nutzerinteraktionsgraphen, der Aktionen wie Retweeten, Erwähnungen oder Antworten auf andere umfasst. Durch die Analyse sowohl der Hashtags als auch der Interaktionen kann eine klarere Meinung für jeden Nutzer bestimmt werden.

Datensammlung

Um die Methode zu testen, werden Daten von Tweets zu zwei wichtigen Themen gesammelt: Klimawandel und Waffenkontrolle. Bestimmte Schlüsselwörter, die mit diesen Themen verbunden sind, werden verwendet, um Tweets über bestimmte Zeiträume zu sammeln. So erfassen wir bedeutende Diskussionen zu diesen Themen.

Klimawandel-Daten

Für den Klimawandel werden Tweets von Juni 2021 bis Juni 2022 gesammelt. Der Datensatz wird Millionen von Tweets und Tausende von einzigartigen Nutzern umfassen, was eine umfassende Analyse darüber erlaubt, wie die Leute über Klimawandel diskutieren.

Waffenkontrolle-Daten

Für Waffenkontrolle werden Tweets gesammelt, die zwischen Januar 2022 und Dezember 2022 veröffentlicht wurden. Ähnlich wie beim Klimawandel-Datensatz werden Millionen von Tweets und eine breite Palette von Nutzern aufgenommen, um die Diskussion über Waffenkontrolle zu untersuchen.

Analyse der Nutzer-Hashtag-Meinungskennzeichnung

Sobald die Tweets gesammelt sind, besteht der erste Schritt darin, den Nutzer-Hashtag-bipartiten Graphen zu erstellen. Dieser Graph verbindet Nutzer mit Hashtags basierend auf ihren Posts.

Seed-Hashtags

Ein kleiner Satz von Seed-Hashtags wird für jede Meinung definiert. Diese Seed-Hashtags dienen als Ausgangspunkt, um Nutzer zu kennzeichnen, die diese häufig verwenden. Während der Kennzeichnung werden Nutzern spezifische Meinungskennzeichnungen basierend auf den Hashtags, die sie verwenden, zugewiesen.

Ausbreitungsprozess

Die Methode beinhaltet einen Ausbreitungsprozess, bei dem die mit den Seed-Hashtags verbundene Meinung auf Nutzer ausgeweitet wird, die über die Hashtags verbunden sind. Nutzer erhalten Etiketten basierend darauf, wie oft sie die Hashtags aus jeder Meinungsgruppe verwenden. Diese Methode ermöglicht eine schnelle und effiziente Kennzeichnung von Nutzern, obwohl einige Nutzer, die keine Hashtags verwenden, möglicherweise unlabeled bleiben.

Verwendung von Graph Neural Networks für die Meinungskennzeichnung

Nach der ersten Stufe besteht der nächste Schritt darin, die Methode mit Graph Neural Networks (GNNs) zu verbessern. Diese Methode erlaubt eine tiefere Analyse der Nutzerinteraktionen und wird helfen, Lücken zu schliessen, die die Hashtag-Methode hinterlässt.

Aufbau des Nutzerinteraktionsgraphen

Dieser Graph wird Nutzer basierend auf ihren Interaktionen verbinden. Jede Interaktion erhält ein Gewicht, das basierend auf der Stimmung des Tweets zugewiesen wird. Durch die Analyse dieses Graphen kann das GNN lernen, genauere Vorhersagen über die Meinungen der Nutzer zu treffen.

Training des GNN

Das Trainieren des GNN wird beinhalten, die Informationen aus den Nutzerinteraktionen und den zuvor gekennzeichneten Nutzern zu kombinieren. Das Modell wird trainiert, um die Meinungen der Nutzer basierend auf dieser kombinierten Information zu klassifizieren.

Ergebnisse

Die vorgeschlagene Methode wird im Vergleich zu bestehenden Ansätzen getestet, um zu sehen, wie gut sie funktioniert. Die Effektivität wird anhand von Präzision, Rückruf und der gesamten Leistung bei der Klassifizierung von Nutzermeinungen gemessen.

Ergebnisse des Waffenkontrolle-Datensatzes

Die Ergebnisse für den Waffenkontrolle-Datensatz werden voraussichtlich zeigen, dass die GNN-basierte Methode andere Modelle übertrifft. Dieser Datensatz wird helfen zu veranschaulichen, wie gut der Ansatz für ein ereignisgetriebenes Thema funktioniert.

Ergebnisse des Klimawandel-Datensatzes

Die Ergebnisse für den Klimawandel-Datensatz werden wahrscheinlich Einblicke in die Herausforderungen der Meinungskennzeichnung bei weniger ereignisgetriebenen Themen geben.

Fazit

Diese Forschung zielt darauf ab, die Herausforderung zu bewältigen, die Meinungen der Nutzer auf sozialen Medienplattformen zu verstehen. Durch die Kombination von Textanalyse und sozialen Interaktionen wird ein umfassenderer Rahmen für die Meinungskennzeichnung vorgeschlagen. Während soziale Medien weiterhin wachsen, wird es wichtig, zu verstehen, wie man Meinungen zu wichtigen Themen messen und analysieren kann, um offene Diskussionen zu fördern und das gesellschaftliche Verständnis zu verbessern.

Die Ergebnisse dieser Forschung könnten wertvolle Einblicke zur Verbesserung politischer Diskurse und Polaritätsstudien bieten.

Originalquelle

Titel: Two-Stage Stance Labeling: User-Hashtag Heuristics with Graph Neural Networks

Zusammenfassung: The high volume and rapid evolution of content on social media present major challenges for studying the stance of social media users. In this work, we develop a two stage stance labeling method that utilizes the user-hashtag bipartite graph and the user-user interaction graph. In the first stage, a simple and efficient heuristic for stance labeling uses the user-hashtag bipartite graph to iteratively update the stance association of user and hashtag nodes via a label propagation mechanism. This set of soft labels is then integrated with the user-user interaction graph to train a graph neural network (GNN) model using semi-supervised learning. We evaluate this method on two large-scale datasets containing tweets related to climate change from June 2021 to June 2022 and gun control from January 2022 to January 2023. Our experiments demonstrate that enriching text-based embeddings of users with network information from the user interaction graph using our semi-supervised GNN method outperforms both classifiers trained on user textual embeddings and zero-shot classification using LLMs such as GPT4. We discuss the need for integrating nuanced understanding from social science with the scalability of computational methods to better understand how polarization on social media occurs for divisive issues such as climate change and gun control.

Autoren: Joshua Melton, Shannon Reid, Gabriel Terejanu, Siddharth Krishnan

Letzte Aktualisierung: 2024-05-17 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2404.10228

Quell-PDF: https://arxiv.org/pdf/2404.10228

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel