Labeling Nutzerhaltungen in sozialen Medien
Eine Methode, um die Meinungen von Social-Media-Nutzern zu wichtigen Themen durch Hashtags und Interaktionen zu klassifizieren.
― 6 min Lesedauer
Inhaltsverzeichnis
- Die Herausforderung, die Nutzermeinung zu verstehen
- Zwei Arten von Polarisierung
- Interaktive Polarisierung
- Affektive Polarisierung
- Der Bedarf an besserer Meinungskennzeichnung
- Die vorgeschlagene Methode
- Stufe eins: Nutzer-Hashtag-Beziehungen
- Stufe zwei: Nutzerinteraktionen
- Datensammlung
- Klimawandel-Daten
- Waffenkontrolle-Daten
- Analyse der Nutzer-Hashtag-Meinungskennzeichnung
- Seed-Hashtags
- Ausbreitungsprozess
- Verwendung von Graph Neural Networks für die Meinungskennzeichnung
- Aufbau des Nutzerinteraktionsgraphen
- Training des GNN
- Ergebnisse
- Ergebnisse des Waffenkontrolle-Datensatzes
- Ergebnisse des Klimawandel-Datensatzes
- Fazit
- Originalquelle
- Referenz Links
Soziale Medien sind mittlerweile ein ganz normaler Ort, um Meinungen zu teilen und über politische Themen zu diskutieren. Aber die schnellen Veränderungen und die riesige Menge an Inhalten auf diesen Plattformen machen es oft schwer zu verstehen, was die Leute wirklich denken. Diese Arbeit konzentriert sich auf eine Methode, um die Meinung von Nutzern in sozialen Medien zu kennzeichnen, besonders indem wir schauen, welche Hashtags sie verwenden und wie sie mit anderen auf der Plattform interagieren. Das Ziel ist es, ein klareres Bild der Meinungen der Nutzer zu bekommen, besonders zu wichtigen Themen wie Klimawandel und Waffenkontrolle.
Die Herausforderung, die Nutzermeinung zu verstehen
Das riesige Volumen an Inhalten in sozialen Medien bedeutet, dass viele Ansichten gleichzeitig existieren. Auch wenn das verschiedene Meinungen ermöglicht, kann es auch dazu führen, dass Menschen nur mit denen kommunizieren, die gleich denken, was zu Echokammern führt. Forschungen haben gezeigt, dass Nutzer über die Zeit polarisiert werden, vor allem bei strittigen Themen. Diese Polarisierung kann wichtige Bereiche wie Finanzierungsentscheidungen, Beziehungsentscheidungen und die Reaktion auf öffentliche Gesundheitsinformationen beeinflussen.
Zwei Arten von Polarisierung
Wenn es um Polarisierung online geht, konzentrieren sich Forscher oft auf zwei Hauptformen: interaktive Polarisierung und Affektive Polarisierung.
Interaktive Polarisierung
Interaktive Polarisierung passiert, wenn Nutzer nur mit anderen sprechen, die ihre Ansichten teilen. Das kann verzerren, wie sie verschiedene Perspektiven sehen, und ihre Überzeugungen ohne Herausforderu ng verstärken. Solche Echokammern können es schwierig machen, offene Diskussionen zu führen und Spannungen zwischen Gruppen zu erhöhen.
Affektive Polarisierung
Affektive Polarisierung bezieht sich auf die Gefühle, die Menschen gegenüber denen mit gegensätzlichen Ansichten haben. Oft sind dabei negative Gefühle gegenüber Gruppen, die nicht die gleiche Meinung haben. Diese Art der Polarisierung ist schwerer zu untersuchen, weil sie oft manuell Daten sammeln muss, was langsam und schwierig sein kann.
Der Bedarf an besserer Meinungskennzeichnung
Die Kennzeichnung der Meinungen von Nutzern ist eine Herausforderung, weil die Sprache in sozialen Medien oft informell und chaotisch ist. Nutzer könnten Sarkasmus, Ironie oder andere Hinweise verwenden, die automatisierte Systeme verwirren können. Diese Komplexität macht es wichtig, Methoden zu entwickeln, die sowohl das, was die Leute schreiben, als auch wie sie mit anderen in sozialen Medien interagieren, berücksichtigen können.
Die vorgeschlagene Methode
Um dieses Problem anzugehen, wird ein zweistufiger Verfahren zur Meinungskennzeichnung vorgestellt.
Stufe eins: Nutzer-Hashtag-Beziehungen
In der ersten Stufe wird ein bipartiter Graph erstellt, der Nutzer mit den Hashtags verbindet, die sie verwenden. Dieser Graph hilft, zu erfassen, wie Nutzer durch die Hashtags, die sie posten, verknüpft sind. Indem wir diese Verbindungen untersuchen, ist es möglich, Nutzer basierend auf den Hashtags, die sie häufig verwenden, zu kennzeichnen. Je mehr ein Nutzer einen bestimmten Hashtag postet, der mit einer Meinung verbunden ist, desto stärker wird diese Verbindung.
Nutzerinteraktionen
Stufe zwei:Die zweite Stufe beinhaltet die Betrachtung, wie Nutzer miteinander interagieren. Das geschieht durch den Aufbau eines Nutzerinteraktionsgraphen, der Aktionen wie Retweeten, Erwähnungen oder Antworten auf andere umfasst. Durch die Analyse sowohl der Hashtags als auch der Interaktionen kann eine klarere Meinung für jeden Nutzer bestimmt werden.
Datensammlung
Um die Methode zu testen, werden Daten von Tweets zu zwei wichtigen Themen gesammelt: Klimawandel und Waffenkontrolle. Bestimmte Schlüsselwörter, die mit diesen Themen verbunden sind, werden verwendet, um Tweets über bestimmte Zeiträume zu sammeln. So erfassen wir bedeutende Diskussionen zu diesen Themen.
Klimawandel-Daten
Für den Klimawandel werden Tweets von Juni 2021 bis Juni 2022 gesammelt. Der Datensatz wird Millionen von Tweets und Tausende von einzigartigen Nutzern umfassen, was eine umfassende Analyse darüber erlaubt, wie die Leute über Klimawandel diskutieren.
Waffenkontrolle-Daten
Für Waffenkontrolle werden Tweets gesammelt, die zwischen Januar 2022 und Dezember 2022 veröffentlicht wurden. Ähnlich wie beim Klimawandel-Datensatz werden Millionen von Tweets und eine breite Palette von Nutzern aufgenommen, um die Diskussion über Waffenkontrolle zu untersuchen.
Analyse der Nutzer-Hashtag-Meinungskennzeichnung
Sobald die Tweets gesammelt sind, besteht der erste Schritt darin, den Nutzer-Hashtag-bipartiten Graphen zu erstellen. Dieser Graph verbindet Nutzer mit Hashtags basierend auf ihren Posts.
Seed-Hashtags
Ein kleiner Satz von Seed-Hashtags wird für jede Meinung definiert. Diese Seed-Hashtags dienen als Ausgangspunkt, um Nutzer zu kennzeichnen, die diese häufig verwenden. Während der Kennzeichnung werden Nutzern spezifische Meinungskennzeichnungen basierend auf den Hashtags, die sie verwenden, zugewiesen.
Ausbreitungsprozess
Die Methode beinhaltet einen Ausbreitungsprozess, bei dem die mit den Seed-Hashtags verbundene Meinung auf Nutzer ausgeweitet wird, die über die Hashtags verbunden sind. Nutzer erhalten Etiketten basierend darauf, wie oft sie die Hashtags aus jeder Meinungsgruppe verwenden. Diese Methode ermöglicht eine schnelle und effiziente Kennzeichnung von Nutzern, obwohl einige Nutzer, die keine Hashtags verwenden, möglicherweise unlabeled bleiben.
Verwendung von Graph Neural Networks für die Meinungskennzeichnung
Nach der ersten Stufe besteht der nächste Schritt darin, die Methode mit Graph Neural Networks (GNNs) zu verbessern. Diese Methode erlaubt eine tiefere Analyse der Nutzerinteraktionen und wird helfen, Lücken zu schliessen, die die Hashtag-Methode hinterlässt.
Aufbau des Nutzerinteraktionsgraphen
Dieser Graph wird Nutzer basierend auf ihren Interaktionen verbinden. Jede Interaktion erhält ein Gewicht, das basierend auf der Stimmung des Tweets zugewiesen wird. Durch die Analyse dieses Graphen kann das GNN lernen, genauere Vorhersagen über die Meinungen der Nutzer zu treffen.
Training des GNN
Das Trainieren des GNN wird beinhalten, die Informationen aus den Nutzerinteraktionen und den zuvor gekennzeichneten Nutzern zu kombinieren. Das Modell wird trainiert, um die Meinungen der Nutzer basierend auf dieser kombinierten Information zu klassifizieren.
Ergebnisse
Die vorgeschlagene Methode wird im Vergleich zu bestehenden Ansätzen getestet, um zu sehen, wie gut sie funktioniert. Die Effektivität wird anhand von Präzision, Rückruf und der gesamten Leistung bei der Klassifizierung von Nutzermeinungen gemessen.
Ergebnisse des Waffenkontrolle-Datensatzes
Die Ergebnisse für den Waffenkontrolle-Datensatz werden voraussichtlich zeigen, dass die GNN-basierte Methode andere Modelle übertrifft. Dieser Datensatz wird helfen zu veranschaulichen, wie gut der Ansatz für ein ereignisgetriebenes Thema funktioniert.
Ergebnisse des Klimawandel-Datensatzes
Die Ergebnisse für den Klimawandel-Datensatz werden wahrscheinlich Einblicke in die Herausforderungen der Meinungskennzeichnung bei weniger ereignisgetriebenen Themen geben.
Fazit
Diese Forschung zielt darauf ab, die Herausforderung zu bewältigen, die Meinungen der Nutzer auf sozialen Medienplattformen zu verstehen. Durch die Kombination von Textanalyse und sozialen Interaktionen wird ein umfassenderer Rahmen für die Meinungskennzeichnung vorgeschlagen. Während soziale Medien weiterhin wachsen, wird es wichtig, zu verstehen, wie man Meinungen zu wichtigen Themen messen und analysieren kann, um offene Diskussionen zu fördern und das gesellschaftliche Verständnis zu verbessern.
Die Ergebnisse dieser Forschung könnten wertvolle Einblicke zur Verbesserung politischer Diskurse und Polaritätsstudien bieten.
Titel: Two-Stage Stance Labeling: User-Hashtag Heuristics with Graph Neural Networks
Zusammenfassung: The high volume and rapid evolution of content on social media present major challenges for studying the stance of social media users. In this work, we develop a two stage stance labeling method that utilizes the user-hashtag bipartite graph and the user-user interaction graph. In the first stage, a simple and efficient heuristic for stance labeling uses the user-hashtag bipartite graph to iteratively update the stance association of user and hashtag nodes via a label propagation mechanism. This set of soft labels is then integrated with the user-user interaction graph to train a graph neural network (GNN) model using semi-supervised learning. We evaluate this method on two large-scale datasets containing tweets related to climate change from June 2021 to June 2022 and gun control from January 2022 to January 2023. Our experiments demonstrate that enriching text-based embeddings of users with network information from the user interaction graph using our semi-supervised GNN method outperforms both classifiers trained on user textual embeddings and zero-shot classification using LLMs such as GPT4. We discuss the need for integrating nuanced understanding from social science with the scalability of computational methods to better understand how polarization on social media occurs for divisive issues such as climate change and gun control.
Autoren: Joshua Melton, Shannon Reid, Gabriel Terejanu, Siddharth Krishnan
Letzte Aktualisierung: 2024-05-17 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2404.10228
Quell-PDF: https://arxiv.org/pdf/2404.10228
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.