Simple Science

La science de pointe expliquée simplement

# Informatique# Calcul et langage# Intelligence artificielle

Sentiment public envers l'armée américaine sur les réseaux sociaux

Ce jeu de données analyse les commentaires sur les vidéos YouTube de l'Armée américaine pour des insights sur l'opinion publique.

― 6 min lire


Analyse des commentairesAnalyse des commentairesYouTube de l'Arméecommentaires sur les réseaux sociaux.Examiner les avis publics à travers les
Table des matières

L'Opinion Publique envers l'armée d'un pays est super importante. Ça reflète à quel point les gens font confiance à l'armée et jusqu'à quel point ils sont prêts à s'engager. Une vision positive peut aider à recruter de nouveaux soldats. Les réseaux sociaux jouent un rôle clé dans la formation de ces opinions. Cet article présente un ensemble de données visant à nous aider à comprendre les avis du public sur l'armée américaine à travers les Commentaires sur ses vidéos officielles YouTube.

Vue d'ensemble de l'ensemble de données

Cet ensemble de données se compose de commentaires provenant de vidéos publiées sur la chaîne YouTube officielle de l'armée américaine. Chaque commentaire est étiqueté pour montrer la position de la personne qui a commenté par rapport à l'armée et au contenu de la vidéo. Le processus d'étiquetage a utilisé des méthodes automatiques pour garantir un ensemble de données plus large et plus efficace.

Processus de collecte de données

Pour créer cet ensemble de données, nous avons rassemblé des commentaires de toutes les vidéos sur la chaîne YouTube officielle de l'armée américaine. Cela a été fait en utilisant l'API YouTube Data, qui nous a permis de collecter des commentaires sur les vidéos qui autorisaient les commentaires. Les commentaires ont été collectés sur plusieurs jours, ce qui a donné un total de plus de 173 000 commentaires.

Pour chaque commentaire, nous avons obtenu des détails cruciaux tels que le texte du commentaire, l'auteur, le nombre de likes qu'il a reçus et la date de publication. Analyser ces commentaires nous aide à comprendre comment le contenu de l'armée est reçu et ce qui pourrait influencer le recrutement de soldats.

Méthodologie d'annotation des Positions

Pour attribuer des étiquettes de position aux commentaires, nous avons utilisé une méthode appelée Data Programming. Cette approche nous permet d'étiqueter les commentaires en utilisant divers signaux faibles au lieu de dépendre uniquement des annotateurs humains. Les signaux faibles incluent des indicateurs comme le discours de haine, le sarcasme et le sentiment général exprimé dans le commentaire.

En utilisant ces signaux faibles, nous avons transformé la tâche complexe d'étiquetage des commentaires en quelque chose de plus gérable. Par exemple, les commentaires avec discours de haine sont généralement négatifs et indiquent souvent une opposition à l'armée.

Utilisation de grands modèles de langage pour la détection de position

Nous avons également intégré de grands modèles de langage (LLMs) pour aider à étiqueter les commentaires. Bien que l'efficacité des LLMs soit encore en cours d'exploration, ils ont montré un potentiel dans des tâches comme la détection de position lorsqu'ils sont combinés avec des prompts efficaces. Dans notre approche, les étiquettes générées par les LLM étaient vues comme bruyantes mais précieuses. En intégrant ces informations des LLM avec nos signaux faibles, nous avons considérablement amélioré la qualité des étiquettes de position.

Propriétés de l'ensemble de données

L'ensemble de données est composé de commentaires provenant d'un large éventail de vidéos, publiées entre 2010 et 2023. Au fil du temps, la chaîne YouTube de l'armée a augmenté régulièrement sa production vidéo. Cependant, l'Engagement peut varier énormément, certaines vidéos recevant de nombreux commentaires tandis que d'autres n'en ont que quelques-uns.

La plupart des commentaires sont relativement courts, ce qui est courant sur les réseaux sociaux. Nous avons également remarqué que les étiquettes de position avaient tendance à être biaisées vers des opinions négatives tant envers l'armée qu'envers le contenu des vidéos. Fait intéressant, il y avait aussi plusieurs instances de positions neutres.

Analyse des données

Analyser les commentaires révèle des motifs d'opinions envers l'armée américaine. Nous avons trouvé que de nombreux commentaires exprimaient des sentiments forts, soit en soutien à l'armée, soit contre elle et les vidéos qu'ils ont publiées. L'ensemble de données documente également comment ces opinions ont évolué au fil du temps, notamment lors d'événements significatifs liés au recrutement militaire.

Fait intéressant, certaines vidéos ont suscité un soutien écrasant, tandis que d'autres ont fait face à des critiques importantes. En analysant ces tendances, nous pouvons explorer comment le sentiment public envers l'armée change en réponse à différents types de messages.

Applications potentielles

L'ensemble de données a plusieurs applications potentielles. Il peut être une ressource précieuse pour ceux qui étudient le comportement en ligne, les interactions sur les réseaux sociaux et l'opinion publique. De plus, les chercheurs peuvent l'utiliser pour tester de nouvelles techniques de détection et d'analyse de position.

Un aspect clé de l'ensemble de données est sa pertinence pour les discussions contemporaines autour de l'armée, des théories du complot, de la désinformation et des problèmes sociétaux. En examinant les commentaires, les chercheurs peuvent obtenir des informations sur la manière dont la désinformation se propage et comment l'opinion publique est influencée par les interactions sur les réseaux sociaux.

Limitations de l'ensemble de données

Bien que l'ensemble de données soit vaste, il est limité aux commentaires qui étaient disponibles au moment de la collecte. Toutes les vidéos ne permettent pas les commentaires, ce qui restreint la portée de l'ensemble de données. De plus, les annotations de position reposaient fortement sur des modèles de langage locaux, ce qui peut limiter la portée et la profondeur de l'analyse.

À l'avenir, nous visons à élargir cet ensemble de données pour inclure les réponses aux vidéos militaires d'autres pays, permettant ainsi une perspective plus globale sur l'opinion publique.

Conclusion

Comprendre l'opinion publique par rapport à l'armée américaine est essentiel pour un recrutement et une communication efficaces. Avec l'ensemble de données DIVERSE, les chercheurs ont accès à une ressource substantielle pour analyser les positions exprimées dans les commentaires sur les vidéos liées à l'armée. Cette ressource peut faciliter l'exploration des sentiments et attitudes du public envers l'armée, comblant ainsi une lacune cruciale dans la recherche actuelle.

Avec l'essor des LLMs et des techniques d'étiquetage automatisé, nous espérons que cet ensemble de données stimulera de nouvelles avancées dans le domaine de l'analyse des réseaux sociaux, en particulier concernant les opinions nuancées associées au contenu militaire. Notre objectif ultime est que cet ensemble de données soit un tremplin pour améliorer notre compréhension des interactions complexes entre les réseaux sociaux, l'opinion publique et l'engagement militaire.

Source originale

Titre: DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model

Résumé: Stance detection of social media text is a key component of many real-world applications like evaluating marketing campaigns, evaluating political policies or candidates, or evaluating information environments. However, creating automatic stance labeling systems requires the manual annotation of stances, which is both tedious and resource-intensive. This paper introduces a stance labeling method that makes use of weak signals of sentence tone, then consolidating these signals with a Data Programmingmodel for the final stance label. In a time of international conflict, understanding the public opinion towards the country's military is crucial for recruitment. We present DIVERSE, a dataset involve stances towards YouTube videos of the US military (Dataset available at https://doi.org/10.5281/zenodo.10493803). On average, the videos have 200 comments each, and the stances skew slightly towards the "against" characterization for both the US army and the video.

Auteurs: Iain J. Cruickshank, Amir Soofi, Lynnette Hui Xian Ng

Dernière mise à jour: 2024-08-27 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2403.03334

Source PDF: https://arxiv.org/pdf/2403.03334

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires