Simple Science

La science de pointe expliquée simplement

# Physique# Physique et société# Ordinateurs et société# Réseaux sociaux et d'information

L'impact des réseaux sociaux sur l'utilisation de la langue

Examiner les changements dans la communication et le vocabulaire sur les réseaux sociaux au cours de 34 ans.

― 10 min lire


Changements de langue surChangements de langue surles réseaux sociauxmodifient nos styles de communication.Analyser comment les réseaux sociaux
Table des matières

La croissance des réseaux sociaux a changé la façon dont on se parle. Ça a créé de nouvelles manières pour les gens de se connecter et de communiquer. Mais ce changement a aussi amené des problèmes, comme la diffusion de fausses informations et la formation de groupes avec des opinions similaires. Cet article examine comment le langage a évolué dans les Commentaires sur les réseaux sociaux au cours des 34 dernières années, en se concentrant sur la Complexité ou la simplicité de ces commentaires.

On a utilisé une énorme collection d'environ 300 millions de commentaires provenant de différentes plateformes de réseaux sociaux pour étudier ce changement. En regardant le nombre de mots uniques utilisés par les gens et comment le langage a évolué avec le temps, on peut voir des motifs qui nous en disent plus sur le comportement des Utilisateurs.

Comment les réseaux sociaux affectent le langage

Les réseaux sociaux sont devenus une grande partie de nos vies, influençant comment on partage des infos, reçoit des nouvelles, et discute avec des amis et la famille. Bien que ces plateformes nous aident à nous connecter, elles mélangent aussi le divertissement avec des discussions sérieuses, rendant difficile de savoir ce qui est vrai et ce qui ne l'est pas. Les chercheurs examinent maintenant comment les réseaux sociaux influencent nos conversations et opinions. Ils ont découvert que les gens préfèrent souvent voir des informations qui correspondent à leurs propres croyances, ce qui peut mener à des communautés qui pensent de la même manière. Ce comportement impacte la façon dont les gens expriment leurs pensées et les mots qu'ils choisissent d'utiliser.

Traditionnellement, mesurer combien de mots quelqu'un connaît a été assez compliqué. Des études ont montré que la taille du vocabulaire est importante pour réussir à l'école parce que ça se relie à d'autres compétences comme la lecture et la compréhension des infos. Cependant, on ne sait pas grand-chose sur comment le vocabulaire change à l'ère de la communication numérique. On s'inquiète que le langage informel utilisé en ligne pourrait nuire à l'écriture traditionnelle et aux interactions en face-à-face. Au fur et à mesure que le langage évolue avec la culture et la technologie, on voit de nouveaux mots et manières d'écrire, comme des abréviations, des orthographes mignonnes, et même des émojis.

Malgré de nombreuses discussions sur le langage sur internet, comprendre sa complexité - à quel point il est compliqué ou simple - reste une question. Beaucoup d'études se sont concentrées sur des aspects spécifiques de la complexité linguistique mais n'ont pas vu l'ensemble du tableau, rendant difficile de créer une façon standard de l'étudier. Il existe différentes opinions sur la complexité linguistique. Certains la voient comme une théorie avec peu d'utilisation dans le monde réel, tandis que d'autres pensent que c'est quelque chose qu'on peut mesurer et analyser.

Notre étude se concentre sur la complexité des commentaires dans des situations réelles sur les réseaux sociaux. On veut voir si les réseaux sociaux ont changé la façon de communiquer des gens. On a analysé une énorme quantité de commentaires sur des plateformes comme Facebook, Twitter, et YouTube, sur presque trois décennies et touchant à plusieurs sujets.

Vocabulaire des utilisateurs sur les réseaux sociaux

Dans cette partie, on examine combien les utilisateurs disent et quel genre de mots ils utilisent sur différentes plateformes de réseaux sociaux. Pour comprendre ça, on a combiné tous les commentaires de chaque utilisateur dans un seul document, nettoyé le texte en enlevant les caractères spéciaux ou les chiffres, et compté les mots.

On a défini les "tokens" comme tous les mots qu'une personne a utilisés, tandis que les "types" sont les mots uniques qui ne se répètent pas. Chaque utilisateur se voit attribuer deux chiffres : le nombre total de tokens et le nombre de types. Ensuite, on a regardé comment ces chiffres variaient.

On a découvert que les utilisateurs disent généralement une quantité similaire sur différentes plateformes et sujets, bien qu'il y ait quelques différences. Les utilisateurs tendent à faire des commentaires plus courts avec moins de mots uniques. Fait intéressant, même si beaucoup d'utilisateurs se limitent généralement à une dizaine de mots uniques, ils introduisent constamment de nouveaux mots dans leurs commentaires.

Pour comprendre l'impact de combien les utilisateurs parlent, on les a regroupés en quatre classes - faible, moyen, élevé, et très élevé - en fonction du nombre de commentaires qu'ils ont faits. Les résultats montrent que des niveaux d'activité plus élevés entraînent généralement un vocabulaire plus large. Cependant, certains sujets semblaient nécessiter plus de mots, mais on soupçonne que ça pourrait être dû aux différents nombres de commentaires dans les discussions.

Changements de vocabulaire au fil du temps

Ensuite, on voulait voir comment le vocabulaire des utilisateurs individuels évolue dans le temps. On a regardé les commentaires de manière chronologique pour suivre comment rapidement les utilisateurs commencent à utiliser de nouveaux mots. En comptant les mots uniques à travers plusieurs commentaires, on pouvait voir des motifs.

La plupart des utilisateurs introduisent de nouveaux mots lentement au fil du temps, avec très peu atteignant un vocabulaire large dans leurs premiers commentaires. Les résultats révèlent des changements continus qui semblent être cohérents à travers les plateformes et les sujets.

Complexité des commentaires

Ce n'est pas seulement une question de combien de mots les utilisateurs connaissent ; la complexité de ces mots et des commentaires qu'ils écrivent compte aussi. Il existe plusieurs manières de mesurer cette complexité, et on a choisi deux méthodes qui examinent la richesse du vocabulaire et la répétition.

On a rassemblé tous les commentaires des utilisateurs d'un certain niveau d'activité et calculé ces mesures de complexité. Les résultats ont montré que la plupart des utilisateurs écrivent des commentaires modérément compliqués et moins répétitifs. Cependant, certains utilisateurs produisent un contenu excessivement répétitif, ce qui pourrait indiquer que ces comptes sont peut-être automatisés ou organisés.

En randomisant les commentaires des utilisateurs, on a découvert que si les commentaires étaient mélangés, la variabilité dans la complexité des mots diminuait. Cela suggère que les Vocabulaires individuels des utilisateurs sont uniques et pas facilement remplacés par du texte aléatoire.

Évolution de la complexité

Au fur et à mesure qu'on continue notre analyse, on veut voir comment la complexité des commentaires a changé au fil du temps. En choisissant des ensembles de données spécifiques de différentes périodes, on peut analyser comment le nombre de mots uniques change d'année en année.

Sur la plupart des plateformes, le nombre de mots uniques utilisés semble diminuer au fil du temps, avec quelques exceptions comme Twitter et YouTube, où les utilisateurs continuent d'utiliser une plus large gamme de mots. Cette tendance laisse entendre un déclin général de l'activité des utilisateurs et suggère que les commentaires deviennent plus courts et moins complexes.

On a aussi regardé comment la complexité des commentaires est corrélée avec le temps en utilisant une approche statistique détaillée. Nos résultats montrent qu'avec le temps, les commentaires deviennent généralement plus simples et moins répétitifs. Malgré quelques variations à travers les plateformes, il y a un motif clair montrant une réduction de la richesse du langage au fil des ans.

Résumé des découvertes

Notre plongée dans les commentaires de huit grandes plateformes de réseaux sociaux révèle des motifs cohérents dans la façon dont les utilisateurs communiquent. En presque trois décennies d'utilisation d'internet, le langage semble être devenu plus simple, avec des commentaires plus courts et une baisse de la richesse du vocabulaire. Bien que la plateforme puisse ne pas influencer fortement la complexité des commentaires, il semble que la manière dont les gens communiquent soit façonnée par des motifs sociaux plus larges.

De plus, on a trouvé que les utilisateurs individuels introduisent lentement de nouveaux mots au fil du temps, la plupart maintenant un vocabulaire relativement petit. Cela suggère que certaines manières de communiquer sont profondément ancrées dans le langage humain plutôt que seulement influencées par la technologie ou des sujets spécifiques. En étudiant ces dynamiques du langage dans des contextes numériques, on fournit des aperçus précieux sur comment la communication humaine continue d'évoluer à notre époque numérique.

Collecte de données

Pour mener à bien cette recherche, divers ensembles de données ont été rassemblés à partir de différentes plateformes de réseaux sociaux. Voici comment les données ont été collectées à partir de certaines sources notables :

  1. Facebook : Des ensembles de données concernant les vaccins, les nouvelles et le Brexit ont été utilisés, avec des millions de commentaires collectés à partir de groupes et de pages publiques au cours de plusieurs années.
  2. Twitter : Les contributions comprenaient des discussions liées aux vaccins et aux nouvelles, avec un grand nombre de commentaires collectés sur ces sujets au fil des années.
  3. Reddit : Des sous-forums spécifiques ont été choisis pour divers sujets, et des données ont été collectées en fonction des interactions des utilisateurs dans ces forums en ligne.
  4. YouTube : Des commentaires liés à des sujets spécifiques ont été rassemblés en utilisant l'API de données YouTube, en se concentrant sur les discussions autour des vaccins et des nouvelles.
  5. Usenet : Divers sujets du système de discussion Usenet ont été sélectionnés pour étudier des commentaires d'une époque antérieure de l'histoire d'internet.

Chaque plateforme a fourni une perspective différente sur la façon dont les utilisateurs interagissent et le langage qu'ils utilisent, contribuant à une meilleure compréhension des tendances de communication numérique.

Prétraitement des commentaires

Avant d'analyser les commentaires, on s'est assuré de nettoyer les données. Cela impliquait de décomposer les commentaires en mots individuels, d'enlever tous les symboles inutiles, et de garantir que seuls les mots significatifs restaient pour l'analyse.

Mesure de la complexité

La complexité du langage peut être regardée de différentes manières, y compris la richesse du vocabulaire et la répétitivité des commentaires. Pour comprendre ces aspects, diverses mesures ont été appliquées pour quantifier la complexité des commentaires.

En se concentrant à la fois sur la richesse du vocabulaire et le niveau de répétitivité, on visait à découvrir des aperçus utiles sur la manière dont les gens communiquent sur les réseaux sociaux.

Conclusion

Pour conclure, les réseaux sociaux ont fondamentalement changé notre manière de communiquer. À travers notre étude, on a observé des tendances claires dans l'utilisation du langage, le vocabulaire, et la complexité des commentaires. En étudiant comment le langage évolue sur les plateformes numériques, on acquiert une compréhension plus profonde des défis et des opportunités qui émergent de ces vastes nouveaux espaces d'interaction humaine. Les réseaux sociaux continuent de façonner notre comportement linguistique, révélant des tendances qui ont du sens dans le cadre plus large de la communication humaine.

Source originale

Titre: The Evolution of Language in Social Media Comments

Résumé: Understanding the impact of digital platforms on user behavior presents foundational challenges, including issues related to polarization, misinformation dynamics, and variation in news consumption. Comparative analyses across platforms and over different years can provide critical insights into these phenomena. This study investigates the linguistic characteristics of user comments over 34 years, focusing on their complexity and temporal shifts. Utilizing a dataset of approximately 300 million English comments from eight diverse platforms and topics, we examine the vocabulary size and linguistic richness of user communications and their evolution over time. Our findings reveal consistent patterns of complexity across social media platforms and topics, characterized by a nearly universal reduction in text length, diminished lexical richness, but decreased repetitiveness. Despite these trends, users consistently introduce new words into their comments at a nearly constant rate. This analysis underscores that platforms only partially influence the complexity of user comments. Instead, it reflects a broader, universal pattern of human behaviour, suggesting intrinsic linguistic tendencies of users when interacting online.

Auteurs: Niccolò Di Marco, Edoardo Loru, Anita Bonetti, Alessandra Olga Grazia Serra, Matteo Cinelli, Walter Quattrociocchi

Dernière mise à jour: 2024-06-18 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2406.11450

Source PDF: https://arxiv.org/pdf/2406.11450

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires