Simple Science

Ciência de ponta explicada de forma simples

# Física# Física e sociedade# Computadores e sociedade# Redes Sociais e de Informação

O Impacto das Redes Sociais no Uso da Língua

Analisando as mudanças na comunicação e no vocabulário nas redes sociais ao longo de 34 anos.

― 9 min ler


Mudanças na Linguagem dasMudanças na Linguagem dasRedes Sociaisnossos estilos de comunicação.Analisando como as redes sociais mudam
Índice

O crescimento das redes sociais mudou a forma como nós nos comunicamos. Criou novas maneiras de as pessoas se conectarem e se comunicarem. No entanto, essa mudança também trouxe alguns problemas, como a propagação de informações falsas e a formação de grupos com opiniões semelhantes. Este artigo analisa como a linguagem mudou nos Comentários das redes sociais ao longo dos últimos 34 anos, focando em como esses comentários se tornaram mais complexos ou simples.

Usamos uma coleção enorme de cerca de 300 milhões de comentários de diferentes plataformas de redes sociais para estudar essa mudança. Ao olhar para o número de palavras únicas que as pessoas usam e como a linguagem mudou ao longo do tempo, conseguimos ver padrões que nos contam mais sobre o comportamento dos Usuários.

Como as Redes Sociais Afetam a Linguagem

As redes sociais se tornaram uma parte grande das nossas vidas, impactando como compartilhamos informações, recebemos notícias e conversamos com amigos e familiares. Embora essas plataformas ajudem a nos conectar, elas também misturam entretenimento com discussões sérias, tornando difícil saber o que é verdade e o que não é. Pesquisadores estão agora investigando como as redes sociais afetam nossas conversas e opiniões. Eles descobriram que as pessoas costumam preferir ver informações que combinam com suas próprias crenças, o que pode levar a comunidades que pensam da mesma forma. Esse comportamento impacta como as pessoas expressam seus pensamentos e as palavras que escolhem usar.

Tradicionalmente, medir quantas palavras alguém conhece tem sido desafiador. Estudos mostraram que o tamanho do vocabulário é importante para ter sucesso na escola, pois está ligado a outras habilidades como leitura e compreensão de informações. No entanto, não se sabe muito sobre como o vocabulário muda na era da comunicação digital. Há preocupações de que a linguagem informal usada online possa prejudicar a escrita tradicional e as interações face a face. À medida que a linguagem evolui com a cultura e a tecnologia, vemos novas palavras e formas de escrever, como abreviações, grafias fofas e até emojis.

Apesar de muitas discussões sobre linguagem na internet, entender sua Complexidade - o quão complicado ou simples ela é - ainda é uma questão. Muitos estudos se concentraram em aspectos específicos da complexidade da linguagem, mas não olharam para o quadro completo, dificultando a criação de uma forma padrão de estudá-la. Existem diferentes visões sobre a complexidade da linguagem. Alguns a veem como uma teoria com pouca aplicação no mundo real, enquanto outros pensam nisso como algo que podemos medir e analisar.

Nosso estudo foca na complexidade dos comentários em situações reais nas redes sociais. Queremos ver se as redes sociais mudaram a forma como as pessoas se comunicam. Analisamos uma enorme quantidade de comentários de plataformas como Facebook, Twitter e YouTube, abrangendo quase três décadas e tocando em vários tópicos.

Vocabulário dos Usuários nas Redes Sociais

Nesta parte, examinamos quanto os usuários falam e o tipo de palavras que usam em diferentes plataformas de redes sociais. Para entender isso, juntamos todos os comentários de cada usuário em um único documento, limpamos o texto removendo quaisquer caracteres especiais ou números e contamos as palavras.

Definimos tokens como todas as palavras que alguém usou, enquanto types são as palavras únicas que não se repetem. Cada usuário recebe dois números: o número total de tokens e o número de types. Depois, analisamos como esses números variavam.

Descobrimos que os usuários costumam dizer uma quantidade similar em diferentes plataformas e tópicos, embora haja algumas diferenças. Os usuários tendem a fazer comentários mais curtos com menos palavras únicas. Curiosamente, embora muitos usuários geralmente fiquem em torno de dez palavras únicas, eles estão sempre introduzindo novas palavras em seus comentários.

Para entender o impacto de quanto os usuários falam, agrupamos eles em quatro classes - atividade baixa, média, alta e muito alta - com base no número de comentários que fizeram. Os resultados mostraram que níveis mais altos de atividade costumam resultar em um vocabulário mais amplo. No entanto, certos tópicos pareciam exigir mais palavras, mas suspeitamos que isso possa ser devido ao número diferente de comentários nas discussões.

Mudanças no Vocabulário ao Longo do Tempo

Em seguida, queríamos ver como os Vocabulários de usuários individuais crescem ao longo do tempo. Olhamos os comentários cronologicamente para rastrear quão rapidamente os usuários começam a usar novas palavras. Contando palavras únicas em vários comentários, conseguimos ver padrões.

A maioria dos usuários introduz novas palavras lentamente ao longo do tempo, com muito poucos alcançando um vocabulário amplo em seus primeiros comentários. As descobertas revelam mudanças contínuas que parecem ser consistentes entre plataformas e tópicos.

Complexidade dos Comentários

Não se trata apenas de quantas palavras os usuários conhecem; a complexidade dessas palavras e dos comentários que escrevem também importa. Existem muitas maneiras de medir essa complexidade, e escolhemos dois métodos que analisam a riqueza do vocabulário e a repetição.

Coletamos todos os comentários de usuários de um certo nível de atividade e calculamos essas medidas de complexidade. Os resultados mostraram que a maioria dos usuários escreve comentários que são moderadamente complicados e menos repetitivos. Ainda assim, alguns usuários produzem conteúdo excessivamente repetitivo, possivelmente indicando que essas contas podem ser automatizadas ou organizadas.

Ao randomizar os comentários dos usuários, descobrimos que, se os comentários fossem misturados, a variabilidade na complexidade das palavras diminuía. Isso sugere que os vocabulários individuais dos usuários são únicos e não facilmente substituídos por texto aleatório.

Evolução da Complexidade

À medida que continuamos nossa análise, queremos ver como a complexidade dos comentários mudou ao longo do tempo. Ao escolher conjuntos de dados específicos de diferentes períodos, podemos analisar como o número de palavras únicas muda de ano para ano.

Em quase todas as plataformas, o número de palavras únicas usadas parece diminuir ao longo do tempo, com algumas exceções como Twitter e YouTube, onde os usuários continuam usando uma gama mais ampla de palavras. Essa tendência sugere um declínio geral na atividade dos usuários e indica que os comentários estão ficando mais curtos e menos complexos.

Também olhamos como a complexidade dos comentários se correlaciona com o tempo usando uma abordagem estatística detalhada. Nossas descobertas mostram que, com o passar do tempo, os comentários geralmente se tornam mais simples e menos repetitivos. Apesar de algumas variações entre plataformas, há um padrão claro mostrando uma redução na riqueza da linguagem ao longo dos anos.

Resumo das Descobertas

Nossa análise aprofundada nos comentários de oito grandes plataformas de redes sociais revela padrões consistentes em como os usuários se comunicam. Ao longo de quase três décadas usando a internet, a linguagem parece ter se tornado mais simples, com comentários mais curtos e uma queda na riqueza do vocabulário. Embora a plataforma possa não influenciar muito a complexidade dos comentários, parece que a forma como as pessoas se comunicam é moldada por padrões sociais mais amplos.

Além disso, descobrimos que usuários individuais introduzem lentamente novas palavras ao longo do tempo, com a maioria mantendo um vocabulário relativamente pequeno. Isso sugere que certas formas de comunicação estão profundamente enraizadas na linguagem humana em vez de serem influenciadas apenas pela tecnologia ou por tópicos específicos. Ao estudar essas dinâmicas da linguagem em contextos digitais, proporcionamos insights valiosos sobre como a comunicação humana continua a evoluir na nossa era digital.

Coleta de Dados

Para conduzir essa pesquisa, vários conjuntos de dados foram coletados de diferentes plataformas de redes sociais. Aqui está como os dados foram coletados de algumas fontes notáveis:

  1. Facebook: Conjuntos de dados sobre Vacinas, Notícias e Brexit foram usados, com milhões de comentários coletados de grupos e páginas públicas ao longo de vários anos.
  2. Twitter: As contribuições incluíram discussões relacionadas a Vacinas e Notícias, com um grande número de comentários coletados sobre esses tópicos ao longo de vários anos.
  3. Reddit: Subreddits específicos foram escolhidos para vários tópicos e os dados foram coletados com base nas interações dos usuários nesses fóruns online.
  4. YouTube: Comentários relacionados a tópicos específicos foram coletados usando a API de Dados do YouTube, focando em discussões sobre Vacinas e Notícias.
  5. Usenet: Vários tópicos do sistema de discussão Usenet foram selecionados para estudar comentários de um período anterior na história da internet.

Cada plataforma forneceu uma perspectiva diferente sobre como os usuários interagem e a linguagem que usam, contribuindo para um melhor entendimento das tendências de comunicação digital.

Pré-processamento dos Comentários

Antes de analisar os comentários, nos certificaramos de limpar os dados. Isso envolveu dividir os comentários em palavras individuais, removendo quaisquer símbolos desnecessários e garantindo que apenas palavras significativas permanecessem para a análise.

Medindo a Complexidade

A complexidade da linguagem pode ser analisada de diferentes maneiras, incluindo quão rica é a vocabulação e quão repetitivos são os comentários. Para entender esses aspectos, várias medidas foram aplicadas para quantificar a complexidade dos comentários.

Focando tanto na riqueza do vocabulário quanto no nível de repetitividade, buscamos descobrir insights úteis sobre como as pessoas estão se comunicando nas redes sociais.

Conclusão

Em conclusão, as redes sociais mudaram fundamentalmente a forma como nos comunicamos. Através do nosso estudo, observamos tendências claras no uso da linguagem, vocabulário e complexidade dos comentários. Ao olhar como a linguagem evolui nas plataformas digitais, ganhamos um entendimento mais profundo tanto dos desafios quanto das oportunidades que surgem nesses vastos novos espaços para interação humana. As redes sociais continuam a moldar nosso comportamento linguístico, revelando tendências que são significativas em todo o escopo mais amplo da comunicação humana.

Fonte original

Título: The Evolution of Language in Social Media Comments

Resumo: Understanding the impact of digital platforms on user behavior presents foundational challenges, including issues related to polarization, misinformation dynamics, and variation in news consumption. Comparative analyses across platforms and over different years can provide critical insights into these phenomena. This study investigates the linguistic characteristics of user comments over 34 years, focusing on their complexity and temporal shifts. Utilizing a dataset of approximately 300 million English comments from eight diverse platforms and topics, we examine the vocabulary size and linguistic richness of user communications and their evolution over time. Our findings reveal consistent patterns of complexity across social media platforms and topics, characterized by a nearly universal reduction in text length, diminished lexical richness, but decreased repetitiveness. Despite these trends, users consistently introduce new words into their comments at a nearly constant rate. This analysis underscores that platforms only partially influence the complexity of user comments. Instead, it reflects a broader, universal pattern of human behaviour, suggesting intrinsic linguistic tendencies of users when interacting online.

Autores: Niccolò Di Marco, Edoardo Loru, Anita Bonetti, Alessandra Olga Grazia Serra, Matteo Cinelli, Walter Quattrociocchi

Última atualização: 2024-06-18 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2406.11450

Fonte PDF: https://arxiv.org/pdf/2406.11450

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes