Distinguindo entre risadas felizes e risadas zombeteiras
Esse estudo analisa como o riso transmite emoções através da análise do som.
― 5 min ler
Neste estudo, a gente analisou risadas pra ver se conseguia diferenciar risadas felizes de risadas que zombam ou ridicularizam alguém. Pegamos amostras de áudio de um banco de dados chamado Google AudioSet, que tem uma variedade de sons, incluindo risadas. O nosso objetivo era identificar risadas que representam interação amigável e risadas que expressam um sentimento negativo.
Coleta de Dados
A gente começou escolhendo amostras de risadas do Google AudioSet. Focamos em selecionar risadas que eram claramente positivas (como risadas alegres) ou negativas (como risadas de zombaria). Tivemos um conjunto de regras pra escolher quais amostras usar:
- A risada tinha que fazer parte de uma situação social clara, onde dava pra saber se era amigável ou de zombaria.
 - Só incluímos risadas de homens adultos pra manter a consistência.
 
Excluímos amostras com má qualidade de áudio, como aquelas que eram muito barulhentas ou tinham sons sobrepostos. Depois de uma seleção cuidadosa, acabamos com 90 amostras de risadas-45 de risadas felizes e 45 de risadas de zombaria.
Visão Geral dos Experimentos
Realizamos dois tipos principais de experimentos:
- Análise Fonética: Estudamos os sons das risadas pra entender melhor as suas características.
 - Testes de Aprendizado de Máquina: Usamos diferentes métodos de aprendizado de máquina pra ver se conseguimos classificar automaticamente os tipos de risadas.
 
Experimento de Percepção
No nosso experimento de percepção, convidamos participantes pra ouvir as amostras de risadas e descrever como elas os faziam sentir. Os participantes podiam escolher entre três opções:
- a) Agradável, amigável ou afetuoso
 - b) Desagradável, agressivo ou hostil
 - c) Outro
 
Tivemos uma mistura de participantes homens e mulheres, com idades entre 23 e 35 anos. Eles ouviram cada amostra de risada e depois escolheram sua resposta.
Resultados do Experimento de Percepção
Pelas respostas, descobrimos que as pessoas conseguiam identificar risadas felizes mais confiavelmente do que risadas de zombaria. Na verdade, 87% das amostras de risadas felizes foram reconhecidas corretamente, em comparação com 64% das amostras de risadas de zombaria. Isso mostra que os ouvintes podem geralmente diferenciar esses dois tipos de risadas só pelo som.
Características Acústicas da Risada
Depois, analisamos as características sonoras das amostras de risada pra ver o que as deixava diferentes. Focamos em várias características-chave:
- Duração: Quanto tempo a risada durou.
 - Tom (F0): A frequência dos sons da risada.
 - Volume: Quão alta a risada era.
 
Usamos um software especial pra analisar essas características. Curiosamente, embora encontramos algumas tendências, nem todas as diferenças eram significativas. Por exemplo, notamos que risadas de zombaria tendiam a ter um tom mais alto e eram mais monótonas em comparação com risadas felizes, que costumavam ter uma faixa de tom mais ampla e mais variação de volume.
Análise de Aprendizado de Máquina
Pra testar mais nossas descobertas, usamos técnicas de aprendizado de máquina. Utilizamos vários algoritmos pra tentar classificar as amostras de risada com base nas suas características acústicas. Não tínhamos um grande conjunto de dados, então usamos um método chamado validação cruzada, que nos permitiu testar nossos modelos sem precisar de um conjunto de treinamento separado.
Tentamos diferentes modelos de aprendizado de máquina, incluindo Máquinas de Vetores de Suporte (SVM) e um algoritmo chamado XGBoost. Nossos resultados mostraram que esses algoritmos também conseguiam distinguir entre risadas felizes e de zombaria, apoiando nossas descobertas anteriores do experimento de percepção.
Principais Descobertas
Taxas de Reconhecimento: Nossos ouvintes conseguiram diferenciar corretamente entre os dois tipos de risadas acima dos níveis aleatórios, mostrando que a risada carrega sinais emocionais claros.
Características Sonoras: Várias características ajudaram a distinguir risadas de zombaria de risadas felizes, particularmente em tom e algumas medidas de intensidade.
Precisão do Aprendizado de Máquina: Nossos modelos de aprendizado de máquina conseguiram classificar os tipos de risada com sucesso, com o melhor desempenho sendo alcançado usando SVM com características acústicas específicas.
Conclusão
Essa pesquisa destaca como a risada pode transmitir diferentes emoções e como podemos analisá-la usando tanto a percepção humana quanto técnicas de aprendizado de máquina. Descobrimos que as pessoas geralmente têm um bom reconhecimento de risadas felizes em comparação com risadas de zombaria. Além disso, características sonoras específicas podem indicar se a risada é amigável ou de zombaria.
Direções Futuras
Olhando pra frente, há espaço pra mais estudos nessa área. Recomendamos coletar mais amostras de risadas de uma diversidade de pessoas pra construir um banco de dados maior. Entender risadas pode ter aplicações práticas, como melhorar sistemas de comunicação e aprimorar diálogos automatizados.
Em resumo, a capacidade de diferenciar entre tipos de risadas com base nos sons abre novas possibilidades tanto pra análise de interação social quanto pra avanços tecnológicos em reconhecimento de emoções.
Título: Happy or Evil Laughter? Analysing a Database of Natural Audio Samples
Resumo: We conducted a data collection on the basis of the Google AudioSet database by selecting a subset of the samples annotated with \textit{laughter}. The selection criterion was to be present a communicative act with clear connotation of being either positive (laughing with) or negative (being laughed at). On the basis of this annotated data, we performed two experiments: on the one hand, we manually extract and analyze phonetic features. On the other hand, we conduct several machine learning experiments by systematically combining several automatically extracted acoustic feature sets with machine learning algorithms. This shows that the best performing models can achieve and unweighted average recall of .7.
Autores: Aljoscha Düsterhöft, Felix Burkhardt, Björn W. Schuller
Última atualização: 2023-05-23 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2305.14023
Fonte PDF: https://arxiv.org/pdf/2305.14023
Licença: https://creativecommons.org/licenses/by-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.