Novas descobertas sobre o movimento da língua durante a fala
A pesquisa foca nos movimentos da língua pra ajudar na terapia da fala e no aprendizado de idiomas.
― 5 min ler
Índice
- Sobre o que são esses Dados?
- Por que é Importante Acompanhar o Movimento da Língua?
- Métodos para Rastrear o Movimento da Língua
- Coletando os Dados
- Como os Dados Foram Gravados
- Entendendo os Movimentos da Língua
- Segmentação do Sinal Acústico
- Aplicações dessa Pesquisa
- Conclusão
- Fonte original
- Ligações de referência
Esse artigo fala sobre uma nova coleção de Dados que inclui vídeos e sons de como as pessoas falam. O foco é entender como a língua se mexe quando a gente fala. Isso é importante para áreas como Terapia da Fala e aprendizagem de línguas. Os dados vêm de 17 jovens na região de Santander, na Colômbia, que não têm problemas de fala.
Sobre o que são esses Dados?
Os dados incluem vídeos de Ultrassom que mostram o movimento da língua enquanto se fala. Analisando esses vídeos, dá pra ver a forma e a posição da língua enquanto os sons são produzidos. Junto com os vídeos, também tem gravações de 30 frases curtas que os falantes pronunciaram. As frases foram gravadas usando um microfone especial pra captar um áudio claro.
Por que é Importante Acompanhar o Movimento da Língua?
Rastrear como a língua se mexe é útil em várias áreas. Por exemplo, em terapia da fala, saber como a língua se movimenta pode ajudar os terapeutas a entender e tratar problemas de fala. Na aprendizagem de línguas, pode ajudar os alunos a saber como pronunciar as palavras corretamente. Além disso, no processamento de fala, observar tanto os movimentos da língua quanto os sons que eles criam ajuda os pesquisadores a estudar como a gente produz a fala.
Métodos para Rastrear o Movimento da Língua
Os pesquisadores desenvolveram várias maneiras de acompanhar o movimento da língua e de outras partes da boca. Alguns métodos comuns incluem:
Cineradiografia por Raio-X: Esse método usa raios-X pra mostrar a língua e a boca em movimento. Mas tem preocupações de segurança por causa da exposição à radiação.
Articulografia Eletromagnética (EMA): Esse é um método popular que rastreia pontos específicos da língua, mas não fornece imagens completas.
Ressonância Magnética (RM): Embora dê uma visão completa da boca e da garganta, tem requisitos rigorosos para o falante e é caro.
Imagens por Ultrassom: Esse método usa ondas sonoras pra criar imagens da língua. É seguro, rápido e acessível, tornando-se uma escolha útil pra estudar a fala.
Coletando os Dados
Os dados pra esse projeto foram coletados numa universidade na Colômbia. Um total de 17 falantes, com idades entre 20 e 24 anos, foram convidados a dizer 30 frases em espanhol colombiano. As imagens por ultrassom da língua foram capturadas enquanto os falantes falavam.
Pra garantir gravações precisas, o microfone foi colocado a cerca de 5 cm da boca do falante. Essa distância ajuda a reduzir o ruído de fundo. A máquina de ultrassom também foi ajustada pra obter imagens claras dos movimentos da língua. Um gel especial foi usado no queixo do falante pra melhorar a qualidade da imagem.
Como os Dados Foram Gravados
Um programa de computador especial foi criado pra sincronizar as gravações de som e ultrassom. O som foi gravado em um formato de alta qualidade, e as imagens de ultrassom foram salvas como uma série de fotos em preto e branco. Cada sessão do falante durou cerca de 340 segundos, resultando em milhares de imagens.
Entendendo os Movimentos da Língua
As imagens coletadas mostram a forma da língua durante a fala. Pra analisar essas imagens, uma ferramenta de software foi usada pra destacar o contorno da língua em cada foto. Esse processo envolve selecionar pontos ao longo da língua e deixar o software preencher o resto. Às vezes, o software pode perder o controle da língua, então os pesquisadores checaram visualmente cada quadro e corrigiram quando necessário.
Acústico
Segmentação do SinalPra tornar os dados de som mais úteis, as gravações de áudio foram divididas em partes menores, focando em sons ou fonemas individuais. Isso foi feito com um software de edição de áudio, onde os pesquisadores ouviram as gravações e identificaram as seções silenciosas. Esses segmentos foram marcados e salvos pra análise futura.
Aplicações dessa Pesquisa
Esse novo banco de dados de fala pode ser usado pra várias finalidades:
Melhorando a Qualidade da Imagem: Uma maneira de melhorar as imagens de ultrassom é reduzindo o ruído, que pode esconder detalhes importantes. Técnicas de filtragem especiais ajudam a deixar as imagens mais claras.
Inversão Acústico-Articulatória: Esse método envolve descobrir como os movimentos da língua se relacionam com os sons produzidos. Usar esses dados pode melhorar tecnologias em reconhecimento de fala, síntese e verificação de falantes.
Reconhecimento de Falantes: Analisando os movimentos da língua, os pesquisadores podem aprender mais sobre falantes individuais. Isso pode ajudar a melhorar sistemas que identificam quem está falando baseado em seus padrões de fala únicos.
Conclusão
Esse trabalho apresenta um recurso valioso na forma de um banco de dados que inclui tanto imagens de ultrassom da língua quanto gravações de áudio correspondentes. A qualidade das imagens e do som vai facilitar estudos futuros na pesquisa de fala. Os planos pra o futuro incluem expandir esse banco de dados com mais falantes e desenvolver métodos automáticos pra analisar a fala e as imagens. Isso vai ajudar a tornar os dados ainda mais úteis pra várias aplicações em ciência e tecnologia da fala.
Título: A small vocabulary database of ultrasound image sequences of vocal tract dynamics
Resumo: This paper presents a new database consisting of concurrent articulatory and acoustic speech data. The articulatory data correspond to ultrasound videos of the vocal tract dynamics, which allow the visualization of the tongue upper contour during the speech production process. Acoustic data is composed of 30 short sentences that were acquired by a directional cardioid microphone. This database includes data from 17 young subjects (8 male and 9 female) from the Santander region in Colombia, who reported not having any speech pathology.
Autores: Margareth Castillo, Felipe Rubio, Dagoberto Porras, Sonia H. Contreras-Ortiz, Alexander Sepúlveda
Última atualização: 2023-10-14 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2308.13941
Fonte PDF: https://arxiv.org/pdf/2308.13941
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.