Shinji Watanabe

Processamento de Áudio e Fala VoxtLM: Uma Abordagem Unificada para Fala e Texto

VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.

2025-09-13T11:02:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Fala Simultânea

Melhorando traduções em tempo real com métodos inovadores e políticas inteligentes.

2025-09-07T17:23:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Novas Técnicas

Uma olhada nas melhorias em reconhecimento de fala pra aumentar a velocidade e a precisão.

2025-09-03T21:05:05+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Fala Através do Contexto

Novos métodos melhoram a tradução de fala ao focar em informações contextuais.

2025-09-02T22:24:45+00:00 ― 6 min ler

Som Avançando a Tecnologia de Voz com Dados de Código de Mistura

Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.

2025-09-02T21:36:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Uma Abordagem Universal para Melhoria de Fala

Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.

2025-09-02T02:10:10+00:00 ― 6 min ler

Som A Ascensão da Legendação Automática de Áudio

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Computação e linguagem Documentando Línguas Ameaçadas com IGT

Um novo método ajuda a preservar línguas em risco através de documentação detalhada.

2025-08-27T17:35:42+00:00 ― 9 min ler

Processamento de Áudio e Fala Avaliação de Modelos de Processamento de Fala com o SUPERB

Um novo modelo pra avaliar modelos de fundação em tarefas de fala.

2025-08-11T09:31:05+00:00 ― 9 min ler

Electrões Fortemente Correlacionados Estados Magnéticos em Quasicristais Icosaédricos

Explorando estados de ouriço e antiouriço em materiais magnéticos únicos.

2025-08-03T10:24:48+00:00 ― 6 min ler

Processamento de Áudio e Fala Reduzindo a Interferência pra uma Fala Mais Clara

Um novo sistema melhora a clareza da fala em ambientes com várias pessoas falando.

2025-08-02T14:10:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o Modelo 4D em Reconhecimento de Fala

Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.

2025-08-01T01:44:35+00:00 ― 8 min ler

Computação e linguagem Avanços na Tecnologia de Reconhecimento Automático de Fala

Novos métodos melhoram a precisão e a eficiência nos sistemas de reconhecimento de fala.

2025-07-22T03:41:05+00:00 ― 7 min ler

Processamento de Áudio e Fala SynesLM: Avançando a Tecnologia de Fala Audiovisual

Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.

2025-07-06T20:04:15+00:00 ― 7 min ler

Computação e linguagem Tradução em Tempo Real: Unindo Diferenças de Idioma

Esse sistema traduz a fala em inglês pra texto em alemão na hora, pra uma comunicação tranquila.

2025-06-27T20:53:06+00:00 ― 6 min ler

Imunologia Variantes do COVID-19 e Respostas às Vacinas: O Que Sabemos

Novas variantes da COVID-19 desafiam as vacinas atuais e mostram que ainda rola uma necessidade de pesquisa contínua.

2025-06-15T20:20:03+00:00 ― 5 min ler

Som ESPnet-EZ: Simplificando o Desenvolvimento de Modelos de Fala

Uma ferramenta fácil de usar pra ajustar modelos de fala sem precisar de código complicado.

2025-06-11T15:12:30+00:00 ― 7 min ler

Computação e linguagem Avanços no Reconhecimento de Fala com LLMs

Explorando o desafio GenSEC pra melhorar a precisão da transcrição de voz.

2025-06-10T18:57:55+00:00 ― 5 min ler

Computação e linguagem Avanços em Sistemas de Tradução de Fala Multilíngue

Novos métodos melhoram a precisão e a eficiência da tradução para várias línguas.

2025-06-10T16:14:30+00:00 ― 7 min ler

Computação e linguagem Avanços na Tecnologia de Texto para Fala: Alinhamento de Preferências

Descubra como o alinhamento de preferências melhora os sistemas de texto para fala, proporcionando experiências melhores para os usuários.

2025-06-10T06:53:36+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala Usando i-Vectores

Um estudo mostra que i-vectors podem competir com modelos complexos em reconhecimento de fala.

2025-06-10T06:49:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Escolhas de Design que Impactam o Desempenho do Modelo de Fala

Um estudo sobre como as escolhas de design afetam os modelos de fala.

2025-06-10T06:00:35+00:00 ― 8 min ler

Processamento de Áudio e Fala EVA: Uma Nova Era no Reconhecimento de Fala Audiovisual

A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.

2025-06-07T22:08:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avaliação de Codecs de Áudio Neural: Insights do Desafio Codec-SUPERB

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Codecs Neurais com ESPnet-Codec

O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.

2025-06-03T03:09:30+00:00 ― 8 min ler

Som Avanços em Reconhecimento Automático de Fala

Novos métodos melhoram como as máquinas reconhecem a linguagem falada.

2025-04-20T10:37:12+00:00 ― 9 min ler

Som Conheça a VERSA: Sua Companheira de Avaliação de Áudio

A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.

2025-01-28T09:33:18+00:00 ― 10 min ler

Processamento de Áudio e Fala Reconhecimento de Fala Audiovisual: Uma Nova Fronteira

Descubra como o AV-ASR combina áudio e visuais pra melhorar o reconhecimento de fala.

2025-01-24T21:39:36+00:00 ― 7 min ler