Boris Ginsburg

Novo modelo melhora o reconhecimento de fala em ambientes barulhentos ao focar em um único falante.

2025-09-28T08:08:00+00:00 ― 4 min ler

Modelos de linguagem modernos melhoram a precisão e a qualidade da normalização de texto.

2025-09-22T20:03:54+00:00 ― 5 min ler

A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.

2025-07-27T18:43:54+00:00 ― 8 min ler

Um novo modelo melhora a clareza da fala, atacando ruídos e ecos.

2025-07-12T15:20:35+00:00 ― 6 min ler

O NEST oferece uma abordagem mais rápida e eficiente para tarefas de fala auto-supervisionadas.

2025-06-25T20:06:05+00:00 ― 7 min ler

O Sortformer integra diarização de falantes e ASR pra melhorar o processamento de áudio.

2025-06-15T09:05:15+00:00 ― 6 min ler

Explorando o desafio GenSEC pra melhorar a precisão da transcrição de voz.

2025-06-10T18:57:55+00:00 ― 5 min ler

Um novo framework simplifica o reconhecimento de fala em ambientes movimentados.

2025-06-07T20:31:10+00:00 ― 6 min ler

Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.

2025-05-29T17:50:26+00:00 ― 7 min ler

NeKo melhora a comunicação entre máquinas corrigindo erros de fala, traduções e texto.

2025-05-22T13:26:47+00:00 ― 7 min ler

A Star Attention melhora a forma como os modelos de linguagem lidam com longas sequências de texto.

2025-05-05T12:49:20+00:00 ― 5 min ler