Jee-weon Jung

VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.

2025-09-13T11:02:45+00:00 ― 5 min ler

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Uma visão geral dos avanços no reconhecimento de fala através do VoxCeleb Challenge.

2025-06-23T13:02:25+00:00 ― 5 min ler

Um estudo mostra que i-vectors podem competir com modelos complexos em reconhecimento de fala.

2025-06-10T06:49:10+00:00 ― 5 min ler

O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.

2025-06-03T03:09:30+00:00 ― 8 min ler