VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
Ciência de ponta explicada de forma simples
VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.
― 5 min ler
Uma visão geral dos avanços no reconhecimento de fala através do VoxCeleb Challenge.
― 5 min ler
Um estudo mostra que i-vectors podem competir com modelos complexos em reconhecimento de fala.
― 5 min ler
O ESPnet-Codec melhora o treinamento e a avaliação de codecs neurais para áudio e fala.
― 8 min ler