Uma abordagem eficiente em termos de recursos para ataques de backdoor em modelos avançados de aprendizado de máquina.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma abordagem eficiente em termos de recursos para ataques de backdoor em modelos avançados de aprendizado de máquina.
― 6 min ler
Aproveitando modelos de saída antecipada pra um aprendizado federado eficiente em sistemas de ASR.
― 10 min ler
Modelos de linguagem de desruído melhoram a correção de erros em sistemas de reconhecimento de fala usando dados sintéticos.
― 9 min ler
O novo modelo VPIDM melhora a clareza da fala em ambientes barulhentos.
― 7 min ler
Um estudo sobre robôs de mesa usando tecnologias de reconhecimento de linguagem natural e visual.
― 15 min ler
Novos métodos melhoram as previsões de modelos de linguagem sob diferentes condições de entrada.
― 8 min ler
Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.
― 8 min ler
Um jeito novo de testar a segurança de modelos de linguagem e as habilidades multilíngues.
― 9 min ler
Uma nova estratégia de defesa para LLMs contra ataques de backdoor.
― 6 min ler
Um novo método combina recursos acústicos e pontuações de confiança pra melhorar a correção de erros.
― 6 min ler
Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.
― 8 min ler
Esse estudo avalia a tecnologia de fala em línguas com poucos recursos, tipo o árabe tunisiano.
― 6 min ler
A Emilia oferece um conjunto de dados bem variado pra melhorar os modelos de geração de fala.
― 7 min ler
Este artigo fala sobre maneiras de melhorar a formatação de expressões numéricas em transcrições automáticas.
― 6 min ler
Um novo modelo tem como objetivo melhorar a qualidade da tradução de fala através de sistemas integrados.
― 6 min ler
Modelos de IA melhoram a precisão das conversões de fala para texto.
― 6 min ler
A pesquisa melhora os sistemas de ASR usando modelos de linguagem pra ter mais precisão.
― 8 min ler
Um método pra melhorar a qualidade do reconhecimento de fala em ambientes barulhentos.
― 7 min ler
Um novo método melhora as buscas de produtos em diferentes formatos de mídia.
― 6 min ler
A SAGE-RT cria dados sintéticos pra melhorar as avaliações de segurança de modelos de linguagem.
― 6 min ler
Novos métodos melhoram as avaliações da qualidade da voz para pacientes com problemas no sistema vocal.
― 7 min ler
Um olhar sobre como medir a precisão em sistemas de reconhecimento de fala com novos métodos.
― 6 min ler
Novo método melhora a precisão da ASR usando modelos de linguagem para transcrições melhores.
― 4 min ler
Novos métodos melhoram o reconhecimento de fala em situações desafiadoras com múltiplos falantes.
― 5 min ler
Um novo método usa dados de fala pra melhorar as avaliações de autismo.
― 7 min ler
A pesquisa sobre sistemas ASR modulares tem como objetivo melhorar o desempenho em ambientes barulhentos.
― 5 min ler
O Sortformer integra diarização de falantes e ASR pra melhorar o processamento de áudio.
― 6 min ler
Uma nova abordagem melhora a ASR ao focar em detalhes específicos do falante.
― 6 min ler
Uma ferramenta fácil de usar pra ajustar modelos de fala sem precisar de código complicado.
― 7 min ler
Um novo modelo ajuda robôs a entenderem melhor instruções humanas confusas.
― 6 min ler
CADA-GAN melhora o desempenho dos sistemas de ASR em vários ambientes de gravação.
― 7 min ler
Um novo método melhora as interações de fala ao integrar os processos de reconhecimento e resposta.
― 6 min ler
Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.
― 6 min ler
Um projeto melhora o reconhecimento de fala pra língua Malasar usando recursos em Tamil.
― 5 min ler
A Mamba melhora o reconhecimento de fala com rapidez e precisão, transformando a interação com os dispositivos.
― 5 min ler
Esse projeto tem como objetivo padronizar os dialetos bengaleses pra ter uma comunicação mais clara.
― 7 min ler
Um novo sistema de reconhecimento de fala melhora o reconhecimento médico pra um atendimento mais preciso com os pacientes.
― 7 min ler
Rastreia os falantes de forma eficiente em ambientes multilíngues usando reconhecimento automático de fala.
― 7 min ler
Novo modelo melhora significativamente a precisão do reconhecimento de fala em chinês.
― 7 min ler
Esforços pra documentar e preservar a língua neo-aramaica em risco de extinção.
― 6 min ler