Artigos mais recentes para ASR

Criptografia e segurança Novo Método de Ataque Backdoor para Grandes Modelos de ML

Uma abordagem eficiente em termos de recursos para ataques de backdoor em modelos avançados de aprendizado de máquina.

2025-08-07T00:01:36+00:00 ― 6 min ler

Computação e linguagem Avanços em Aprendizado Federado para Reconhecimento de Fala

Aproveitando modelos de saída antecipada pra um aprendizado federado eficiente em sistemas de ASR.

2025-08-06T09:48:24+00:00 ― 10 min ler

Aprendizagem de máquinas Avanços em Reconhecimento Automático de Fala com Modelos de Linguagem de Denoise

Modelos de linguagem de desruído melhoram a correção de erros em sistemas de reconhecimento de fala usando dados sintéticos.

2025-08-03T22:34:10+00:00 ― 9 min ler

Processamento de Áudio e Fala Avanços em Melhoria de Fala com VPIDM

O novo modelo VPIDM melhora a clareza da fala em ambientes barulhentos.

2025-08-03T16:54:05+00:00 ― 7 min ler

Robótica Avanços em Robôs de Nível Desktop

Um estudo sobre robôs de mesa usando tecnologias de reconhecimento de linguagem natural e visual.

2025-08-03T13:39:45+00:00 ― 15 min ler

Computação e linguagem Aprimorando a Estabilidade do Modelo de Linguagem Contra Ataques

Novos métodos melhoram as previsões de modelos de linguagem sob diferentes condições de entrada.

2025-08-03T07:56:30+00:00 ― 8 min ler

Processamento de Áudio e Fala Apresentando o Modelo 4D em Reconhecimento de Fala

Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.

2025-08-01T01:44:35+00:00 ― 8 min ler

Inteligência Artificial Nova Abordagem para Avaliar Modelos Multilíngues

Um jeito novo de testar a segurança de modelos de linguagem e as habilidades multilíngues.

2025-07-28T02:37:54+00:00 ― 9 min ler

Inteligência Artificial Mitigando Ataques de Backdoor em Modelos de Linguagem

Uma nova estratégia de defesa para LLMs contra ataques de backdoor.

2025-07-26T23:22:36+00:00 ― 6 min ler

Computação e linguagem Melhorando a Correção de Erros de Fala em Sistemas de ASR

Um novo método combina recursos acústicos e pontuações de confiança pra melhorar a correção de erros.

2025-07-25T20:45:15+00:00 ― 6 min ler

Computação e linguagem Melhorando o reconhecimento de fala em chinês através da regularização de pinyin

Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.

2025-07-25T07:47:55+00:00 ― 8 min ler

Computação e linguagem Avanço da Tecnologia de Fala para o Árabe Tunisiano

Esse estudo avalia a tecnologia de fala em línguas com poucos recursos, tipo o árabe tunisiano.

2025-07-21T12:18:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando a Emilia: Um Novo Conjunto de Dados de Geração de Fala

A Emilia oferece um conjunto de dados bem variado pra melhorar os modelos de geração de fala.

2025-07-20T09:34:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Formatação de Números em Transcrições de ASR

Este artigo fala sobre maneiras de melhorar a formatação de expressões numéricas em transcrições automáticas.

2025-07-14T15:55:35+00:00 ― 6 min ler

Computação e linguagem Avanços na Tecnologia de Tradução de Fala

Um novo modelo tem como objetivo melhorar a qualidade da tradução de fala através de sistemas integrados.

2025-07-11T02:54:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Colaboração de IA

Modelos de IA melhoram a precisão das conversões de fala para texto.

2025-07-07T09:50:10+00:00 ― 6 min ler

Computação e linguagem Melhorando o reconhecimento de voz para termos especializados

A pesquisa melhora os sistemas de ASR usando modelos de linguagem pra ter mais precisão.

2025-07-06T20:41:12+00:00 ― 8 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Aprendizado de Representação de Ruído de Contexto

Um método pra melhorar a qualidade do reconhecimento de fala em ambientes barulhentos.

2025-07-01T23:28:15+00:00 ― 7 min ler

Multimédia Avanços na Recuperação de Produtos em E-Commerce

Um novo método melhora as buscas de produtos em diferentes formatos de mídia.

2025-07-01T08:45:24+00:00 ― 6 min ler

Inteligência Artificial SAGE-RT: Um Novo Método para a Segurança de Modelos de Linguagem

A SAGE-RT cria dados sintéticos pra melhorar as avaliações de segurança de modelos de linguagem.

2025-06-28T06:37:42+00:00 ― 6 min ler

Som Avanços na Avaliação da Qualidade da Voz Usando Tecnologia

Novos métodos melhoram as avaliações da qualidade da voz para pacientes com problemas no sistema vocal.

2025-06-26T07:26:15+00:00 ― 7 min ler

Computação e linguagem Avaliando a Precisão do Reconhecimento Automático de Fala

Um olhar sobre como medir a precisão em sistemas de reconhecimento de fala com novos métodos.

2025-06-22T20:50:45+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento Automático de Fala com Modelos de Linguagem

Novo método melhora a precisão da ASR usando modelos de linguagem para transcrições melhores.

2025-06-21T20:33:15+00:00 ― 4 min ler

Som Avanços no Reconhecimento de Fala com Várias Pessoas

Novos métodos melhoram o reconhecimento de fala em situações desafiadoras com múltiplos falantes.

2025-06-20T21:52:55+00:00 ― 5 min ler

Computação e linguagem Usando Dados de Fala para Diagnóstico de Autismo

Um novo método usa dados de fala pra melhorar as avaliações de autismo.

2025-06-19T19:12:12+00:00 ― 7 min ler

Processamento de Áudio e Fala Aprimorando o Reconhecimento Automático de Fala com Modularidade

A pesquisa sobre sistemas ASR modulares tem como objetivo melhorar o desempenho em ambientes barulhentos.

2025-06-16T17:28:35+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala com Sortformer

O Sortformer integra diarização de falantes e ASR pra melhorar o processamento de áudio.

2025-06-15T09:05:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala em Ambientes com Vários Falantes

Uma nova abordagem melhora a ASR ao focar em detalhes específicos do falante.

2025-06-11T17:38:15+00:00 ― 6 min ler

Som ESPnet-EZ: Simplificando o Desenvolvimento de Modelos de Fala

Uma ferramenta fácil de usar pra ajustar modelos de fala sem precisar de código complicado.

2025-06-11T15:12:30+00:00 ― 7 min ler

Robótica Melhorando o Reconhecimento de Fala de Robôs para uma Colaboração Melhor

Um novo modelo ajuda robôs a entenderem melhor instruções humanas confusas.

2025-06-11T14:53:18+00:00 ― 6 min ler

Som Avançando o Reconhecimento Automático de Fala com CADA-GAN

CADA-GAN melhora o desempenho dos sistemas de ASR em vários ambientes de gravação.

2025-06-07T23:45:30+00:00 ― 7 min ler

Computação e linguagem Avançando o Reconhecimento de Fala com Técnicas Implícitas

Um novo método melhora as interações de fala ao integrar os processos de reconhecimento e resposta.

2025-06-06T03:21:12+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliação de Codecs de Áudio Neural: Insights do Desafio Codec-SUPERB

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

Computação e linguagem Inovando o Reconhecimento de Fala para a Língua Malasar

Um projeto melhora o reconhecimento de fala pra língua Malasar usando recursos em Tamil.

2025-05-23T02:48:37+00:00 ― 5 min ler

Som Mamba: Avançando a Tecnologia de Reconhecimento de Fala

A Mamba melhora o reconhecimento de fala com rapidez e precisão, transformando a interação com os dispositivos.

2025-05-19T22:39:54+00:00 ― 5 min ler

Computação e linguagem Conectando Dialetos Bangla: Uma Abordagem Unificada

Esse projeto tem como objetivo padronizar os dialetos bengaleses pra ter uma comunicação mais clara.

2025-05-12T19:19:18+00:00 ― 7 min ler

Processamento de Áudio e Fala United-MedASR: Melhorando o Reconhecimento de Fala Médica

Um novo sistema de reconhecimento de fala melhora o reconhecimento médico pra um atendimento mais preciso com os pacientes.

2025-04-30T00:58:50+00:00 ― 7 min ler

Computação e linguagem Um Novo Método para Reconhecimento de Fala Atribuído ao Falante

Rastreia os falantes de forma eficiente em ambientes multilíngues usando reconhecimento automático de fala.

2025-04-20T15:33:18+00:00 ― 7 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala com Pinyin

Novo modelo melhora significativamente a precisão do reconhecimento de fala em chinês.

2025-04-15T08:10:03+00:00 ― 7 min ler

Computação e linguagem Salvando o Neo-Aramaico: Uma Língua em Perigo

Esforços pra documentar e preservar a língua neo-aramaica em risco de extinção.

2025-04-13T14:26:15+00:00 ― 6 min ler