Un approccio efficiente in termini di risorse agli attacchi backdoor sui modelli di machine learning avanzati.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un approccio efficiente in termini di risorse agli attacchi backdoor sui modelli di machine learning avanzati.
― 6 leggere min
Sfruttare modelli a uscita anticipata per un federated learning efficiente nei sistemi ASR.
― 9 leggere min
I modelli linguistici denoising migliorano la correzione degli errori nei sistemi di riconoscimento vocale usando dati sintetici.
― 8 leggere min
Il nuovo modello VPIDM migliora la chiarezza della voce in ambienti rumorosi.
― 6 leggere min
Uno studio sui robot da scrivania che usano tecnologie di riconoscimento del linguaggio naturale e visivo.
― 13 leggere min
Nuovi metodi migliorano le previsioni dei modelli linguistici sotto diverse condizioni di input.
― 7 leggere min
Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.
― 7 leggere min
Un metodo fresco per testare la sicurezza del modello linguistico e le abilità multilingue.
― 8 leggere min
Una nuova strategia di difesa per i LLM contro gli attacchi backdoor.
― 6 leggere min
Un nuovo metodo combina caratteristiche acustiche e punteggi di fiducia per una correzione degli errori migliore.
― 5 leggere min
Questo studio presenta un dataset e un metodo per migliorare l'accuratezza dell'ASR cinese usando il Pinyin.
― 7 leggere min
Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.
― 5 leggere min
Emilia offre un dataset vario per migliorare i modelli di generazione vocale.
― 6 leggere min
Questo articolo parla di modi per migliorare la formattazione delle espressioni numeriche nei trascritti automatici.
― 5 leggere min
Un nuovo modello punta a migliorare la qualità della traduzione vocale attraverso sistemi integrati.
― 5 leggere min
I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.
― 5 leggere min
La ricerca migliora i sistemi ASR usando modelli linguistici per una maggiore precisione.
― 7 leggere min
Un metodo per migliorare la qualità del riconoscimento vocale in ambienti rumorosi.
― 7 leggere min
Un nuovo metodo migliora le ricerche di prodotti attraverso diversi formati multimediali.
― 6 leggere min
SAGE-RT crea dati sintetici per migliorare le valutazioni di sicurezza dei modelli linguistici.
― 6 leggere min
Nuovi metodi migliorano le valutazioni della qualità della voce per i pazienti con problemi al sistema vocale.
― 6 leggere min
Uno sguardo alla misurazione dell'accuratezza nei sistemi di riconoscimento vocale con nuovi metodi.
― 6 leggere min
Nuovo metodo migliora l'accuratezza dell'ASR usando modelli linguistici per trascrizioni migliori.
― 4 leggere min
Nuovi metodi migliorano il riconoscimento vocale in situazioni difficili con più parlanti.
― 5 leggere min
Un nuovo metodo sfrutta i dati vocali per migliorare le valutazioni sull'autismo.
― 6 leggere min
La ricerca sui sistemi ASR modulari punta a migliorare le performance in ambienti rumorosi.
― 4 leggere min
Sortformer integra la diarizzazione degli speaker e l'ASR per migliorare l'elaborazione audio.
― 5 leggere min
Un nuovo approccio migliora l'ASR concentrandosi su dettagli specifici del parlante.
― 5 leggere min
Uno strumento facile da usare per perfezionare i modelli di voce senza codice complesso.
― 7 leggere min
Un nuovo modello aiuta i robot a seguire le istruzioni umane poco chiare in modo più efficace.
― 6 leggere min
CADA-GAN migliora le performance dei sistemi ASR in vari ambienti di registrazione.
― 6 leggere min
Un nuovo metodo migliora le interazioni vocali integrando i processi di riconoscimento e risposta.
― 5 leggere min
Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.
― 5 leggere min
Un progetto migliora il riconoscimento vocale per la lingua Malasar usando risorse in Tamil.
― 5 leggere min
Mamba migliora il riconoscimento vocale con velocità e precisione, cambiando il modo di interagire con i dispositivi.
― 4 leggere min
Questo progetto punta a standardizzare i dialetti bangla per una comunicazione più chiara.
― 6 leggere min
Un nuovo sistema ASR migliora il riconoscimento vocale medico per una cura precisa dei pazienti.
― 6 leggere min
Tiene un modo efficiente per tenere traccia dei relatori in contesti multilingue usando il riconoscimento vocale automatico.
― 7 leggere min
Nuovo modello migliora significativamente l'accuratezza del riconoscimento vocale cinese.
― 6 leggere min
Sforzi per documentare e preservare la lingua neo-aramaica in via di estinzione.
― 6 leggere min