Questo studio affronta le sfide nel catturare termini medici precisi da audio rumoroso.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio affronta le sfide nel catturare termini medici precisi da audio rumoroso.
― 8 leggere min
Un nuovo metodo integra informazioni acustiche nei modelli linguistici per una migliore riconoscimento vocale.
― 9 leggere min
I LLM migliorano la precisione nelle trascrizioni mediche, avvantaggiando la cura dei pazienti.
― 7 leggere min
Un nuovo sistema per valutare le prestazioni dei codec audio in diverse applicazioni.
― 7 leggere min
Una panoramica dell'ASR e dei suoi progressi nelle applicazioni moderne.
― 4 leggere min
L'IA sta migliorando gli impianti cocleari per avere un udito e una comunicazione migliore in ambienti difficili.
― 7 leggere min
Un nuovo metodo migliora la valutazione del parlato usando registrazioni intere.
― 8 leggere min
Un nuovo framework per valutare i modelli di base nei compiti di parlato.
― 8 leggere min
Un nuovo metodo crea direttamente i sottotitoli, migliorando l'accessibilità per diversi tipi di pubblico.
― 8 leggere min
Questo studio valuta le performance dei sistemi ASR con persone che balbettano.
― 8 leggere min
Un clip audio universale può silenziare modelli ASR avanzati come Whisper.
― 6 leggere min
Il riconoscimento vocale migliorato per le aule usando tecniche di allenamento avanzate rende l'apprendimento migliore.
― 7 leggere min
Il nuovo modello VPIDM migliora la chiarezza della voce in ambienti rumorosi.
― 6 leggere min
Un nuovo modello migliora il riconoscimento vocale usando più metodi di decodifica.
― 7 leggere min
mHuBERT-147 elabora il parlato in più lingue in modo efficiente.
― 5 leggere min
Migliorare l'accuratezza nella trascrizione di presentazioni scientifiche attraverso l'integrazione del parlato e delle immagini.
― 9 leggere min
Uno studio sulla traduzione dell'inglese nigeriano per una migliore accessibilità nei film di Nollywood.
― 6 leggere min
Nuovo modello migliora la traduzione da parlato a testo usando grandi modelli linguistici.
― 7 leggere min
Migliorare la tecnologia di anonimizzazione dei parlanti per nove lingue per garantire la privacy.
― 5 leggere min
Nuovo metodo migliora la gestione degli accenti nei sistemi ASR tramite codici specializzati.
― 5 leggere min
Questo studio valuta la tecnologia vocale in lingue a basso costo come l'arabo tunisino.
― 5 leggere min
Mamba promette bene contro i transformers nei compiti di linguaggio, specialmente per input lunghi.
― 5 leggere min
Scopri come il contesto migliora la precisione del riconoscimento vocale automatico e del riconoscimento delle parole.
― 5 leggere min
La ricerca presenta nuovi metodi per valutare i sistemi di riconoscimento vocale in polacco.
― 6 leggere min
Uno studio su come migliorare l'accuratezza delle trascrizioni grazie a un design migliore dei prompt.
― 6 leggere min
Un nuovo modello punta a migliorare la qualità della traduzione vocale attraverso sistemi integrati.
― 5 leggere min
Nuovi metodi puntano a migliorare il riconoscimento del linguaggio sussurrato nei sistemi automatici.
― 6 leggere min
I modelli di intelligenza artificiale migliorano l'accuratezza delle conversioni da parlato a testo.
― 5 leggere min
La ricerca migliora i sistemi ASR usando modelli linguistici per una maggiore precisione.
― 7 leggere min
Un nuovo sistema migliora il riconoscimento vocale usando parole chiave contestuali per una maggiore precisione.
― 6 leggere min
Nuovi metodi migliorano i modelli ASR per più lingue, preservando le conoscenze passate.
― 5 leggere min
Esaminare il riconoscimento vocale automatico nei sistemi giudiziari canadesi e il suo impatto.
― 7 leggere min
La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.
― 6 leggere min
SALSA migliora la precisione del riconoscimento vocale per le lingue a basse risorse integrando i modelli ASR e i modelli linguistici.
― 6 leggere min
Esaminare le performance del riconoscimento automatico della voce per utenti sordi e ipoudenti.
― 12 leggere min
Un nuovo metodo sfrutta i dati vocali per migliorare le valutazioni sull'autismo.
― 6 leggere min
Esaminando gli ultimi sviluppi nei modelli generativi in vari settori.
― 6 leggere min
Un nuovo modello combina il riconoscimento vocale e il riconoscimento delle entità per risultati migliori.
― 5 leggere min
Un nuovo approccio migliora i sistemi ASR per una comunicazione in aula migliore.
― 5 leggere min
Questo articolo esplora come input diversi possono aumentare l'accuratezza del riconoscimento vocale.
― 5 leggere min