Questo articolo esplora un nuovo modello per l'identificazione dell'intento e dei slot nel parlato.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo articolo esplora un nuovo modello per l'identificazione dell'intento e dei slot nel parlato.
― 6 leggere min
Un nuovo modello migliora il riconoscimento vocale in ambienti rumorosi concentrandosi su un singolo parlante.
― 4 leggere min
I modelli di linguaggio moderni migliorano l'accuratezza e la qualità della normalizzazione del testo.
― 5 leggere min
La famiglia Nemotron-4 340B offre modelli potenti per applicazioni diverse e generazione di dati sintetici.
― 8 leggere min
Un nuovo modello migliora la chiarezza della voce mirando a rumori ed echi.
― 6 leggere min
NEST offre un approccio più veloce ed efficiente per i compiti di riconoscimento vocale self-supervised.
― 6 leggere min
Sortformer integra la diarizzazione degli speaker e l'ASR per migliorare l'elaborazione audio.
― 5 leggere min
Esplorando la sfida GenSEC per migliorare l'accuratezza della trascrizione vocale.
― 5 leggere min
Un nuovo framework semplifica il riconoscimento vocale in ambienti affollati.
― 6 leggere min
Nuovo metodo per i modelli di linguaggio parla riduce la necessità di dati estesi.
― 6 leggere min
NeKo migliora la comunicazione tra macchine sistemando errori di linguaggio, traduzioni e testi.
― 7 leggere min
Star Attention migliora il modo in cui i modelli linguistici gestiscono lunghe sequenze di testo.
― 5 leggere min