Boris Ginsburg

Questo articolo esplora un nuovo modello per l'identificazione dell'intento e dei slot nel parlato.

2025-10-09T12:09:05+00:00 ― 6 leggere min

Un nuovo modello migliora il riconoscimento vocale in ambienti rumorosi concentrandosi su un singolo parlante.

2025-09-28T08:08:00+00:00 ― 4 leggere min

I modelli di linguaggio moderni migliorano l'accuratezza e la qualità della normalizzazione del testo.

2025-09-22T20:03:54+00:00 ― 5 leggere min

La famiglia Nemotron-4 340B offre modelli potenti per applicazioni diverse e generazione di dati sintetici.

2025-07-27T18:43:54+00:00 ― 8 leggere min

Un nuovo modello migliora la chiarezza della voce mirando a rumori ed echi.

2025-07-12T15:20:35+00:00 ― 6 leggere min

NEST offre un approccio più veloce ed efficiente per i compiti di riconoscimento vocale self-supervised.

2025-06-25T20:06:05+00:00 ― 6 leggere min

Sortformer integra la diarizzazione degli speaker e l'ASR per migliorare l'elaborazione audio.

2025-06-15T09:05:15+00:00 ― 5 leggere min

Esplorando la sfida GenSEC per migliorare l'accuratezza della trascrizione vocale.

2025-06-10T18:57:55+00:00 ― 5 leggere min

Un nuovo framework semplifica il riconoscimento vocale in ambienti affollati.

2025-06-07T20:31:10+00:00 ― 6 leggere min

Nuovo metodo per i modelli di linguaggio parla riduce la necessità di dati estesi.

2025-05-29T17:50:26+00:00 ― 6 leggere min

NeKo migliora la comunicazione tra macchine sistemando errori di linguaggio, traduzioni e testi.

2025-05-22T13:26:47+00:00 ― 7 leggere min

Star Attention migliora il modo in cui i modelli linguistici gestiscono lunghe sequenze di testo.

2025-05-05T12:49:20+00:00 ― 5 leggere min