Sriram Ganapathy

Combinare modelli fondamentali e specializzati potenzia le capacità dell'IA in modo efficace.

2025-09-18T23:14:24+00:00 ― 6 leggere min

Nuovi metodi combinano audio e metadati per un riconoscimento linguistico migliore.

2025-09-08T07:09:30+00:00 ― 5 leggere min

Scopri come la dereverberazione migliora il riconoscimento vocale in ambienti rumorosi.

2025-09-05T12:45:40+00:00 ― 4 leggere min

E-SHARC migliora l'identificazione degli speaker in vari ambienti audio.

2025-08-28T06:22:45+00:00 ― 6 leggere min

Quest'articolo presenta un sistema di codifica duale per un apprendimento efficace della rappresentazione vocale.

2025-07-24T01:50:20+00:00 ― 6 leggere min

Nuovo metodo migliora la gestione degli accenti nei sistemi ASR tramite codici specializzati.

2025-07-22T04:29:40+00:00 ― 5 leggere min

Un nuovo benchmark aiuta a valutare i tokenizer vocali per migliorare le prestazioni.

2025-06-20T00:01:10+00:00 ― 6 leggere min

Un nuovo metodo combina significato e suono per migliorare il riconoscimento delle emozioni nel parlato.

2025-06-16T16:40:00+00:00 ― 7 leggere min

Nuovi metodi migliorano la comprensione delle previsioni dei modelli di IA.

2025-06-08T13:31:25+00:00 ― 6 leggere min

Esaminando come i nostri cervelli elaborano suoni e parole in situazioni diverse.

2025-05-10T20:35:30+00:00 ― 5 leggere min