Yihan Wu

EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.

2025-06-07T22:08:20+00:00 ― 5 leggere min

ESPnet-Codec migliora l'addestramento e la valutazione dei codec neurali per audio e parlato.

2025-06-03T03:09:30+00:00 ― 7 leggere min

Scopri come AV-ASR combina audio e immagini per migliorare il riconoscimento vocale.

2025-01-24T21:39:36+00:00 ― 6 leggere min