Ruihua Song

ViCo migliora la generazione di commenti coinvolgenti per video online.

2025-10-05T12:44:30+00:00 ― 6 leggere min

Un nuovo framework migliora l'accuratezza delle didascalie delle immagini e riduce gli errori.

2025-06-20T09:09:36+00:00 ― 6 leggere min

EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.

2025-06-07T22:08:20+00:00 ― 5 leggere min

ESPnet-Codec migliora l'addestramento e la valutazione dei codec neurali per audio e parlato.

2025-06-03T03:09:30+00:00 ― 7 leggere min

Nuovo metodo migliora le interazioni realistiche nelle animazioni dei personaggi.

2025-02-05T11:49:12+00:00 ― 6 leggere min

Scopri come AV-ASR combina audio e immagini per migliorare il riconoscimento vocale.

2025-01-24T21:39:36+00:00 ― 6 leggere min