Ziyang Ma

Nuovi metodi per selezionare dati vocali riducono il labeling mentre migliorano la precisione del riconoscimento.

2025-09-20T13:53:50+00:00 ― 5 leggere min

Nuovi metodi migliorano il collegamento tra descrizioni testuali e eventi sonori.

2025-08-31T16:09:40+00:00 ― 7 leggere min

ELLA-V migliora la qualità e il controllo del testo in voce, superando i modelli precedenti.

2025-08-30T01:17:40+00:00 ― 6 leggere min

Un nuovo modello migliora la comprensione del suono spaziale da parte delle macchine.

2025-08-26T15:30:45+00:00 ― 5 leggere min

MuPT utilizza la notazione ABC per una generazione musicale efficace con l'IA.

2025-08-12T09:00:00+00:00 ― 5 leggere min

MAP-Neo punta a trasparenza e performance nella modellazione del linguaggio AI.

2025-08-04T21:04:18+00:00 ― 6 leggere min

GigaSpeech 2 offre un'enorme raccolta di dati per le lingue a bassa risorsa per migliorare il riconoscimento vocale.

2025-07-29T02:29:15+00:00 ― 5 leggere min

Un nuovo metodo migliora le prestazioni del modello di linguaggio in vari compiti.

2025-06-21T02:44:25+00:00 ― 6 leggere min

VQTalker crea avatar parlanti realistici in diverse lingue, migliorando le interazioni digitali.

2025-03-09T22:14:42+00:00 ― 7 leggere min