James Glass

Whisper-AT combina il riconoscimento vocale e il tagging audio per migliorare le prestazioni.

2025-10-12T08:10:05+00:00 ― 6 leggere min

Un nuovo modello migliora la comprensione del parlato e dei suoni contemporaneamente.

2025-09-04T18:08:15+00:00 ― 6 leggere min

Un nuovo metodo migliora la robustezza dei test dei modelli linguistici dando priorità alla novità.

2025-09-02T23:33:48+00:00 ― 8 leggere min

ThReaD migliora le prestazioni dei LLM su compiti complessi grazie a una gestione dinamica dei thread.

2025-08-06T10:20:00+00:00 ― 6 leggere min

Self-MoE crea esperti specializzati per migliorare le prestazioni del modello linguistico.

2025-07-27T22:17:12+00:00 ― 6 leggere min

Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.

2025-06-05T06:58:50+00:00 ― 5 leggere min

Le macchine imparano a trovare oggetti nelle immagini usando tecniche innovative.

2025-05-16T08:04:00+00:00 ― 5 leggere min