Whisper-AT combina il riconoscimento vocale e il tagging audio per migliorare le prestazioni.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Whisper-AT combina il riconoscimento vocale e il tagging audio per migliorare le prestazioni.
― 6 leggere min
Un nuovo modello migliora la comprensione del parlato e dei suoni contemporaneamente.
― 6 leggere min
Un nuovo metodo migliora la robustezza dei test dei modelli linguistici dando priorità alla novità.
― 8 leggere min
ThReaD migliora le prestazioni dei LLM su compiti complessi grazie a una gestione dinamica dei thread.
― 6 leggere min
Self-MoE crea esperti specializzati per migliorare le prestazioni del modello linguistico.
― 6 leggere min
Uno sguardo ai risultati della sfida Codec-SUPERB e ai metodi di misurazione delle performance del codec.
― 5 leggere min
Le macchine imparano a trovare oggetti nelle immagini usando tecniche innovative.
― 5 leggere min