I ricercatori migliorano il riconoscimento dei gesti usando tecniche di apprendimento innovative.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
I ricercatori migliorano il riconoscimento dei gesti usando tecniche di apprendimento innovative.
― 7 leggere min
Un sistema portatile riduce il rumore in cantiere, migliorando il comfort dei lavoratori e il benessere della comunità.
― 5 leggere min
Nuovi modelli come FluxMusic migliorano la creazione musicale a partire da testi scritti.
― 5 leggere min
Questo articolo parla dei benefici di unire i sistemi di riconoscimento vocale e facciale.
― 5 leggere min
Un nuovo modello migliora il riconoscimento vocale combinando in modo efficace input audio e visivi.
― 5 leggere min
Nuovi modelli migliorano la precisione nel rilevare la depressione tramite registrazioni vocali.
― 6 leggere min
Un nuovo metodo migliora le prestazioni del modello di linguaggio in vari compiti.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza del riconoscimento delle parole chiave usando dati audio non etichettati.
― 7 leggere min
La ricerca mostra che l'analisi del linguaggio può aiutare nella rilevazione precoce del lieve deterioramento cognitivo.
― 5 leggere min
Un nuovo metodo migliora la generazione musicale concentrandosi sugli accordi e sulla rappresentazione.
― 7 leggere min
I ricercatori hanno creato LibriheavyMix per migliorare il riconoscimento vocale in ambienti rumorosi.
― 5 leggere min
Nuovi metodi migliorano il riconoscimento vocale in situazioni difficili con più parlanti.
― 5 leggere min
Un dataset rivoluzionario potenzia gli strumenti AI per diagnosticare le malattie cardiache.
― 7 leggere min
Un nuovo sistema aiuta a far rivivere la lingua Hakka taiwanese.
― 6 leggere min
Nuovi metodi migliorano la chiarezza del parlato in ambienti rumorosi usando tecnologie avanzate.
― 5 leggere min
Nuovi metodi migliorano la separazione vocale in ambienti rumorosi.
― 5 leggere min
Questo articolo esplora metodi per migliorare i sistemi di sintesi vocale per lingue poco rappresentate.
― 7 leggere min
Questo studio esamina come la melodia varia e si collega tra diverse culture.
― 7 leggere min
Un framework che usa modelli di linguaggio grandi per creare dialoghi audio autentici.
― 6 leggere min
Un nuovo benchmark aiuta a valutare i tokenizer vocali per migliorare le prestazioni.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento vocale automatico mantenendo l'ordine dei suoni nel trasferimento delle conoscenze.
― 4 leggere min
Un nuovo modello migliora il riconoscimento vocale nelle conversazioni multilingue.
― 6 leggere min
Questo studio analizza l'efficacia dei LLM nella musicologia e la loro affidabilità.
― 6 leggere min
Questo studio analizza come il rumore possa migliorare la resilienza nel riconoscimento del parlato di fronte alle sfide.
― 6 leggere min
Scopri come un microfono in più migliora la rilevazione della direzione del suono in ambienti rumorosi.
― 5 leggere min
Un nuovo metodo migliora la conversione della voce usando meno campioni.
― 5 leggere min
Un trasduttore innovativo e leggero migliora l'efficienza e la precisione del riconoscimento vocale.
― 6 leggere min
Nuovi metodi migliorano la creazione musicale attraverso l'analisi audio e il controllo dell'utente.
― 7 leggere min
Nuovi metodi di watermarking proteggono i creatori nei modelli generativi audio.
― 4 leggere min
Scopri come DDSP migliora l'efficienza e la qualità della sintesi vocale.
― 6 leggere min
Questo studio migliora la SER grazie a una migliore pre-elaborazione e modelli di attenzione più efficienti.
― 5 leggere min
Un sistema per regolare la musica in tempo reale nei giochi e nei film.
― 6 leggere min
aTENNuate offre un miglioramento efficiente in tempo reale dei segnali vocali, migliorando la chiarezza della comunicazione.
― 5 leggere min
I ricercatori esplorano gli echi ultrasonici per misurazioni di distanza precise in ambienti interni tranquilli.
― 6 leggere min
Le tecniche di anonimizzazione degli speaker proteggono le informazioni personali mantenendo chiara la comunicazione.
― 6 leggere min
Nuovi metodi migliorano la chiarezza vocale in ambienti rumorosi per gli auricolari.
― 5 leggere min
Un nuovo modello migliora la separazione vocale e la trascrizione melodica nella musica.
― 5 leggere min
La ricerca svela come i neuroni nei modelli di linguaggio riconoscono le caratteristiche chiave del suono.
― 7 leggere min
Un nuovo modello semplifica la produzione audio eliminando automaticamente i suoni di respiro.
― 6 leggere min
I modelli di linguaggio per il parlato sembrano promettenti, ma faticano a identificare i relatori nelle conversazioni.
― 5 leggere min