I ricercatori affrontano il problema del spoofing audio per migliorare la sicurezza del riconoscimento vocale.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 9 leggere min
Scienza all'avanguardia spiegata semplicemente
I ricercatori affrontano il problema del spoofing audio per migliorare la sicurezza del riconoscimento vocale.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 9 leggere min
Scopri come AV-ASR combina audio e immagini per migliorare il riconoscimento vocale.
Yihan Wu, Yichen Lu, Yifan Peng
― 6 leggere min
Un nuovo metodo sta cambiando il modo in cui le macchine apprendono dalla musica.
Julien Guinot, Elio Quinton, György Fazekas
― 7 leggere min
Nuova tecnologia trasforma i mormorii silenziosi in comunicazione udibile per chi ne ha bisogno.
Neil Shah, Shirish Karande, Vineet Gandhi
― 6 leggere min
Nuovi metodi nella sintesi vocale migliorano la chiarezza e l'adattabilità per diverse applicazioni.
Neil Shah, Ayan Kashyap, Shirish Karande
― 8 leggere min
Scopri la ricca tradizione dei canti della Chiesa Ortodossa Tewahedo Etiopica.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Li Su
― 7 leggere min
Un nuovo dataset mette in evidenza la bellezza dei canti ortodossi etiopici.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Worku Abebe Degife
― 7 leggere min
Nuovi progressi aiutano la tecnologia di riconoscimento vocale a servire meglio le persone con disturbi del linguaggio.
Jimmy Tobin, Katrin Tomanek, Subhashini Venugopalan
― 6 leggere min
Scopri come ETTA trasforma le parole in esperienze audio creative.
Sang-gil Lee, Zhifeng Kong, Arushi Goel
― 6 leggere min
Una nuova prospettiva su come la musica influisce sulle nostre emozioni.
Dengming Zhang, Weitao You, Ziheng Liu
― 7 leggere min
Un nuovo sistema per creare danze di gruppo sincronizzate e naturali.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 8 leggere min
Un nuovo approccio nel riconoscimento delle emozioni si concentra sui movimenti della bocca invece che sui suoni.
Shreya G. Upadhyay, Ali N. Salman, Carlos Busso
― 6 leggere min
Scopri come Stable-TTS migliora la tecnologia text-to-speech per un'esperienza simile a quella umana.
Wooseok Han, Minki Kang, Changhun Kim
― 7 leggere min
La tecnologia innovativa delle onde sonore offre nuove informazioni sulla velocità di camminata indoors.
Sheng Lyu, Chenshu Wu
― 6 leggere min
Gli assistenti audio stanno diventando più intelligenti con AQA-K, migliorando le risposte grazie alla conoscenza.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 6 leggere min
I ricercatori studiano come il nostro cervello controlla il linguaggio e le sue implicazioni per la ripresa.
Eric Easthope
― 7 leggere min
Scopri come il testo può trasformarsi in audio con modelli all'avanguardia.
Chia-Yu Hung, Navonil Majumder, Zhifeng Kong
― 3 leggere min