Controlla gli effetti audio usando descrizioni semplici per fare aggiustamenti più facili al suono.
Annie Chu, Patrick O'Reilly, Julia Barnett
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Controlla gli effetti audio usando descrizioni semplici per fare aggiustamenti più facili al suono.
Annie Chu, Patrick O'Reilly, Julia Barnett
― 6 leggere min
Presentiamo un nuovo modello e benchmark per valutare i compiti multi-audio.
Yiming Chen, Xianghu Yue, Xiaoxue Gao
― 6 leggere min
Un nuovo sistema modella l'intensità emotiva nei personaggi animati per un realismo migliore.
Jingyi Xu, Hieu Le, Zhixin Shu
― 6 leggere min
OpenSep automatizza la separazione audio per esperienze sonore più chiare senza bisogno di input manuali.
Tanvir Mahmud, Diana Marculescu
― 6 leggere min
PALM migliora il riconoscimento audio ottimizzando la rappresentazione dei prompt e l'efficienza.
Asif Hanif, Maha Tufail Agro, Mohammad Areeb Qazi
― 5 leggere min
Esplora come le curve e il calibro dei fili influenzano il suono dei pickup delle chitarre.
Charles Batchelor, Jack Gooding, William Marriott
― 8 leggere min
Un nuovo metodo migliora il riconoscimento vocale per registrazioni lunghe.
Hao Yen, Shaoshi Ling, Guoli Ye
― 5 leggere min
Questo studio analizza come audio, video e testo lavorano insieme nel riconoscimento vocale.
Chen Chen, Xiaolou Li, Zehua Liu
― 7 leggere min
Un nuovo modello migliora la naturalezza nei sistemi di sintesi vocale analizzando i modelli di intonazione.
Tomilov A. A., Gromova A. Y., Svischev A. N
― 5 leggere min
Un nuovo modello migliora la rappresentazione del parlato per le lingue africane, aumentando l'inclusività nella tecnologia.
Jesujoba O. Alabi, Xuechen Liu, Dietrich Klakow
― 5 leggere min
Un nuovo modello migliora la creazione musicale usando melodie e descrizioni testuali.
Shaopeng Wei, Manzhen Wei, Haoyu Wang
― 5 leggere min
Nuovo metodo per i modelli di linguaggio parla riduce la necessità di dati estesi.
Ke-Han Lu, Zhehuai Chen, Szu-Wei Fu
― 6 leggere min
Scopri come funziona la conversione vocale e le sue applicazioni interessanti.
Arip Asadulaev, Rostislav Korst, Vitalii Shutov
― 4 leggere min
Scopri come CCI migliora le valutazioni della qualità multimediale.
Alessandro Ragano, Helard Becerra Martinez, Andrew Hines
― 6 leggere min
I ricercatori uniscono segnali audio e visivi per rilevare le bugie in modo più preciso.
Abdelrahman Abdelwahab, Akshaj Vishnubhatla, Ayaan Vaswani
― 6 leggere min
Una nuova rete basata sulla voce colma le lacune linguistiche nelle emergenze.
Majid Behravan, Elham Mohammadrezaei, Mohamed Azab
― 6 leggere min
Scopri come gli assistenti virtuali capiscono meglio i comandi degli utenti.
Ognjen, Rudovic, Pranay Dighe
― 6 leggere min
MACE migliora la didascalia audio collegando i suoni a descrizioni testuali accurate.
Satvik Dixit, Soham Deshmukh, Bhiksha Raj
― 5 leggere min
Usare il machine learning per prevedere la reazione del pubblico ai cover delle canzoni.
Aris J. Aristorenas
― 7 leggere min
Un nuovo modo per migliorare la classificazione attraverso la Distribuzione della Distanza Angolare.
Antonio Almudévar, Romain Serizel, Alfonso Ortega
― 6 leggere min
Nuovi metodi migliorano gli strumenti di comunicazione per le persone con difficoltà nel parlare.
Macarious Hui, Jinda Zhang, Aanchan Mohan
― 7 leggere min
I ricercatori usano le onde sonore per stimare le posizioni umane senza telecamere.
Yusuke Oumi, Yuto Shibata, Go Irie
― 8 leggere min
Nuovi metodi che usano modelli di linguaggio migliorano il riconoscimento dei suoni in mezzo al rumore di fondo.
Han Yin, Yang Xiao, Jisheng Bai
― 6 leggere min
Fish-Speech migliora la tecnologia vocale per un'esperienza di comunicazione più naturale.
Shijia Liao, Yuxuan Wang, Tianyu Li
― 6 leggere min
EmoSphere++ permette alle macchine di esprimere emozioni come gli esseri umani, migliorando le interazioni.
Deok-Hyeon Cho, Hyung-Seok Oh, Seung-Bin Kim
― 7 leggere min
U-COTANS migliora il rilevamento dei confini subacquei usando tecniche di deep learning.
Toros Arikan, Luca M. Chackalackal, Fatima Ahsan
― 6 leggere min
PIAST offre una collezione unica di musica per pianoforte per i ricercatori.
Hayeon Bang, Eunjin Choi, Megan Finch
― 5 leggere min
Le macchine imparano a collegare suoni e immagini in spazi 3D.
Artem Sokolov, Swapnil Bhosale, Xiatian Zhu
― 7 leggere min
Come i nuovi metodi stanno trasformando l'identificazione degli oratori nelle registrazioni audio.
Petr Pálka, Federico Landini, Dominik Klement
― 6 leggere min
Uno sguardo ai suoni tradizionali dell'arpa-lira seperewa.
Kelvin L Walls, Iran R Roman, Kelsey Van Ert
― 6 leggere min
Scopri come TSE migliora il riconoscimento vocale in ambienti affollati usando indizi testuali.
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 6 leggere min
Un nuovo sistema rileva le urla per migliorare la sicurezza dei lavoratori nei cantieri.
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 8 leggere min
Esplorare nuovi metodi per riconoscere le emozioni nel parlato usando modelli avanzati.
Pourya Jafarzadeh, Amir Mohammad Rostami, Padideh Choobdar
― 8 leggere min
Un sistema nuovo per unire campioni audio e aiutare i creatori di musica a innovare facilmente.
Christopher Tralie, Ben Cantil
― 5 leggere min
Uno sguardo a come la compressione della gamma dinamica migliora le esperienze audio.
Haoran Sun, Dominique Fourer, Hichem Maaref
― 6 leggere min
Gli assistenti vocali aiutano a identificare i primi segnali di problemi di memoria negli anziani.
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 7 leggere min
Un sistema crea musica in tempo reale basata sulle narrazioni dei giochi di ruolo da tavolo.
Felipe Marra, Lucas N. Ferreira
― 7 leggere min
Esaminando i punti di forza, le debolezze e il futuro dello SLAM-ASR nel riconoscimento vocale.
Shashi Kumar, Iuliia Thorbecke, Sergio Burdisso
― 5 leggere min
Un nuovo metodo per chiarire e visualizzare le immagini del campo sonoro.
Risako Tanigawa, Kenji Ishikawa, Noboru Harada
― 7 leggere min
Un progetto migliora il riconoscimento vocale per la lingua Malasar usando risorse in Tamil.
Leena G Pillai, Kavya Manohar, Basil K Raju
― 5 leggere min