Analizzare le caratteristiche della musica rage attraverso il machine learning per una migliore classificazione dei generi.
Akul Kumar
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Analizzare le caratteristiche della musica rage attraverso il machine learning per una migliore classificazione dei generi.
Akul Kumar
― 5 leggere min
Articoli più recenti
Yuankun Xie, Chenxu Xiong, Xiaopeng Wang
― 6 leggere min
Zhiyong Wang, Xiaopeng Wang, Yuankun Xie
― 6 leggere min
Yin-Jyun Luo, Kin Wai Cheuk, Woosung Choi
― 5 leggere min
Karl El Hajal, Ajinkya Kulkarni, Enno Hermann
― 6 leggere min
Tianyi Xu, Kaixun Huang, Pengcheng Guo
― 5 leggere min
Un nuovo approccio migliora il riconoscimento delle frasi con cambio di codice nel linguaggio bilingue.
Xucheng Wan, Naijun Zheng, Kai Liu
― 6 leggere min
Un sistema innovativo automatizza la generazione di suoni per film e giochi.
Junwon Lee, Jaekwon Im, Dabin Kim
― 8 leggere min
Nuovi metodi migliorano il riconoscimento vocale in ambienti rumorosi.
Xujiang Xing, Mingxing Xu, Thomas Fang Zheng
― 5 leggere min
Il nuovo modello migliora la conversione vocale, specialmente per il parlato sussurrato e le applicazioni in tempo reale.
Anastasia Avdeeva, Aleksei Gusev
― 6 leggere min
Esplorando un nuovo approccio digitale alla modellazione del suono degli amplificatori per chitarra.
Yen-Tung Yeh, Yu-Hua Chen, Yuan-Chiao Cheng
― 5 leggere min
Presentiamo un sistema rivoluzionario per generare musica vocale hindustani.
Nithya Shikarpur, Krishna Maneesha Dendukuri, Yusong Wu
― 7 leggere min
Un nuovo metodo per modellare con precisione i compressori ottici usando reti neurali.
Riccardo Simionato, Stefano Fasciani
― 8 leggere min
WhisperMask cattura la voce chiaramente nei posti rumorosi, migliorando la comunicazione.
Hirotaka Hiraki, Shusuke Kanazawa, Takahiro Miura
― 6 leggere min
Nuovi metodi migliorano le valutazioni della qualità della voce per i pazienti con problemi al sistema vocale.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 6 leggere min
VoiceX semplifica il processo di creazione di voci personalizzate per diverse applicazioni.
Silvan Mertes, Daksitha Withanage Don, Otto Grothe
― 5 leggere min
Esaminando come i modelli vocali influenzano il significato e le prestazioni della tecnologia.
Nigel G. Ward, Divette Marco, Olac Fuentes
― 5 leggere min
NEST offre un approccio più veloce ed efficiente per i compiti di riconoscimento vocale self-supervised.
He Huang, Taejin Park, Kunal Dhawan
― 6 leggere min
I benchmark attuali non valutano bene la capacità dei modelli di collegare dati audio e visivi.
Liangyu Chen, Zihao Yue, Boshen Xu
― 6 leggere min
Wav2Small migliora il riconoscimento delle emozioni nel parlato con minori esigenze di risorse.
Dionyssos Kounadis-Bastian, Oliver Schrüfer, Anna Derington
― 5 leggere min
Uno sguardo alle complessità dell'identificazione delle tracce audio miste.
Viola Negroni, Davide Salvi, Paolo Bestagini
― 6 leggere min
Una panoramica dei ricchi dialetti del Tamil e dei metodi di identificazione.
M. Nanmalar, P. Vijayalakshmi, T. Nagarajan
― 5 leggere min
Un nuovo modo per rilevare problemi delle macchine senza compromettere la privacy dei dati.
Anbai Jiang, Yuchen Shi, Pingyi Fan
― 6 leggere min
VoiceTailor trasforma i sistemi TTS per output vocali personali e super efficienti.
Heeseung Kim, Sang-gil Lee, Jiheum Yeom
― 5 leggere min
Scopri come il suono si diffonde negli spazi e le sue applicazioni.
Shoichi Koyama, Juliano G. C. Ribeiro, Tomohiko Nakamura
― 7 leggere min
StyleSpeech migliora i sistemi TTS catturando le sfumature del linguaggio naturale.
Haowei Lou, Helen Paik, Wen Hu
― 6 leggere min
Esplorare metodi per migliorare la chiarezza del parlato in ambienti rumorosi tramite deep learning.
Shrishti Saha Shetu, Emanuël A. P. Habets, Andreas Brendel
― 6 leggere min
Il modello DualSpeech migliora la chiarezza TTS e la somiglianza con il parlante.
Jinhyeok Yang, Junhyeok Lee, Hyeong-Seok Choi
― 6 leggere min
Presentiamo SONICS, un dataset creato per riconoscere con precisione la musica generata dall'IA.
Md Awsafur Rahman, Zaber Ibn Abdul Hakim, Najibul Haque Sarker
― 9 leggere min
Nuovi metodi migliorano il rilevamento di audio falsificato in condizioni reali.
Xuechen Liu, Xin Wang, Junichi Yamagishi
― 4 leggere min
Un nuovo metodo migliora il riconoscimento vocale per l'hindi usando tecniche di pseudo-etichettatura.
Kaushal Santosh Bhogale, Deovrat Mehendale, Niharika Parasa
― 5 leggere min
EmoAttack sfrutta la conversione vocale emotiva per sfruttare le vulnerabilità nei sistemi di riconoscimento vocale.
Wenhan Yao, Zedong XingXiarun Chen, Jia Liu
― 5 leggere min
Questo articolo esamina tecniche per l'analisi automatica dei suoni vocali dei suricati.
Imen Ben Mahmoud, Eklavya Sarkar, Marta Manser
― 6 leggere min
Scopri come i trasformatori stanno rivoluzionando i sistemi di riconoscimento vocale in tutto il mondo.
Shruti Singh, Muskaan Singh, Virender Kadyan
― 8 leggere min
Un nuovo modello separa il timbro e la struttura per una creazione audio migliore.
Nils Demerlé, Philippe Esling, Guillaume Doras
― 7 leggere min
Un nuovo sistema utilizza la tecnologia per una classificazione della maturità del cocco più veloce e precisa.
June Anne Caladcad, Eduardo Jr Piedad
― 5 leggere min
Esplorando come tono e parole plasmano la nostra comprensione del sarcasmo.
Zhu Li, Xiyuan Gao, Yuqing Zhang
― 6 leggere min
Un nuovo metodo semplifica la creazione di dataset musicali per la trascrizione automatica.
S. Johanan Joysingh, P. Vijayalakshmi, T. Nagarajan
― 7 leggere min
Una panoramica sui progressi nel riconoscimento vocale grazie alla VoxCeleb Challenge.
Jaesung Huh, Joon Son Chung, Arsha Nagrani
― 5 leggere min
L'IA sta cambiando il modo in cui si compone e si vive la musica.
Sangjun Han, Jiwon Ham, Chaeeun Lee
― 6 leggere min
Un nuovo approccio migliora la modellazione della disfluenza per la terapia e l'apprendimento delle lingue.
Jiachen Lian, Xuanru Zhou, Zoe Ezzes
― 6 leggere min
Uno sguardo al micro-batch clipping e ai suoi vantaggi per l'allenamento dei modelli.
Lun Wang
― 6 leggere min
La ricerca dimostra come i LLM migliorano il riconoscimento vocale automatico nella lingua giapponese.
Yuka Ko, Sheng Li, Chao-Han Huck Yang
― 6 leggere min
Metodi innovativi migliorano la sicurezza nei sistemi di riconoscimento vocale.
Oğuzhan Kurnaz, Selim Can Demirtaş, Aykut Büker
― 5 leggere min
Un nuovo framework migliora la classificazione audio sfruttando la conoscenza dei dispositivi multi-modali.
Tiantian Feng, Tuo Zhang, Salman Avestimehr
― 5 leggere min
Un nuovo approccio migliora la chiarezza della comunicazione riducendo l'eco e i rumori di fondo.
Shrishti Saha Shetu, Naveen Kumar Desiraju, Jose Miguel Martinez Aponte
― 5 leggere min