Explorando como modelos de ASR ajudam a identificar deepfakes de voz de forma eficaz.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 8 min ler
New Science Research Articles Everyday
Explorando como modelos de ASR ajudam a identificar deepfakes de voz de forma eficaz.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 8 min ler
Artigos mais recentes
Marco Pasini, Javier Nistal, Stefan Lattner
― 7 min ler
Shih-Heng Wang, Zih-Ching Chen, Jiatong Shi
― 6 min ler
Thai-Binh Nguyen, Alexander Waibel
― 7 min ler
Shih-heng Wang, Jiatong Shi, Chien-yu Huang
― 9 min ler
Chon In Leong, I-Ling Chung, Kin-Fong Chao
― 10 min ler
Pesquisadores desenvolvem técnicas pra adaptar modelos musicais de forma eficaz.
Yiwei Ding, Alexander Lerch
― 5 min ler
Explore como zonas sonoras pessoais transformam as experiências de áudio no dia a dia.
Neil Jerome A. Egarguin, Daniel Onofrei
― 8 min ler
Saiba sobre o CoDiff-VC, um novo método de conversão de voz.
Yuke Li, Xinfa Zhu, Hanzhao Li
― 6 min ler
Descubra como os dados de voz emocionais estão transformando a tecnologia de verificação de fala.
Nikhil Kumar Koditala, Chelsea Jui-Ting Ju, Ruirui Li
― 7 min ler
Pesquisadores desenvolvem novo modelo para vídeos de canto animado, melhorando as animações.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 min ler
O PSA-Net pretende combater a falsificação de voz para deixar a segurança dos dispositivos mais esperta.
Awais Khan, Ijaz Ul Haq, Khalid Mahmood Malik
― 6 min ler
Descubra um novo jeito de buscar stems musicais com precisão.
Alain Riou, Antonin Gagneré, Gaëtan Hadjeres
― 6 min ler
A Noro melhora a conversão de voz, tornando-a eficaz até em ambientes barulhentos.
Haorui He, Yuchen Song, Yuancheng Wang
― 7 min ler
A IA tá transformando a produção musical, levantando preocupações sobre criatividade e autenticidade.
Yupei Li, Manuel Milling, Lucia Specia
― 11 min ler
A tecnologia de clonagem de voz tá evoluindo, criando uma fala super realista que imita a conversa humana.
Shuoyi Zhou, Yixuan Zhou, Weiqing Li
― 7 min ler
Pesquisas mostram como nossos cérebros focam em sons no meio das distrações.
Simon Geirnaert, Iustina Rotaru, Tom Francart
― 6 min ler
Explore como novas tecnologias misturam texto, imagens e sons para criar conteúdo criativo.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 7 min ler
O SyncFlow junta geração de áudio e vídeo pra criar conteúdo de forma tranquila.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 5 min ler
Um novo chatbot que oferece conversas parecidas com as humanas e com consciência emocional.
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 3 min ler
A IA generativa ajuda a identificar os chamados dos pássaros em ambientes barulhentos pra uma conservação melhor.
Anthony Gibbons, Emma King, Ian Donohue
― 7 min ler
Novos métodos melhoram a avaliação da fala para quem tem disartria.
Yerin Choi, Jeehyun Lee, Myoung-Wan Koo
― 7 min ler
Descubra como o aprendizado zero-shot muda o jogo na reconhecimento de áudio ambiental.
Ysobel Sims, Stephan Chalup, Alexandre Mendes
― 9 min ler
Gravações de som ajudam a acompanhar os pássaros migratórios noturnos na Europa.
Louis Airale, Adrien Pajot, Juliette Linossier
― 7 min ler
Um olhar sobre como gerar fala sem texto usando novos métodos de áudio.
Joonyong Park, Daisuke Saito, Nobuaki Minematsu
― 7 min ler
Encontre a música perfeita feita sob medida pro seu gosto único com o Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 7 min ler
A StableVC muda a tecnologia de conversão de voz com velocidade e qualidade.
Jixun Yao, Yuguang Yang, Yu Pan
― 8 min ler
Examinando o viés na música de IA em favor dos estilos do Global Norte em relação às tradições do Global Sul.
Atharva Mehta, Shivam Chauhan, Monojit Choudhury
― 8 min ler
Aprenda como os tokens de fala contínua transformam a comunicação com máquinas.
Ze Yuan, Yanqing Liu, Shujie Liu
― 6 min ler
Descubra como a IA tá transformando música em experiências visuais de tirar o fôlego.
Leonardo Pina, Yongmin Li
― 8 min ler
WavFusion junta áudio, texto e visuais pra reconhecer emoções de forma melhor.
Feng Li, Jiusong Luo, Wanjun Xia
― 6 min ler
Explore a ascensão da música gerada por máquina e a busca por métodos de detecção.
Yupei Li, Hanqian Li, Lucia Specia
― 8 min ler
Combinar modelos de imagem com sistemas de áudio aumenta a eficiência e o desempenho.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 8 min ler
Um novo sistema revoluciona a forma como a música combina com o conteúdo de vídeo.
Shanti Stewart, Gouthaman KV, Lie Lu
― 7 min ler
A tecnologia de IA tá mudando a forma como a gente se comunica em situações de emergência.
Danush Venkateshperumal, Rahman Abdul Rafi, Shakil Ahmed
― 7 min ler
Descubra como a separação de fontes musicais e a transcrição mudam a forma como vivemos a música.
Bradford Derby, Lucas Dunker, Samarth Galchar
― 7 min ler
Um novo modelo mistura música e IA, criando melodias inovadoras.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 8 min ler
AI TrackMate oferece aos produtores um feedback objetivo pra melhorar suas habilidades musicais.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 7 min ler
Aprenda sobre a Distância de Frechet na Música e seu papel na avaliação de música gerada por IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 10 min ler
Descubra como a IA pode transformar o design de som em vídeos e jogos.
Sudha Krishnamurthy
― 6 min ler
Analisar a voz pode mostrar sinais de depressão e ajudar na intervenção precoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 6 min ler
Transforme zumbidos e batidas em áudio de alta qualidade com o Sketch2Sound.
Hugo Flores García, Oriol Nieto, Justin Salamon
― 8 min ler
Técnicas de marca d'água protegem os direitos dos artistas na geração de música com IA.
Pascal Epple, Igor Shilov, Bozhidar Stevanoski
― 8 min ler
Transformando áudio mono em experiências binaurais imersivas com técnicas inovadoras.
Alon Levkovitch, Julian Salazar, Soroosh Mariooryad
― 8 min ler
Pesquisas investigam como modelos de melhoria de fala mantêm a ênfase nas sílabas em meio ao barulho.
Rangavajjala Sankara Bharadwaj, Jhansi Mallela, Sai Harshitha Aluru
― 7 min ler
Um novo framework melhora o alinhamento de sons e visuais em vídeos.
Kexin Li, Zongxin Yang, Yi Yang
― 7 min ler