Un nuevo método logra alta precisión en el reconocimiento de voz usando pocos datos.
Irfan Nafiz Shahan, Pulok Ahmed Auvi
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método logra alta precisión en el reconocimiento de voz usando pocos datos.
Irfan Nafiz Shahan, Pulok Ahmed Auvi
― 7 minilectura
Revolucionando la creación de sonido para músicos con opciones de efectos de audio infinitas.
Alec Wright, Alistair Carson, Lauri Juvela
― 7 minilectura
Una herramienta que conecta la IA y las ideas humanas en el análisis musical.
Prashanth Thattai Ravikumar
― 7 minilectura
Explorando cómo los trucos de audio confunden a los modelos de lenguaje.
Wanqi Yang, Yanda Li, Meng Fang
― 7 minilectura
Descubre cómo DiM-Gestor mejora los gestos de personajes virtuales en tiempo real.
Fan Zhang, Siyuan Zhao, Naye Ji
― 5 minilectura
Una visión general de los deepfakes, sus riesgos y un nuevo conjunto de datos en Hindi.
Sukhandeep Kaur, Mubashir Buhari, Naman Khandelwal
― 7 minilectura
La investigación revela cómo las emociones moldean nuestros recuerdos a través de tecnología innovadora.
Joonwoo Kwon, Heehwan Wang, Jinwoo Lee
― 9 minilectura
Un nuevo sistema de ASR mejora el reconocimiento de voz médica para una atención al paciente precisa.
Sourav Banerjee, Ayushi Agarwal, Promila Ghosh
― 7 minilectura
Descubre cómo la transferencia de estilo musical le da nueva vida a tus canciones favoritas.
Sooyoung Kim, Joonwoo Kwon, Heehwan Wang
― 6 minilectura
Un nuevo método genera voz a partir de videos, mejorando el doblaje y el aprendizaje de idiomas.
Akshita Gupta, Tatiana Likhomanenko, Karren Dai Yang
― 7 minilectura
Explorando cómo los modelos de ASR ayudan a identificar deepfakes de voz de manera efectiva.
Davide Salvi, Amit Kumar Singh Yadav, Kratika Bhagtani
― 8 minilectura
Descubre cómo los CAM están cambiando la forma en que producimos y vivimos la música.
Marco Pasini, Javier Nistal, Stefan Lattner
― 7 minilectura
Una guía para aprender un nuevo idioma de manera efectiva con consejos prácticos.
Shih-Heng Wang, Zih-Ching Chen, Jiatong Shi
― 6 minilectura
Realiza un seguimiento eficiente de los hablantes en entornos multilingües usando reconocimiento automático de voz.
Thai-Binh Nguyen, Alexander Waibel
― 7 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen el lenguaje hablado.
Shih-heng Wang, Jiatong Shi, Chien-yu Huang
― 9 minilectura
Explorando el mundo de la transferencia de estilo musical fallida usando grabaciones de audio divertidas.
Chon In Leong, I-Ling Chung, Kin-Fong Chao
― 10 minilectura
Los investigadores desarrollan técnicas para adaptar modelos de música de manera efectiva.
Yiwei Ding, Alexander Lerch
― 5 minilectura
Explora cómo las zonas de sonido personales transforman las experiencias de audio en la vida cotidiana.
Neil Jerome A. Egarguin, Daniel Onofrei
― 8 minilectura
Aprende sobre CoDiff-VC, un nuevo método en la conversión de voz.
Yuke Li, Xinfa Zhu, Hanzhao Li
― 6 minilectura
Descubre cómo los datos de voz emocional están transformando la tecnología de verificación de hablantes.
Nikhil Kumar Koditala, Chelsea Jui-Ting Ju, Ruirui Li
― 7 minilectura
Investigadores desarrollan un nuevo modelo para videos de canto animado, mejorando las animaciones.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 minilectura
PSA-Net busca combatir el engaño de voz para una seguridad más inteligente en los dispositivos.
Awais Khan, Ijaz Ul Haq, Khalid Mahmood Malik
― 6 minilectura
Descubre un nuevo método para recuperar stems musicales con precisión.
Alain Riou, Antonin Gagneré, Gaëtan Hadjeres
― 6 minilectura
Noro mejora la conversión de voz, haciéndola efectiva incluso en ambientes ruidosos.
Haorui He, Yuchen Song, Yuancheng Wang
― 7 minilectura
La IA está transformando la producción musical, generando preocupaciones sobre la creatividad y la autenticidad.
Yupei Li, Manuel Milling, Lucia Specia
― 12 minilectura
La tecnología de clonación de voz está avanzando, creando un habla realista que imita la conversación humana.
Shuoyi Zhou, Yixuan Zhou, Weiqing Li
― 7 minilectura
La investigación revela cómo nuestros cerebros se enfocan en los sonidos a pesar de las distracciones.
Simon Geirnaert, Iustina Rotaru, Tom Francart
― 6 minilectura
Explora cómo la nueva tecnología mezcla texto, imágenes y sonidos para contenido creativo.
Shufan Li, Konstantinos Kallidromitis, Akash Gokul
― 7 minilectura
SyncFlow combina la generación de audio y video para crear contenido de forma fluida.
Haohe Liu, Gael Le Lan, Xinhao Mei
― 5 minilectura
Un nuevo chatbot que ofrece conversaciones como las de humanos con conciencia emocional.
Aohan Zeng, Zhengxiao Du, Mingdao Liu
― 3 minilectura
La IA generativa ayuda a identificar los cantos de los pájaros en entornos ruidosos para mejorar la conservación.
Anthony Gibbons, Emma King, Ian Donohue
― 7 minilectura
Nuevos métodos mejoran la evaluación del habla para quienes tienen disartria.
Yerin Choi, Jeehyun Lee, Myoung-Wan Koo
― 7 minilectura
Descubre cómo el aprendizaje sin ejemplos cambia las reglas del juego en el reconocimiento de audio ambiental.
Ysobel Sims, Stephan Chalup, Alexandre Mendes
― 9 minilectura
Las grabaciones de sonido ayudan a rastrear aves migratorias nocturnas en Europa.
Louis Airale, Adrien Pajot, Juliette Linossier
― 7 minilectura
Una mirada a generar speech sin texto usando nuevos métodos de audio.
Joonyong Park, Daisuke Saito, Nobuaki Minematsu
― 7 minilectura
Encuentra la música perfecta hecha a tu medida con Diff4Steer.
Xuchan Bao, Judith Yue Li, Zhong Yi Wan
― 7 minilectura
StableVC cambia la tecnología de conversión de voz con velocidad y calidad.
Jixun Yao, Yuguang Yang, Yu Pan
― 8 minilectura
Examinando el sesgo en la música de IA hacia los estilos del Norte Global en lugar de las tradiciones del Sur Global.
Atharva Mehta, Shivam Chauhan, Monojit Choudhury
― 8 minilectura
Aprende cómo los tokens de habla continua transforman la comunicación con las máquinas.
Ze Yuan, Yanqing Liu, Shujie Liu
― 6 minilectura
Descubre cómo la IA está convirtiendo la música en experiencias visuales cautivadoras.
Leonardo Pina, Yongmin Li
― 9 minilectura