Revolucionando el texto a voz con mayor eficiencia y voces que suenan más naturales.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 minilectura
New Science Research Articles Everyday
Revolucionando el texto a voz con mayor eficiencia y voces que suenan más naturales.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 minilectura
Descubre cómo los sistemas de TTS están evolucionando para sonar más como humanos.
Haowei Lou, Helen Paik, Wen Hu
― 8 minilectura
Nuevo sistema transforma el control de audio a través de descripciones de texto detalladas.
Sonal Kumar, Prem Seetharaman, Justin Salamon
― 8 minilectura
Combinando video y audio para detectar mejor las emociones.
Antonio Fernandez, Suzan Awinat
― 10 minilectura
YingSound transforma la producción de video al automatizar la generación de efectos de sonido.
Zihao Chen, Haomin Zhang, Xinhan Di
― 8 minilectura
Los investigadores usan ecos para marcar el audio, asegurando que los derechos de los creadores estén protegidos.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 9 minilectura
Los robots ahora pueden moverse en entornos complicados usando sonido gracias a SonicBoom.
Moonyoung Lee, Uksang Yoo, Jean Oh
― 6 minilectura
El modelo MASV mejora la verificación de voz, asegurando seguridad y eficiencia.
Yang Liu, Li Wan, Yiteng Huang
― 6 minilectura
Explorando el impacto de las herramientas de IA en la creación musical y las perspectivas de los compositores.
Eleanor Row, György Fazekas
― 8 minilectura
La tecnología de reconocimiento de voz mejora el reconocimiento de dígitos, especialmente en entornos ruidosos.
Ali Nasr-Esfahani, Mehdi Bekrani, Roozbeh Rajabi
― 6 minilectura
Mejorando el rendimiento de ASR multilingüe para japonés a través de un ajuste fino específico.
Mark Bajo, Haruka Fukukawa, Ryuji Morita
― 6 minilectura
Explorando cómo los BCIs decodifican el habla imaginada para mejorar la comunicación.
Byung-Kwan Ko, Jun-Young Kim, Seo-Hyun Lee
― 8 minilectura
SonicMesh usa el sonido para mejorar la modelación 3D del cuerpo humano a partir de imágenes.
Xiaoxuan Liang, Wuyang Zhang, Hong Zhou
― 6 minilectura
Descubre los últimos avances en el reconocimiento de voz en tiempo real y cómo mejoran nuestras interacciones.
Rongxiang Wang, Zhiming Xu, Felix Xiaozhu Lin
― 6 minilectura
Los investigadores mejoran el procesamiento de voz usando Libri2Vox y técnicas de datos sintéticos.
Yun Liu, Xuechen Liu, Xiaoxiao Miao
― 7 minilectura
Descubre cómo la TTS emocional cambia la comunicación con las máquinas, haciéndolas más cercanas.
Sho Inoue, Kun Zhou, Shuai Wang
― 7 minilectura
Aprende cómo los sonidos de los insectos pueden ayudar a monitorear ecosistemas y manejar plagas.
Yinxuan Wang, Sudip Vhaduri
― 8 minilectura
Nuevos métodos ayudan a las máquinas a encontrar información clave del contenido hablado.
Yueqian Lin, Yuzhe Fu, Jingyang Zhang
― 6 minilectura
Descubre cómo la IA simplifica la recolección de datos de voz a través del crowdsourcing.
Beomseok Lee, Marco Gaido, Ioan Calapodescu
― 6 minilectura
Explora las diferencias entre el habla espontánea y la hablada en guion en el procesamiento de audio.
Shahar Elisha, Andrew McDowell, Mariano Beguerisse-Díaz
― 8 minilectura
DAAN mejora cómo las máquinas aprenden de datos audio-visuales en escenarios de cero disparos.
RunLin Yu, Yipu Gong, Wenrui Li
― 6 minilectura
Un nuevo método mejora la detección de deepfakes de audio usando técnicas de aprendizaje innovadoras.
Yujie Chen, Jiangyan Yi, Cunhang Fan
― 7 minilectura
A medida que las máquinas producen música, tenemos que proteger la creatividad humana mediante métodos de detección efectivos.
Yupei Li, Qiyang Sun, Hanqian Li
― 10 minilectura
Nuevos modelos identifican el discurso sintético y combaten el mal uso de la tecnología de voz.
Mahieyin Rahmun, Rafat Hasan Khan, Tanjim Taharat Aurpa
― 6 minilectura
TAME usa sonido para detectar drones, mejorando la seguridad y la monitoreo.
Zhenyuan Xiao, Huanran Hu, Guili Xu
― 7 minilectura
Descubre cómo CAMEL mejora la comprensión de conversaciones en varios idiomas.
He Wang, Xucheng Wan, Naijun Zheng
― 8 minilectura
La investigación muestra que la actividad cerebral puede ayudar a las máquinas a reconocer música de manera efectiva.
Taketo Akama, Zhuohao Zhang, Pengcheng Li
― 8 minilectura
La tecnología de audio ofrece una forma económica de rastrear UAVs de manera segura.
Allen Lei, Tianchen Deng, Han Wang
― 7 minilectura
Un nuevo método de IA analiza voces para detectar el riesgo de cáncer de laringe.
Mary Paterson, James Moor, Luisa Cutillo
― 8 minilectura
Descubre cómo la síntesis de video a audio está cambiando las experiencias multimedia con una alineación de sonido perfecta.
Ho Kei Cheng, Masato Ishii, Akio Hayakawa
― 9 minilectura
Un nuevo sistema revoluciona la forma en que los diseñadores de sonido crean audio para videos.
Riccardo Fosco Gramaccioni, Christian Marinoni, Emilian Postolache
― 9 minilectura
Una mirada a cómo la mejora del habla mejora la comunicación a través de las características de los datos.
Leying Zhang, Wangyou Zhang, Chenda Li
― 9 minilectura
Descubre cómo la tecnología TTA combina palabras y sonidos para experiencias de audio más ricas.
Yuhang He, Yash Jain, Xubo Liu
― 8 minilectura
Un nuevo método mejora la sincronización de labios en videos doblados para una experiencia de visualización más natural.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 8 minilectura
Descubre cómo Whisper mejora el reconocimiento de voz en conversaciones multilingües.
Jiahui Zhao, Hao Shi, Chenrui Cui
― 5 minilectura
Un enfoque nuevo hace que el reconocimiento de sonidos sea más accesible y eficiente.
Noriyuki Tonami, Wataru Kohno, Keisuke Imoto
― 8 minilectura
Descubre cómo la anonimización de voz protege la información personal en un mundo impulsado por la tecnología.
Natalia Tomashenko, Emmanuel Vincent, Marc Tommasi
― 7 minilectura
Combinando pistas de audio y visuales para mejorar el reconocimiento de voz en entornos ruidosos.
Zhaofeng Lin, Naomi Harte
― 7 minilectura
La tecnología de mejora de voz se adapta para reducir el ruido y mejorar la comunicación.
Riccardo Miccini, Clement Laroche, Tobias Piechowiak
― 6 minilectura
Nueva tecnología combina sonido y visuales para mejorar la detección de drones.
Zhenyuan Xiao, Yizhuo Yang, Guili Xu
― 7 minilectura