La tecnología de audio ofrece una forma económica de rastrear UAVs de manera segura.
Allen Lei, Tianchen Deng, Han Wang
― 7 minilectura
New Science Research Articles Everyday
La tecnología de audio ofrece una forma económica de rastrear UAVs de manera segura.
Allen Lei, Tianchen Deng, Han Wang
― 7 minilectura
Un nuevo método de IA analiza voces para detectar el riesgo de cáncer de laringe.
Mary Paterson, James Moor, Luisa Cutillo
― 8 minilectura
Descubre cómo la síntesis de video a audio está cambiando las experiencias multimedia con una alineación de sonido perfecta.
Ho Kei Cheng, Masato Ishii, Akio Hayakawa
― 9 minilectura
Un nuevo sistema revoluciona la forma en que los diseñadores de sonido crean audio para videos.
Riccardo Fosco Gramaccioni, Christian Marinoni, Emilian Postolache
― 9 minilectura
Una mirada a cómo la mejora del habla mejora la comunicación a través de las características de los datos.
Leying Zhang, Wangyou Zhang, Chenda Li
― 9 minilectura
Nuevos métodos mejoran los sistemas ASR para idiomas que no han encontrado antes.
Shao-Syuan Huang, Kuan-Po Huang, Andy T. Liu
― 8 minilectura
Descubre cómo la tecnología TTA combina palabras y sonidos para experiencias de audio más ricas.
Yuhang He, Yash Jain, Xubo Liu
― 8 minilectura
Los investigadores mejoran el reconocimiento de voz en suizo alemán a través de una generación de datos innovadora.
Vincenzo Timmel, Claudio Paonessa, Reza Kakooee
― 7 minilectura
Un nuevo método mejora la sincronización de labios en videos doblados para una experiencia de visualización más natural.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 8 minilectura
Descubre cómo Whisper mejora el reconocimiento de voz en conversaciones multilingües.
Jiahui Zhao, Hao Shi, Chenrui Cui
― 5 minilectura
Descubre cómo SpeechRAG mejora la respuesta a preguntas de audio sin errores de ASR.
Do June Min, Karel Mundnich, Andy Lapastora
― 6 minilectura
Un enfoque nuevo hace que el reconocimiento de sonidos sea más accesible y eficiente.
Noriyuki Tonami, Wataru Kohno, Keisuke Imoto
― 8 minilectura
Descubre cómo la anonimización de voz protege la información personal en un mundo impulsado por la tecnología.
Natalia Tomashenko, Emmanuel Vincent, Marc Tommasi
― 7 minilectura
Combinando pistas de audio y visuales para mejorar el reconocimiento de voz en entornos ruidosos.
Zhaofeng Lin, Naomi Harte
― 7 minilectura
La tecnología de mejora de voz se adapta para reducir el ruido y mejorar la comunicación.
Riccardo Miccini, Clement Laroche, Tobias Piechowiak
― 6 minilectura
Nueva tecnología combina sonido y visuales para mejorar la detección de drones.
Zhenyuan Xiao, Yizhuo Yang, Guili Xu
― 7 minilectura
Un enfoque nuevo combina discurso y texto para mejorar las evaluaciones de la disartria.
Anuprabha M, Krishna Gurugubelli, Kesavaraj V
― 6 minilectura
Explorando nueva tecnología que detecta sonidos de fuentes invisibles.
Yuhang He, Sangyun Shin, Anoop Cherian
― 6 minilectura
Descubre cómo Smooth-Foley mejora la generación de audio en video.
Yaoyun Zhang, Xuenan Xu, Mengyue Wu
― 6 minilectura
Técnica innovadora conecta letras y melodías para crear mejores canciones.
Jiaxing Yu, Xinda Wu, Yunfei Xu
― 8 minilectura
Mejorando la comprensión de las máquinas sobre la dinámica de turnos en el diálogo humano.
Hyunbae Jeon, Frederic Guintu, Rayvant Sahni
― 10 minilectura
Explorando cómo el idioma afecta la precisión en la detección de DeepFakes en diferentes lenguas.
Bartłomiej Marek, Piotr Kawa, Piotr Syga
― 7 minilectura
VERSA evalúa la calidad de voz, audio y música de manera efectiva.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 10 minilectura
Descubre cómo los modelos de lenguaje de audio están cambiando la tecnología de reconocimiento de sonido.
Gongyu Chen, Haomin Zhang, Chaofan Ding
― 7 minilectura
Nuevos métodos mejoran el diálogo natural en la tecnología del habla.
Zhenqi Jia, Rui Liu
― 7 minilectura
Descubre cómo SpeechSSM transforma la generación de discursos largos para mejores interacciones.
Se Jin Park, Julian Salazar, Aren Jansen
― 6 minilectura
Descubre cómo la traducción en tiempo real transforma la comunicación entre idiomas.
Sara Papi, Peter Polak, Ondřej Bojar
― 7 minilectura
Un modelo liviano diseñado para separar de manera efectiva el habla mixta en entornos ruidosos.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 7 minilectura
Los investigadores se están poniendo las pilas con el spoofing de audio para mejorar la seguridad del reconocimiento de voz.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 11 minilectura
Descubre cómo AV-ASR combina audio y visuales para mejorar el reconocimiento de voz.
Yihan Wu, Yichen Lu, Yifan Peng
― 7 minilectura
Un nuevo método está transformando la forma en que las máquinas aprenden de la música.
Julien Guinot, Elio Quinton, György Fazekas
― 8 minilectura
Nueva tecnología transforma susurros silenciosos en comunicación audible para quienes lo necesitan.
Neil Shah, Shirish Karande, Vineet Gandhi
― 7 minilectura
Nuevos métodos en la síntesis de voz mejoran la claridad y la adaptabilidad para diversas aplicaciones.
Neil Shah, Ayan Kashyap, Shirish Karande
― 9 minilectura
Descubre la rica tradición de los cantos de la Iglesia Ortodoxa Etíope Tewahedo.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Li Su
― 8 minilectura
Un nuevo conjunto de datos resalta la belleza de los cantos ortodoxos etíopes.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Worku Abebe Degife
― 8 minilectura
Nuevos avances ayudan a la tecnología de reconocimiento de voz a servir mejor a las personas con trastornos del habla.
Jimmy Tobin, Katrin Tomanek, Subhashini Venugopalan
― 7 minilectura
Descubre cómo ETTA convierte palabras en experiencias de audio creativas.
Sang-gil Lee, Zhifeng Kong, Arushi Goel
― 6 minilectura
Una nueva perspectiva sobre cómo la música afecta nuestras emociones.
Dengming Zhang, Weitao You, Ziheng Liu
― 8 minilectura
Un nuevo marco para generar bailes en grupo sincronizados y naturales.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 10 minilectura
Un nuevo enfoque en el reconocimiento de emociones se centra en los movimientos de la boca en lugar de los sonidos.
Shreya G. Upadhyay, Ali N. Salman, Carlos Busso
― 7 minilectura