Nuevos métodos ayudan a las máquinas a encontrar información clave del contenido hablado.
Yueqian Lin, Yuzhe Fu, Jingyang Zhang
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevos métodos ayudan a las máquinas a encontrar información clave del contenido hablado.
Yueqian Lin, Yuzhe Fu, Jingyang Zhang
― 6 minilectura
Nuevos modelos identifican el discurso sintético y combaten el mal uso de la tecnología de voz.
Mahieyin Rahmun, Rafat Hasan Khan, Tanjim Taharat Aurpa
― 6 minilectura
Descubre cómo SpeechRAG mejora la respuesta a preguntas de audio sin errores de ASR.
Do June Min, Karel Mundnich, Andy Lapastora
― 6 minilectura
La tecnología de mejora de voz se adapta para reducir el ruido y mejorar la comunicación.
Riccardo Miccini, Clement Laroche, Tobias Piechowiak
― 6 minilectura
Explorando cómo el idioma afecta la precisión en la detección de DeepFakes en diferentes lenguas.
Bartłomiej Marek, Piotr Kawa, Piotr Syga
― 7 minilectura
Un modelo liviano diseñado para separar de manera efectiva el habla mixta en entornos ruidosos.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 7 minilectura
Los investigadores se están poniendo las pilas con el spoofing de audio para mejorar la seguridad del reconocimiento de voz.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 11 minilectura