Nuevo método mejora la calidad y eficiencia de la generación de voz.
Xin Qi, Ruibo Fu, Zhengqi Wen
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Nuevo método mejora la calidad y eficiencia de la generación de voz.
Xin Qi, Ruibo Fu, Zhengqi Wen
― 5 minilectura
Un método que combina datos etiquetados y no etiquetados mejora la detección de fuentes de sonido.
Vadim Rozenfeld, Bracha Laufer Goldshtein
― 6 minilectura
Descubre cómo las señales de audio ayudan a los jugadores en el tenis de mesa.
Thomas Gossard, Julian Schmalzl, Andreas Ziegler
― 7 minilectura
Un sistema que prioriza la melodía mientras ofrece control sobre la generación de música orquestal.
Dinh-Viet-Toan Le, Yi-Hsuan Yang
― 7 minilectura
Un nuevo método usa sombras virtuales para mejorar el feedback de pronunciación de los que aprenden idiomas.
Haopeng Geng, Daisuke Saito, Nobuaki Minematsu
― 7 minilectura
Nuevos métodos mejoran la calidad de audio binaural en entornos de sonido difíciles.
Ami Berger, Vladimir Tourbabin, Jacob Donley
― 10 minilectura
Un nuevo método de ASR ayuda a la tecnología a entender mejor el habla de los niños.
Zhonghao Shi, Harshvardhan Srivastava, Xuan Shi
― 7 minilectura
El compositor usa textos como indicaciones para crear composiciones musicales complejas en formato MIDI.
Jakub Poćwiardowski, Mateusz Modrzejewski, Marek S. Tatara
― 7 minilectura
Un recurso para estudiar patrones de canto en la música de idols japoneses.
Hitoshi Suda, Shunsuke Yoshida, Tomohiko Nakamura
― 7 minilectura
ViolinDiff mejora el realismo de la música de violín generada por computadora.
Daewoong Kim, Hao-Wen Dong, Dasaem Jeong
― 6 minilectura
Combinar características mejora la precisión en la clasificación de sonidos submarinos.
Amirmohammad Mohammadi, Iren'e Masabarakiza, Ethan Barnes
― 7 minilectura
El aprendizaje por transferencia mejora la clasificación de audio para la detección de sonidos submarinos.
Amirmohammad Mohammadi, Tejashri Kelhe, Davelle Carreiro
― 7 minilectura
La tecnología de IA está cambiando el panorama de las estafas de vishing, aumentando los riesgos para las personas.
João Figueiredo, Afonso Carvalho, Daniel Castro
― 6 minilectura
Un nuevo modelo crea audio que coincide con el video, mejorando las experiencias mediáticas.
Ilpo Viertola, Vladimir Iashin, Esa Rahtu
― 5 minilectura
Un método para mejorar el reconocimiento automático de voz combinando listas de palabras clave con modelos de lenguaje.
Iuliia Thorbecke, Juan Zuluaga-Gomez, Esaú Villatoro-Tello
― 5 minilectura
Un estudio sobre técnicas de imitación vocal usando tecnología para mejorar la comunicación.
Matthew Caren, Kartik Chandra, Joshua B. Tenenbaum
― 6 minilectura
Aprende a entrenar modelos de voz de manera efectiva con menos recursos etiquetados.
Iuliia Thorbecke, Juan Zuluaga-Gomez, Esaú Villatoro-Tello
― 8 minilectura
Un análisis de la terminología de género en la tecnología del habla y sus implicaciones sociales.
Ariadna Sanchez, Alice Ross, Nina Markl
― 8 minilectura
Un nuevo marco mejora la detección de eventos sonoros que se superponen en entornos de audio complejos.
Han Yin, Jisheng Bai, Yang Xiao
― 7 minilectura
Investigación sobre cómo mejorar la identificación de sonidos de aves usando técnicas de aprendizaje automático.
Burooj Ghani, Vincent J. Kalkman, Bob Planqué
― 8 minilectura
Un nuevo método mejora la creación automática de versiones de piano usando la tecnología de transcripción musical existente.
Kazuma Komiya, Yoshihisa Fukuhara
― 7 minilectura
Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.
Haibin Wu, Xuanjun Chen, Yi-Cheng Lin
― 6 minilectura
El proyecto MultiMed mejora el reconocimiento de voz automático para una mejor comunicación en el cuidado de la salud.
Khai Le-Duc, Phuc Phan, Tan-Hanh Pham
― 7 minilectura
Un enfoque nuevo para la evaluación de la calidad de audio sin necesitar referencias limpias.
Jozef Coldenhoff, Milos Cernak
― 7 minilectura
El marco ECHO mejora la precisión en la clasificación de sonidos usando etiquetas estructuradas y un proceso de aprendizaje en dos etapas.
Pranav Gupta, Raunak Sharma, Rashmi Kumari
― 6 minilectura
Un nuevo método mejora la claridad del habla al integrar información visual.
Wenze Ren, Kuo-Hsuan Hung, Rong Chao
― 6 minilectura
Un nuevo enfoque mejora la estimación de la dirección del sonido para altavoces en movimiento en entornos difíciles.
Daniel A. Mitchell, Boaz Rafaely, Anurag Kumar
― 10 minilectura
La Recuperación de Momentos de Audio permite localizar momentos específicos en grabaciones largas.
Hokuto Munakata, Taichi Nishimura, Shota Nakada
― 6 minilectura
Safe Guard detecta discurso de odio en tiempo real durante interacciones de voz en VR social.
Yiwen Xu, Qinyang Hou, Hongyu Wan
― 7 minilectura
La IA está evolucionando para tener conversaciones más naturales.
Bandhav Veluri, Benjamin N Peloquin, Bokai Yu
― 6 minilectura
Un enfoque novedoso utiliza MRI en tiempo real para visualizar los movimientos de producción del habla.
Hong Nguyen, Sean Foley, Kevin Huang
― 6 minilectura
Un nuevo método para detectar reflejos tempranos en la sala mejora las experiencias de audio.
Yogev Hadadi, Vladimir Tourbabin, Zamir Ben-Hur
― 8 minilectura
Un proyecto que desarrolla conjuntos de datos de voz y texto para idiomas con recursos limitados.
Nikola Ljubešić, Peter Rupnik, Danijel Koržinek
― 6 minilectura
Un nuevo marco mejora el reconocimiento de voz y se adapta a varias tareas de habla.
Junyi Peng, Ladislav Mošner, Lin Zhang
― 5 minilectura
Se necesitan nuevos métodos para detectar tecnologías avanzadas de voz deepfake.
Lam Pham, Phat Lam, Dat Tran
― 7 minilectura
Nuevos métodos aumentan la precisión para identificar sonidos de animales con datos limitados.
Yaxiong Chen, Xueping Zhang, Yunfei Zi
― 6 minilectura
Nuevo método mejora la integración del sonido virtual en entornos de AR.
Francesc Lluís, Nils Meyer-Kahlen
― 8 minilectura
Un nuevo método busca preservar la privacidad de la voz mientras permite una comunicación efectiva.
Jacob J Webber, Oliver Watts, Gustav Eje Henter
― 5 minilectura
Nuevos métodos mejoran el reconocimiento de voz para lenguas de pocos recursos sin texto.
Krithiga Ramadass, Abrit Pal Singh, Srihari J
― 5 minilectura
Nuevos métodos mejoran la precisión en los sistemas de reconocimiento de voz usando comprensión fonética.
Leonid Velikovich, Christopher Li, Diamantino Caseiro
― 6 minilectura