Un nuevo método mejora el diálogo de las máquinas mediante datos pseudo-estéreo.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método mejora el diálogo de las máquinas mediante datos pseudo-estéreo.
― 7 minilectura
Este estudio presenta un conjunto de datos y un método para mejorar la precisión del reconocimiento de voz en chino usando Pinyin.
― 8 minilectura
Técnicas innovadoras mejoran el diseño de altavoces y la dirección del sonido.
― 5 minilectura
Un nuevo modelo combina datos de audio y visuales para mejorar la comprensión.
― 7 minilectura
Este estudio se centra en mejorar la detección de audio deepfake usando métodos avanzados.
― 5 minilectura
Usando interfaces visuales y modelos para mejorar la generación de música.
― 6 minilectura
Un nuevo marco para crear efectos de sonido sincronizados en videos.
― 7 minilectura
Un estudio sobre cómo mejorar la segmentación de audio integrando incrustaciones de hablante.
― 6 minilectura
Este artículo presenta un sistema TTS más eficiente que se adapta a los hablantes.
― 6 minilectura
Nuevos métodos mejoran los modelos de habla para idiomas con datos limitados.
― 6 minilectura
Entender la incertidumbre mejora la precisión del reconocimiento emocional en situaciones del mundo real.
― 7 minilectura
Un nuevo método mejora la precisión del alineamiento de fonemas para varias aplicaciones de voz.
― 7 minilectura
Un estudio sobre la traducción del inglés nigeriano para mejorar la accesibilidad en las películas de Nollywood.
― 7 minilectura
Este artículo presenta un sistema de doble codificador para un aprendizaje efectivo de representación del habla.
― 7 minilectura
Un sistema para el reconocimiento de hablantes en audio multilingüe sin necesidad de muchos datos.
― 6 minilectura
MelodyT5 ofrece un nuevo enfoque para la creación y análisis de música usando notación simbólica.
― 7 minilectura
El conjunto de datos GTZAN-synth utiliza música sintética para mejorar los sistemas de etiquetado musical.
― 6 minilectura
MelodyLM simplifica la creación de música usando texto y voz.
― 8 minilectura
El modelo SAVE mejora la segmentación audio-visual con eficiencia y precisión.
― 7 minilectura
Un nuevo modelo mejora la traducción de voz a texto usando grandes modelos de lenguaje.
― 7 minilectura
La investigación presenta un modelo que conecta grabaciones de sonido con los movimientos de la boca para el habla.
― 7 minilectura
Este artículo habla sobre cómo Wav2Vec2.0 procesa los sonidos del habla usando fonología.
― 6 minilectura
Mejorando la tecnología de anonimización de hablantes para nueve idiomas para asegurar la privacidad.
― 6 minilectura
Explorando el papel de la tecnología en mejorar la eficiencia y el bienestar de la piscicultura.
― 6 minilectura
La investigación destaca el papel del video en mejorar el reconocimiento del habla en entornos ruidosos.
― 6 minilectura
Un nuevo enfoque combina el análisis de voz con la protección de la privacidad para detectar demencia.
― 7 minilectura
Nuevos métodos mejoran la precisión para identificar sonidos de animales en el monitoreo de la vida silvestre.
― 5 minilectura
Nuevos métodos mejoran la seguridad contra el engaño de voz en los sistemas ASV.
― 8 minilectura
Los avances en la clasificación de sonido mejoran la precisión del reconocimiento de audio.
― 7 minilectura
Un nuevo método mejora la precisión al reconocer el habla de múltiples hablantes.
― 6 minilectura
El BPE acústico mejora la inteligibilidad y la calidad del habla en sistemas TTS.
― 7 minilectura
Un nuevo método mejora la claridad del habla en entornos ruidosos usando redes neuronales duales.
― 6 minilectura
Nuevo método mejora el manejo de acentos en los sistemas ASR mediante códigos especializados.
― 6 minilectura
Nuevos métodos mejoran la precisión y eficiencia en los sistemas de reconocimiento de voz.
― 8 minilectura
Un nuevo método mejora la localización del sonido en entornos variados al centrarse en el aprendizaje continuo.
― 7 minilectura
Un nuevo método mejora la detección de eventos de sonido al integrar nuevas clases de audio de manera efectiva.
― 8 minilectura
WildDESED mejora los sistemas de detección de sonido en entornos caseros ruidosos.
― 7 minilectura
Un estudio revela cómo distintos géneros musicales activan áreas específicas del cerebro.
― 7 minilectura
Reglas esenciales para enviar trabajos a NeurIPS 2024.
― 5 minilectura
Este estudio evalúa actuaciones de piano solo usando métodos de análisis de audio.
― 6 minilectura