Un nuevo método para la generación de música usando matrices de auto-similitud y sistemas de atención.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método para la generación de música usando matrices de auto-similitud y sistemas de atención.
― 8 minilectura
Nuevas técnicas mejoran la modelación de amplificadores de guitarra usando datos no emparejados y GANs.
― 8 minilectura
Un nuevo método mejora la conversión de voz entre idiomas mientras conserva las características del hablante.
― 5 minilectura
Un nuevo método para entender cómo los modelos de audio hacen predicciones.
― 6 minilectura
Introduciendo la conversión de voz espacial para mejorar el realismo y la inmersión del audio.
― 7 minilectura
WavRx analiza el habla para la salud mientras protege la privacidad, mostrando resultados diagnósticos prometedores.
― 9 minilectura
La investigación explora cómo el análisis del habla puede predecir el riesgo de suicidio, considerando las diferencias de género.
― 6 minilectura
Este documento presenta un sistema para crear visuales que responden a la música.
― 9 minilectura
Un nuevo sistema ayuda a los robots a aprender tareas utilizando audio de demostraciones en la vida real.
― 8 minilectura
Nuevos métodos mejoran la precisión al reconocer sonidos superpuestos de diversas fuentes de audio.
― 7 minilectura
Un nuevo método combina características acústicas y puntuaciones de confianza para mejorar la corrección de errores.
― 6 minilectura
SecureSpectra ofrece una nueva forma de proteger la identidad de audio contra las amenazas de deepfake.
― 6 minilectura
Combinando física y geometría para mejorar las predicciones de dispersión acústica.
― 7 minilectura
Un nuevo sistema para traducción de voz precisa y rápida en varios idiomas.
― 7 minilectura
Un método simple para crear voces y controlar emociones en la síntesis de voz.
― 6 minilectura
Mejorando MMDenseNet para una separación de música rápida y eficiente.
― 6 minilectura
Un enfoque novedoso para mejorar la claridad del sonido usando técnicas avanzadas de aprendizaje profundo.
― 8 minilectura
Un sistema combina audio y video para mejorar la precisión en la detección de hablantes.
― 6 minilectura
Un nuevo método mejora el diálogo de las máquinas mediante datos pseudo-estéreo.
― 7 minilectura
Este estudio presenta un conjunto de datos y un método para mejorar la precisión del reconocimiento de voz en chino usando Pinyin.
― 8 minilectura
Técnicas innovadoras mejoran el diseño de altavoces y la dirección del sonido.
― 5 minilectura
Un nuevo modelo combina datos de audio y visuales para mejorar la comprensión.
― 7 minilectura
Este estudio se centra en mejorar la detección de audio deepfake usando métodos avanzados.
― 5 minilectura
Usando interfaces visuales y modelos para mejorar la generación de música.
― 6 minilectura
Un nuevo marco para crear efectos de sonido sincronizados en videos.
― 7 minilectura
Un estudio sobre cómo mejorar la segmentación de audio integrando incrustaciones de hablante.
― 6 minilectura
Este artículo presenta un sistema TTS más eficiente que se adapta a los hablantes.
― 6 minilectura
Nuevos métodos mejoran los modelos de habla para idiomas con datos limitados.
― 6 minilectura
Entender la incertidumbre mejora la precisión del reconocimiento emocional en situaciones del mundo real.
― 7 minilectura
Un nuevo método mejora la precisión del alineamiento de fonemas para varias aplicaciones de voz.
― 7 minilectura
Un estudio sobre la traducción del inglés nigeriano para mejorar la accesibilidad en las películas de Nollywood.
― 7 minilectura
Este artículo presenta un sistema de doble codificador para un aprendizaje efectivo de representación del habla.
― 7 minilectura
Un sistema para el reconocimiento de hablantes en audio multilingüe sin necesidad de muchos datos.
― 6 minilectura
MelodyT5 ofrece un nuevo enfoque para la creación y análisis de música usando notación simbólica.
― 7 minilectura
El conjunto de datos GTZAN-synth utiliza música sintética para mejorar los sistemas de etiquetado musical.
― 6 minilectura
MelodyLM simplifica la creación de música usando texto y voz.
― 8 minilectura
El modelo SAVE mejora la segmentación audio-visual con eficiencia y precisión.
― 7 minilectura
Un nuevo modelo mejora la traducción de voz a texto usando grandes modelos de lenguaje.
― 7 minilectura
La investigación presenta un modelo que conecta grabaciones de sonido con los movimientos de la boca para el habla.
― 7 minilectura
Este artículo habla sobre cómo Wav2Vec2.0 procesa los sonidos del habla usando fonología.
― 6 minilectura