La investigación presenta el conjunto de datos MOSA, mejorando la comprensión de los aspectos visuales y auditivos de la música.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
La investigación presenta el conjunto de datos MOSA, mejorando la comprensión de los aspectos visuales y auditivos de la música.
― 8 minilectura
mHuBERT-147 procesa el habla en varios idiomas de manera eficiente.
― 5 minilectura
Un nuevo enfoque para la subtitulación de audio reduce la dependencia de datos emparejados.
― 7 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen emociones en el habla humana.
― 7 minilectura
Una mirada a nuevos métodos para entender el habla entrecortada durante las conversaciones.
― 9 minilectura
Investigando vulnerabilidades en métodos de marca de agua de audio contra amenazas del mundo real.
― 9 minilectura
PianoMotion10M ofrece movimientos de manos detallados para ayudar a los que aprenden piano.
― 7 minilectura
Un nuevo modelo mejora la coincidencia de sonido con acciones visuales en videos.
― 13 minilectura
Nuevo modelo mejora experiencias de audio realistas en entornos virtuales.
― 8 minilectura
Este estudio analiza métodos de audio para rastrear el movimiento de peatones en áreas urbanas.
― 9 minilectura
Un nuevo conjunto de datos mejora la creación de audio foley para contenido multimedia.
― 8 minilectura
Nuevos métodos mejoran el reconocimiento de voz en entornos ruidosos usando técnicas adaptativas.
― 8 minilectura
SPEAR predice el comportamiento del sonido en espacios 3D usando una mínima recolección de datos.
― 7 minilectura
Un nuevo método mejora la traducción de habla en varios idiomas al inglés.
― 6 minilectura
Un nuevo método mejora la precisión de verificación de hablantes en entornos de radio difíciles.
― 8 minilectura
Nuevo método apunta a cambios de ritmo para ataques de habla sigilosos.
― 7 minilectura
GAMA mejora el procesamiento de audio al fusionar conocimientos de sonido y lenguaje.
― 7 minilectura
Un nuevo sistema ayuda a separar el habla del ruido para una comunicación más clara.
― 7 minilectura
GigaSpeech 2 ofrece un montón de datos para lenguas de pocos recursos para mejorar el reconocimiento de voz.
― 6 minilectura
Un nuevo modelo mejora la tecnología de texto a voz con eficiencia y adaptabilidad.
― 7 minilectura
Un nuevo método que optimiza el análisis y la síntesis del habla usando los movimientos del tracto vocal.
― 8 minilectura
Este estudio examina cómo los gestos afectan el aprendizaje de los agentes virtuales.
― 8 minilectura
DExter usa IA para crear música de piano expresiva a partir de partituras escritas.
― 7 minilectura
Infórmate sobre la diarización de hablantes en línea y su importancia en varias aplicaciones.
― 8 minilectura
Nueva herramienta de referencia evalúa tokens de audio discretos para varias tareas de procesamiento de voz.
― 10 minilectura
Un nuevo método para la generación de música usando matrices de auto-similitud y sistemas de atención.
― 8 minilectura
Nuevas técnicas mejoran la modelación de amplificadores de guitarra usando datos no emparejados y GANs.
― 8 minilectura
Un nuevo método mejora la conversión de voz entre idiomas mientras conserva las características del hablante.
― 5 minilectura
Un nuevo método para entender cómo los modelos de audio hacen predicciones.
― 6 minilectura
Introduciendo la conversión de voz espacial para mejorar el realismo y la inmersión del audio.
― 7 minilectura
WavRx analiza el habla para la salud mientras protege la privacidad, mostrando resultados diagnósticos prometedores.
― 9 minilectura
La investigación explora cómo el análisis del habla puede predecir el riesgo de suicidio, considerando las diferencias de género.
― 6 minilectura
Este documento presenta un sistema para crear visuales que responden a la música.
― 9 minilectura
Un nuevo sistema ayuda a los robots a aprender tareas utilizando audio de demostraciones en la vida real.
― 8 minilectura
Nuevos métodos mejoran la precisión al reconocer sonidos superpuestos de diversas fuentes de audio.
― 7 minilectura
Un nuevo método combina características acústicas y puntuaciones de confianza para mejorar la corrección de errores.
― 6 minilectura
SecureSpectra ofrece una nueva forma de proteger la identidad de audio contra las amenazas de deepfake.
― 6 minilectura
Combinando física y geometría para mejorar las predicciones de dispersión acústica.
― 7 minilectura
Un nuevo sistema para traducción de voz precisa y rápida en varios idiomas.
― 7 minilectura
Un método simple para crear voces y controlar emociones en la síntesis de voz.
― 6 minilectura