Un nuevo método mejora la conversión de voz a canto usando aprendizaje auto-supervisado.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método mejora la conversión de voz a canto usando aprendizaje auto-supervisado.
― 8 minilectura
StreamSpeech mejora la traducción de voz en tiempo real con eficiencia y calidad.
― 5 minilectura
Un nuevo modelo mejora el reconocimiento de voz usando múltiples métodos de decodificación.
― 8 minilectura
Un estudio sobre cómo mejorar el reconocimiento de voz automática (ASR) para dialectos árabes usando técnicas de modelos eficientes.
― 6 minilectura
Te presento BLSP-Emo, un modelo que entiende el habla y las emociones para tener mejores interacciones.
― 6 minilectura
Un estudio reciente replica hallazgos clave sobre la interpretación de datos usando sonido y visuales.
― 7 minilectura
Un sistema que conecta sonidos con imágenes, mejorando la comprensión de las máquinas.
― 7 minilectura
El nuevo modelo ARDiT mejora la síntesis de texto a voz y la edición de audio.
― 7 minilectura
Te presento SPICE, una tarea para mejorar las interacciones de la IA usando información contextual.
― 9 minilectura
La investigación presenta el conjunto de datos MOSA, mejorando la comprensión de los aspectos visuales y auditivos de la música.
― 8 minilectura
mHuBERT-147 procesa el habla en varios idiomas de manera eficiente.
― 5 minilectura
Un nuevo enfoque para la subtitulación de audio reduce la dependencia de datos emparejados.
― 7 minilectura
Nuevos métodos mejoran cómo las máquinas reconocen emociones en el habla humana.
― 7 minilectura
Investigando vulnerabilidades en métodos de marca de agua de audio contra amenazas del mundo real.
― 9 minilectura
PianoMotion10M ofrece movimientos de manos detallados para ayudar a los que aprenden piano.
― 7 minilectura
Un nuevo modelo mejora la coincidencia de sonido con acciones visuales en videos.
― 13 minilectura
Nuevo modelo mejora experiencias de audio realistas en entornos virtuales.
― 8 minilectura
Este estudio analiza métodos de audio para rastrear el movimiento de peatones en áreas urbanas.
― 9 minilectura
Un nuevo conjunto de datos mejora la creación de audio foley para contenido multimedia.
― 8 minilectura
Nuevos métodos mejoran el reconocimiento de voz en entornos ruidosos usando técnicas adaptativas.
― 8 minilectura
SPEAR predice el comportamiento del sonido en espacios 3D usando una mínima recolección de datos.
― 7 minilectura
Un nuevo método mejora la traducción de habla en varios idiomas al inglés.
― 6 minilectura
Un nuevo método mejora la precisión de verificación de hablantes en entornos de radio difíciles.
― 8 minilectura
Nuevo método apunta a cambios de ritmo para ataques de habla sigilosos.
― 7 minilectura
GAMA mejora el procesamiento de audio al fusionar conocimientos de sonido y lenguaje.
― 7 minilectura
GigaSpeech 2 ofrece un montón de datos para lenguas de pocos recursos para mejorar el reconocimiento de voz.
― 6 minilectura
Un nuevo modelo mejora la tecnología de texto a voz con eficiencia y adaptabilidad.
― 7 minilectura
Un nuevo método que optimiza el análisis y la síntesis del habla usando los movimientos del tracto vocal.
― 8 minilectura
Este estudio examina cómo los gestos afectan el aprendizaje de los agentes virtuales.
― 8 minilectura
Infórmate sobre la diarización de hablantes en línea y su importancia en varias aplicaciones.
― 8 minilectura
Nueva herramienta de referencia evalúa tokens de audio discretos para varias tareas de procesamiento de voz.
― 10 minilectura
Un nuevo método para la generación de música usando matrices de auto-similitud y sistemas de atención.
― 8 minilectura
Nuevas técnicas mejoran la modelación de amplificadores de guitarra usando datos no emparejados y GANs.
― 8 minilectura
Un nuevo método para entender cómo los modelos de audio hacen predicciones.
― 6 minilectura
Introduciendo la conversión de voz espacial para mejorar el realismo y la inmersión del audio.
― 7 minilectura
La investigación explora cómo el análisis del habla puede predecir el riesgo de suicidio, considerando las diferencias de género.
― 6 minilectura
Este documento presenta un sistema para crear visuales que responden a la música.
― 9 minilectura
Un nuevo sistema ayuda a los robots a aprender tareas utilizando audio de demostraciones en la vida real.
― 8 minilectura
Nuevos métodos mejoran la precisión al reconocer sonidos superpuestos de diversas fuentes de audio.
― 7 minilectura
Un nuevo método combina características acústicas y puntuaciones de confianza para mejorar la corrección de errores.
― 6 minilectura