PEAVS analiza qué tan bien funcionan el audio y el video juntos para mejorar la experiencia del espectador.
― 8 minilectura
Ciencia de vanguardia explicada de forma sencilla
PEAVS analiza qué tan bien funcionan el audio y el video juntos para mejorar la experiencia del espectador.
― 8 minilectura
Un método que usa IA mejora la representación del sonido en diferentes entornos.
― 8 minilectura
Explora el papel de los momentos espectrales en las pruebas de cámara de reverberación y el impacto del ruido.
― 7 minilectura
Un nuevo sistema para una transcripción de piano en tiempo real, precisa y ligera.
― 6 minilectura
Un nuevo marco mejora la comprensión de la IA sobre los espacios 3D.
― 8 minilectura
Nuevo modelo permite un control preciso de las cualidades de la voz mientras se mantiene el contenido.
― 5 minilectura
Un nuevo marco para evaluar modelos base en tareas de habla.
― 9 minilectura
Un estudio sobre cómo mejorar los audios a partir de indicaciones de texto usando optimización de preferencias.
― 8 minilectura
Explorando los últimos avances en herramientas de IA para crear música.
― 6 minilectura
La investigación explora la fusión de técnicas de sonido para mejorar la navegación y el mapeo robótico.
― 10 minilectura
Un nuevo enfoque mejora el etiquetado y la recuperación de música al combinar términos de lenguaje general y de música.
― 12 minilectura
FlashSpeech ofrece soluciones de síntesis de voz rápidas y de alta calidad.
― 8 minilectura
Un nuevo método mejora la detección de deepfakes de audio usando referencias de muestras similares.
― 7 minilectura
Este estudio analiza señales de sonido para medir la virtuosidad entre guitarristas eléctricos.
― 6 minilectura
Este estudio examina las debilidades de los modelos SER frente a ataques adversariales en diferentes idiomas.
― 6 minilectura
SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.
― 8 minilectura
Un nuevo códec de audio que ofrece compresión de alta calidad y contenido semántico rico.
― 8 minilectura
Una herramienta que combina análisis de audio y video para identificar eventos.
― 6 minilectura
Un método para medir cómo los materiales absorben el sonido de manera efectiva.
― 6 minilectura
Un método de aprendizaje activo en dos etapas mejora la precisión del reconocimiento de voz con menos datos.
― 6 minilectura
Nuevos métodos mejoran la claridad del habla en los audífonos mediante técnicas de aprendizaje profundo.
― 7 minilectura
Aprende sobre técnicas de localización de sonido y sus usos en diferentes campos.
― 5 minilectura
Un nuevo conjunto de datos y métodos mejoran la detección de deepfakes de audio generados por ALM.
― 7 minilectura
Este estudio evalúa el rendimiento de los sistemas de ASR con personas que tartamudean.
― 10 minilectura
Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.
― 7 minilectura
Un dispositivo ayuda a enfocarse en voces específicas en lugares concurridos.
― 7 minilectura
Un nuevo método mejora la edición de audio usando modelos de difusión para cambios precisos.
― 6 minilectura
SpeechVerse conecta la comprensión de audio y el procesamiento del lenguaje para mejorar la interacción humano-computadora.
― 7 minilectura
Un nuevo conjunto de datos destaca las diferencias de rendimiento entre grupos demográficos que utilizan asistentes de voz.
― 8 minilectura
Este artículo investiga las vulnerabilidades en los modelos de voz y formas de mejorar su seguridad.
― 6 minilectura
El reconocimiento de voz mejorado para aulas usando técnicas de entrenamiento avanzadas mejora el aprendizaje.
― 8 minilectura
Entender y mitigar las alucinaciones en la IA para un rendimiento confiable.
― 9 minilectura
Un nuevo enfoque utiliza redes neuronales de convolución gráfica para un análisis eficiente de datos de música.
― 11 minilectura
Nuevos métodos mejoran las conexiones entre clips de audio y descripciones de texto.
― 7 minilectura
ROSVOT mejora la precisión al transcribir voces cantando, incluso en ambientes ruidosos.
― 7 minilectura
Nuevas técnicas mejoran la reconstrucción de voz en entornos difíciles usando datos limitados.
― 9 minilectura
Presentando un modelo que genera audio y video sincronizados con niveles de ruido mezclados.
― 6 minilectura
Un nuevo sistema mejora las interacciones de los robots al filtrar el habla superpuesta.
― 7 minilectura
Este artículo habla de un nuevo modelo sencillo para generar audio a partir de imágenes y viceversa.
― 6 minilectura
Los modelos de lenguaje de eliminación de ruido mejoran la corrección de errores en los sistemas de reconocimiento de voz usando datos sintéticos.
― 9 minilectura