Este estudio investiga la efectividad de los modelos multilingües en la detección de deepfakes de audio.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este estudio investiga la efectividad de los modelos multilingües en la detección de deepfakes de audio.
― 7 minilectura
Un nuevo enfoque para evaluar qué tan bien la música sigue las indicaciones de audio.
― 10 minilectura
Un nuevo conjunto de datos mejora la forma en que los robots interpretan entornos del mundo real.
― 8 minilectura
Este método mejora la separación de audio al combinar descripciones de lenguaje con análisis de sonido.
― 7 minilectura
UniAV combina la localización de acción, la detección de sonido y la localización de eventos audio-visuales para una mejor comprensión del video.
― 9 minilectura
CLaM-TTS mejora la síntesis de voz usando técnicas avanzadas para tener mejor eficiencia y calidad.
― 7 minilectura
Los gráficos permiten obtener nuevas ideas sobre la estructura de la música y sus relaciones.
― 6 minilectura
RALL-E mejora la síntesis de texto a voz para que suene más clara y natural.
― 6 minilectura
MuPT utiliza la notación ABC para generar música de manera efectiva con IA.
― 7 minilectura
Nuevos métodos mejoran la representación de audio a través de técnicas de aprendizaje auto-supervisado.
― 7 minilectura
PEAVS analiza qué tan bien funcionan el audio y el video juntos para mejorar la experiencia del espectador.
― 8 minilectura
Un método que usa IA mejora la representación del sonido en diferentes entornos.
― 8 minilectura
Explora el papel de los momentos espectrales en las pruebas de cámara de reverberación y el impacto del ruido.
― 7 minilectura
Un nuevo sistema para una transcripción de piano en tiempo real, precisa y ligera.
― 6 minilectura
Un nuevo marco mejora la comprensión de la IA sobre los espacios 3D.
― 8 minilectura
Nuevo modelo permite un control preciso de las cualidades de la voz mientras se mantiene el contenido.
― 5 minilectura
Un nuevo marco para evaluar modelos base en tareas de habla.
― 9 minilectura
Un estudio sobre cómo mejorar los audios a partir de indicaciones de texto usando optimización de preferencias.
― 8 minilectura
Explorando los últimos avances en herramientas de IA para crear música.
― 6 minilectura
La investigación explora la fusión de técnicas de sonido para mejorar la navegación y el mapeo robótico.
― 10 minilectura
Un nuevo enfoque mejora el etiquetado y la recuperación de música al combinar términos de lenguaje general y de música.
― 12 minilectura
FlashSpeech ofrece soluciones de síntesis de voz rápidas y de alta calidad.
― 8 minilectura
Un nuevo método mejora la detección de deepfakes de audio usando referencias de muestras similares.
― 7 minilectura
Este estudio analiza señales de sonido para medir la virtuosidad entre guitarristas eléctricos.
― 6 minilectura
Este estudio examina las debilidades de los modelos SER frente a ataques adversariales en diferentes idiomas.
― 6 minilectura
SEANet mejora el aislamiento del hablante al reducir el ruido en el procesamiento de audio.
― 8 minilectura
Un nuevo códec de audio que ofrece compresión de alta calidad y contenido semántico rico.
― 8 minilectura
Una herramienta que combina análisis de audio y video para identificar eventos.
― 6 minilectura
Un método para medir cómo los materiales absorben el sonido de manera efectiva.
― 6 minilectura
Un método de aprendizaje activo en dos etapas mejora la precisión del reconocimiento de voz con menos datos.
― 6 minilectura
Nuevos métodos mejoran la claridad del habla en los audífonos mediante técnicas de aprendizaje profundo.
― 7 minilectura
Aprende sobre técnicas de localización de sonido y sus usos en diferentes campos.
― 5 minilectura
Un nuevo conjunto de datos y métodos mejoran la detección de deepfakes de audio generados por ALM.
― 7 minilectura
Este estudio evalúa el rendimiento de los sistemas de ASR con personas que tartamudean.
― 10 minilectura
Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.
― 7 minilectura
Un dispositivo ayuda a enfocarse en voces específicas en lugares concurridos.
― 7 minilectura
Un nuevo método mejora la edición de audio usando modelos de difusión para cambios precisos.
― 6 minilectura
SpeechVerse conecta la comprensión de audio y el procesamiento del lenguaje para mejorar la interacción humano-computadora.
― 7 minilectura
Un nuevo conjunto de datos destaca las diferencias de rendimiento entre grupos demográficos que utilizan asistentes de voz.
― 8 minilectura
Este artículo investiga las vulnerabilidades en los modelos de voz y formas de mejorar su seguridad.
― 6 minilectura