Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.
― 6 minilectura
Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.
― 7 minilectura
HiFTNet ofrece una síntesis de voz más rápida y de alta calidad usando técnicas innovadoras y eficientes.
― 6 minilectura
Nuevo método transforma voces usando rasgos faciales para diversas aplicaciones.
― 10 minilectura
AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.
― 6 minilectura
Un nuevo enfoque mejora la diarización de hablantes al integrar datos semánticos en el proceso.
― 6 minilectura
Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.
― 5 minilectura
La investigación muestra una mejor precisión en el reconocimiento de emociones a partir del habla en diferentes idiomas.
― 5 minilectura
Explora cómo TTT mejora el reconocimiento de voz al adaptarse a cambios en la distribución.
― 8 minilectura
Mejorando la forma en que identificamos fuentes de sonido usando datos audio-visuales.
― 8 minilectura
Un método para visualizar y predecir sonidos en diferentes entornos usando tecnología avanzada.
― 6 minilectura
Nuevos métodos combinan audio y metadatos para mejorar el reconocimiento de idiomas.
― 7 minilectura
Un sistema diseñado para detectar ataques de presentación de voz mejora la seguridad en el reconocimiento de voz.
― 7 minilectura
Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.
― 5 minilectura
FluentEditor mejora la edición de audio al centrarse en el flujo natural y la consistencia.
― 5 minilectura
Mejorando la traducción en tiempo real con técnicas avanzadas de segmentación.
― 6 minilectura
Mejorando las traducciones en tiempo real a través de métodos innovadores y políticas inteligentes.
― 6 minilectura
Esfuerzos para mejorar los sistemas de ASR para el árabe tunecino y el cambio de código.
― 6 minilectura
Métodos innovadores buscan adaptar la generación de música a las preferencias del usuario.
― 8 minilectura
Un nuevo modelo mejora la eficiencia y el rendimiento en la separación de voces.
― 6 minilectura
Un nuevo enfoque evalúa la calidad del audio usando múltiples micrófonos en diferentes entornos.
― 7 minilectura
Un nuevo método mejora la separación del sonido en diferentes frecuencias.
― 6 minilectura
Explora los avances en la cancelación de eco para mejorar la calidad de las llamadas.
― 5 minilectura
Un nuevo método mejora la generación de música al agregar contexto de interpretación.
― 7 minilectura
Un nuevo enfoque genera subtítulos de audio usando solo texto, mejorando la eficiencia de datos.
― 8 minilectura
Explorando los desafíos y las innovaciones para emparejar grabaciones de audio con partituras.
― 7 minilectura
Un nuevo enfoque aprovecha el aprendizaje autosupervisado para conectar el audio y la partitura.
― 6 minilectura
Un nuevo método mejora la coincidencia entre audio y partituras.
― 7 minilectura
Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.
― 6 minilectura
Un estudio muestra que la augmentación de audio puede mejorar el reconocimiento de voz en lenguas con pocos recursos.
― 7 minilectura
Un nuevo enfoque mejora la eficiencia en modelos de reconocimiento de voz multilingües al integrar técnicas de enmascaramiento adaptativo.
― 6 minilectura
Investigando audio deepfake para mejorar modelos de transcripción para idiomas menos comunes.
― 10 minilectura
Nuevas estrategias mejoran el aprendizaje con etiquetas débiles al seleccionar ejemplos negativos relevantes.
― 7 minilectura
Un nuevo método para marcar audio creado por modelos de difusión para proteger la propiedad.
― 7 minilectura
Nuevas técnicas mejoran los sistemas de ASR para un mejor reconocimiento de discursos largos.
― 6 minilectura
Nuevas técnicas buscan mejorar la precisión de los dispositivos activados por voz contra ataques.
― 7 minilectura
DurIAN-E mejora el habla sintética con una expresividad y fluidez natural mejoradas.
― 5 minilectura
Descubre cómo SER mejora la interacción entre humanos y máquinas a través de la detección de emociones.
― 6 minilectura
Un método para elegir el mejor modelo de ASR basado en características de audio.
― 6 minilectura
Aprende cómo la dereverberación mejora el reconocimiento de voz en ambientes ruidosos.
― 5 minilectura