Los investigadores trabajan para mejorar el reconocimiento de voz en línea usando modelos de espacio de estados estructurados.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Los investigadores trabajan para mejorar el reconocimiento de voz en línea usando modelos de espacio de estados estructurados.
― 6 minilectura
Un nuevo sistema mejora las experiencias de las reuniones al identificar a los hablantes en tiempo real.
― 5 minilectura
Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.
― 6 minilectura
Un método para la conversión de voz que mejora la privacidad y la calidad del habla.
― 8 minilectura
Nuevos métodos mejoran la capacidad de distinguir audio falso de real.
― 7 minilectura
Un método mejora la detección de voces sintéticas y identifica a sus creadores.
― 6 minilectura
Nuevos métodos mejoran modelos pequeños para una mejor mejora de voz usando menos recursos.
― 7 minilectura
Un nuevo método mejora los modelos de ASR para usuarios individuales usando cuantización y adaptación.
― 7 minilectura
Nuevos métodos mejoran el rendimiento del vocoder con datos de audio limitados.
― 6 minilectura
Una mirada a la disartria, su detección y el papel de la tecnología.
― 7 minilectura
Los soft prompts mejoran la tecnología de reconocimiento de voz para un mejor rendimiento en ambientes ruidosos.
― 6 minilectura
La investigación combina aprendizaje auto-supervisado y nuevas técnicas de medición para mejorar la inversión del habla.
― 7 minilectura
Los investigadores desarrollan un nuevo marco para mejorar la claridad del habla para los usuarios de electrolaringe.
― 6 minilectura
Este estudio explora estrategias de entrenamiento para mejorar la detección de audio falso.
― 6 minilectura
Nuevos modelos se adaptan para mejorar la eficiencia y la rapidez del reconocimiento de voz.
― 6 minilectura
RECAP usa técnicas avanzadas para generar subtítulos de audio precisos sin necesidad de reentrenar.
― 6 minilectura
Una guía práctica para entender la teoría musical a través de la armonía y las escalas.
― 9 minilectura
Un nuevo método utiliza datos sintéticos para mejorar los sistemas de ASR en áreas desconocidas.
― 7 minilectura
Un nuevo método basado en audio estima el tamaño de las multitudes sin invadir la privacidad personal.
― 5 minilectura
Un nuevo enfoque para el reconocimiento de voz mejora la interacción del usuario con instrucciones flexibles.
― 5 minilectura
Un enfoque sólido para identificar anomalías en el audio y combatir el spoofing vocal.
― 6 minilectura
Un nuevo modelo mejora la comprensión de las emociones durante las conversaciones.
― 7 minilectura
Este estudio examina si los símbolos de habla aprendidos imitan los patrones de frecuencia de palabras.
― 6 minilectura
Presentamos un método más rápido para la síntesis de voz de alta calidad usando modelos de difusión.
― 7 minilectura
HiFTNet ofrece una síntesis de voz más rápida y de alta calidad usando técnicas innovadoras y eficientes.
― 6 minilectura
Nuevo método transforma voces usando rasgos faciales para diversas aplicaciones.
― 10 minilectura
AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.
― 6 minilectura
Un nuevo enfoque mejora la diarización de hablantes al integrar datos semánticos en el proceso.
― 6 minilectura
Nuevo método mejora la velocidad y eficiencia en la generación de texto a audio.
― 5 minilectura
La investigación muestra una mejor precisión en el reconocimiento de emociones a partir del habla en diferentes idiomas.
― 5 minilectura
Explora cómo TTT mejora el reconocimiento de voz al adaptarse a cambios en la distribución.
― 8 minilectura
Mejorando la forma en que identificamos fuentes de sonido usando datos audio-visuales.
― 8 minilectura
Un método para visualizar y predecir sonidos en diferentes entornos usando tecnología avanzada.
― 6 minilectura
Nuevos métodos combinan audio y metadatos para mejorar el reconocimiento de idiomas.
― 7 minilectura
Un sistema diseñado para detectar ataques de presentación de voz mejora la seguridad en el reconocimiento de voz.
― 7 minilectura
Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.
― 5 minilectura
FluentEditor mejora la edición de audio al centrarse en el flujo natural y la consistencia.
― 5 minilectura
Mejorando la traducción en tiempo real con técnicas avanzadas de segmentación.
― 6 minilectura
Mejorando las traducciones en tiempo real a través de métodos innovadores y políticas inteligentes.
― 6 minilectura
Esfuerzos para mejorar los sistemas de ASR para el árabe tunecino y el cambio de código.
― 6 minilectura