Un nuevo método busca mejorar los sistemas de reconocimiento de voz para personas con disartria.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método busca mejorar los sistemas de reconocimiento de voz para personas con disartria.
― 6 minilectura
Un nuevo método mejora la comprensión de las computadoras sobre comandos hablados con menos ejemplos.
― 5 minilectura
Mejorando la identificación de voces al combinar sonido y palabras habladas en audio.
― 6 minilectura
Un nuevo marco mejora la detección de hablantes activos usando pistas de audio y visuales.
― 6 minilectura
Un nuevo método mejora los modelos de audio generales para un reconocimiento de voz efectivo.
― 8 minilectura
Esta investigación aborda el olvido en la IA a través del aprendizaje continuo en la comprensión del lenguaje hablado.
― 9 minilectura
CALLS tiene como objetivo mejorar la capacidad de los asistentes de voz para manejar interacciones con clientes.
― 6 minilectura
Nuevos métodos usan la identidad del hablante para mejorar el rendimiento del reconocimiento de voz.
― 6 minilectura
Usar transfer learning de modelos checos mejora la precisión del reconocimiento de voz en eslovaco.
― 4 minilectura
Construyendo sistemas de TTS para lenguas turcas menos conocidas usando datos en kazajo.
― 6 minilectura
Un nuevo modelo mejora el aislamiento de voz en entornos ruidosos.
― 6 minilectura
OpenSR mejora los modelos de lectura labial usando datos de audio para una mejor precisión y accesibilidad.
― 8 minilectura
La investigación revela un modelo para mejorar la corrección de disfluencias en los sistemas de reconocimiento de voz.
― 6 minilectura
Un estudio sobre cómo los errores de habla afectan el aprendizaje con agentes enseñables.
― 7 minilectura
Un nuevo método mejora el reconocimiento de voz para nombres que suenan parecido.
― 6 minilectura
Nuevos métodos mejoran la flexibilidad y el rendimiento del modelo en tareas de audio.
― 5 minilectura
Un nuevo método mejora la comprensión del lenguaje hablado sin necesitar transcripciones escritas.
― 6 minilectura
Mejorando la tecnología de traducción para lenguas de pocos recursos como Tamasheq y Quechua.
― 7 minilectura
BabySLM evalúa qué tan bien las máquinas aprenden a entender el habla según el lenguaje de los niños.
― 8 minilectura
Mejorando sistemas para el reconocimiento de voz silenciosa con nuevas técnicas.
― 6 minilectura
Un nuevo método para entrenar modelos de detección de palabras clave usando supervisión débil en entornos ruidosos.
― 7 minilectura
Un nuevo enfoque mejora el rendimiento de RNN-T en el reconocimiento automático del habla.
― 8 minilectura
Explorando métodos para mejorar el reconocimiento de voz multilingüe en idiomas indios.
― 7 minilectura
Descubre cómo SVVAD mejora la detección de actividad de voz para una mejor verificación del hablante.
― 6 minilectura
Un nuevo método mejora la retroalimentación de pronunciación para los que aprenden idiomas.
― 7 minilectura
Un nuevo marco evalúa qué tan bien los modelos de voz se adaptan a tareas específicas.
― 7 minilectura
La investigación mejora la traducción de voz multilingüe usando conocimiento semántico.
― 5 minilectura
Sparq busca mejorar el rendimiento en redes neuronales cuantizadas con menos necesidades de recursos.
― 5 minilectura
SlothSpeech revela vulnerabilidades en sistemas de reconocimiento de voz, haciéndolos mucho más lentos.
― 5 minilectura
EmoMix permite crear discursos que expresan emociones mixtas con una intensidad precisa.
― 6 minilectura
Un nuevo corpus para traducir audio en cantonés a texto en inglés.
― 6 minilectura
Descubre el innovador método de Autoencoder Máscara de Ventana Múltiple para un mejor procesamiento de audio.
― 6 minilectura
Un nuevo método mejora los sistemas de reconocimiento de voz automático para una mejor precisión y adaptabilidad.
― 7 minilectura
El sesgo contextual mejora los sistemas de reconocimiento de voz, aumentando la precisión en tareas especializadas.
― 6 minilectura
Este estudio presenta un nuevo sistema para detectar errores de pronunciación en los estudiantes de idiomas.
― 7 minilectura
Un nuevo modelo reduce el tamaño mientras mejora el reconocimiento de voz multilingüe.
― 7 minilectura
Un nuevo sistema mejora el reconocimiento de voz en entornos con múltiples hablantes.
― 7 minilectura
Este estudio examina los beneficios de combinar el procesamiento del habla con datos visuales.
― 7 minilectura
Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.
― 5 minilectura
Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.
― 6 minilectura