Presentando nuevas métricas para evaluar la precisión de la diarización de hablantes en la IA conversacional.
― 7 minilectura
Ciencia de vanguardia explicada de forma sencilla
Presentando nuevas métricas para evaluar la precisión de la diarización de hablantes en la IA conversacional.
― 7 minilectura
Nuevos métodos mejoran la precisión y la velocidad en los sistemas de reconocimiento de voz.
― 6 minilectura
Un nuevo método mejora el rendimiento del ASR a través de la integración de datos de texto.
― 7 minilectura
La inyección de texto ayuda a reconocer información personal mientras se mantiene la privacidad.
― 6 minilectura
Radio2Text usa señales mmWave para el reconocimiento de voz en tiempo real en entornos ruidosos.
― 7 minilectura
Este estudio mejora los modelos G2P al centrarse en las áreas propensas a errores durante el entrenamiento.
― 5 minilectura
Descubre métodos que mejoran la precisión en el seguimiento de formantes para el análisis del habla.
― 8 minilectura
Nuevos métodos mejoran el procesamiento y la generación de habla en los modelos de lenguaje.
― 6 minilectura
Nuevas técnicas mejoran la claridad del audio en entornos ruidosos.
― 7 minilectura
Nuevos métodos mejoran la detección de palabras clave usando datos de habla leída disponibles.
― 5 minilectura
Un nuevo enfoque mejora la estimación de confianza en los sistemas de ASR para más precisión.
― 5 minilectura
Este estudio explora problemas con el uso de convnets para la creación de bancos de filtros de audio.
― 6 minilectura
Este artículo explora los avances en la diarización de hablantes usando modelos de lenguaje para mejorar la precisión.
― 6 minilectura
Nuevo sistema mejora el reconocimiento de voz usando indicaciones conscientes del contexto.
― 5 minilectura
EnCodecMAE combina el aprendizaje auto-supervisado y códecs de audio para mejorar el rendimiento en tareas de audio.
― 6 minilectura
Presentamos un método flexible para reconocer palabras clave en el habla en diferentes idiomas.
― 7 minilectura
PIAVE ayuda a las máquinas a captar voces con claridad, incluso cuando los hablantes giran la cabeza.
― 7 minilectura
Presentamos un marco flexible para mejorar la investigación sobre la privacidad de la voz.
― 8 minilectura
Un nuevo método simplifica la comprensión de los modelos de clasificación de voz.
― 7 minilectura
M-AUDIODEC comprime audio multicanal manteniendo la posición de los altavoces y la calidad.
― 7 minilectura
La investigación revela nuevos modelos para mejorar la claridad del sonido en los auriculares inteligentes.
― 6 minilectura
Un nuevo método mejora la capacidad de los robots para seguir instrucciones habladas con precisión.
― 6 minilectura
Nuevos métodos están mejorando nuestra capacidad para detectar discursos falsos de manera efectiva.
― 6 minilectura
Un nuevo método mejora los modelos de ASR para usuarios individuales usando cuantización y adaptación.
― 7 minilectura
Nuevos modelos se adaptan para mejorar la eficiencia y la rapidez del reconocimiento de voz.
― 6 minilectura
Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.
― 5 minilectura
Este estudio examina cómo la capacidad auditiva afecta la comprensión del habla en entornos ruidosos.
― 8 minilectura
Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.
― 6 minilectura
Un método para elegir el mejor modelo de ASR basado en características de audio.
― 6 minilectura
MyST busca mejorar el aprendizaje de ciencias de los niños a través de tutorías virtuales.
― 6 minilectura
Una mirada a M2MeT 2.0 y su impacto en la transcripción de reuniones.
― 7 minilectura
Este estudio analiza cómo la compresión de modelos afecta el reconocimiento de voz en entornos ruidosos.
― 6 minilectura
Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.
― 6 minilectura
Presentando nuevos modelos para mejorar la extracción de voz en entornos ruidosos.
― 7 minilectura
La investigación se centra en mejorar los sistemas de ASR para audio no segmentado.
― 6 minilectura
Examinando las diferencias en el rendimiento del reconocimiento de voz entre géneros.
― 6 minilectura
Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.
― 6 minilectura
PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.
― 6 minilectura
Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.
― 6 minilectura
Este proyecto tiene como objetivo mejorar el reconocimiento del habla mixta de gujarati-inglés.
― 7 minilectura