Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Mejorando el reconocimiento de voz de Whisper para el vietnamita y otros idiomas de bajo recurso.
― 5 minilectura
Este estudio examina cómo la capacidad auditiva afecta la comprensión del habla en entornos ruidosos.
― 8 minilectura
Usando k-means para optimizar datos de audio y mejorar el entrenamiento del modelo.
― 6 minilectura
Un método para elegir el mejor modelo de ASR basado en características de audio.
― 6 minilectura
MyST busca mejorar el aprendizaje de ciencias de los niños a través de tutorías virtuales.
― 6 minilectura
Una mirada a M2MeT 2.0 y su impacto en la transcripción de reuniones.
― 7 minilectura
Este estudio analiza cómo la compresión de modelos afecta el reconocimiento de voz en entornos ruidosos.
― 6 minilectura
Un nuevo modelo mejora la comprensión del habla y los sonidos al mismo tiempo.
― 6 minilectura
Presentando nuevos modelos para mejorar la extracción de voz en entornos ruidosos.
― 7 minilectura
La investigación se centra en mejorar los sistemas de ASR para audio no segmentado.
― 6 minilectura
Examinando las diferencias en el rendimiento del reconocimiento de voz entre géneros.
― 6 minilectura
Los LLMs mejoran la precisión y la corrección de errores en los sistemas de reconocimiento de voz.
― 6 minilectura
PP-MeT tiene como objetivo mejorar la precisión en la transcripción de reuniones con varios hablantes.
― 6 minilectura
Esta investigación presenta un modelo para mejorar la claridad del habla en diferentes condiciones.
― 6 minilectura
Este proyecto tiene como objetivo mejorar el reconocimiento del habla mixta de gujarati-inglés.
― 7 minilectura
Un nuevo modelo integra audio y texto para mejorar la clasificación del habla.
― 8 minilectura
Una nueva iniciativa para mejorar la tecnología de transcripción para reuniones en salas grandes.
― 9 minilectura
Nuevos métodos mejoran la precisión en el reconocimiento de voz ruidosa usando modelos de lenguaje grandes.
― 7 minilectura
Este artículo habla sobre soluciones para aplicaciones de voz en idiomas con datos transcritos limitados.
― 7 minilectura
Un nuevo método apoya la preservación de las lenguas en peligro a través de una documentación detallada.
― 9 minilectura
Un método mejora la claridad del habla en entornos ruidosos sin datos de entrenamiento claros.
― 7 minilectura
Nuevos métodos mejoran el ASR para lenguas subrepresentadas usando datos de lenguas similares.
― 6 minilectura
Reborn ofrece soluciones innovadoras para el reconocimiento automático de voz sin datos etiquetados.
― 7 minilectura
Una mirada a nuevos modelos para respuestas habladas naturales.
― 8 minilectura
Nuevos métodos mejoran la detección de actividad de voz y superposición en la diarización del hablante.
― 8 minilectura
Chirp MFCC mejora la representación de la señal de audio para una mejor clasificación y reconocimiento.
― 6 minilectura
Kallaama crea un conjunto de datos de habla en idiomas locales para ayudar a los agricultores senegaleses.
― 5 minilectura
Un nuevo marco mejora los modelos de lenguaje al reconocer y responder a diferentes estilos de habla.
― 9 minilectura
Mejorando los sistemas de ASV para reconocer las voces de los niños con precisión.
― 11 minilectura
La investigación destaca nuevos modelos para mejorar la calidad de audio en diferentes entornos.
― 9 minilectura
La investigación destaca la importancia del tiempo sobre las características específicas del hablante en los modelos de diarización.
― 7 minilectura
Una mirada a MONA, un sistema que mejora la comunicación en silencio.
― 5 minilectura
La investigación se centra en ayudar a los robots a entender mejor el habla en medio del ruido de fondo.
― 6 minilectura
Un nuevo estándar evalúa el rendimiento de los sistemas de reconocimiento de voz en medio de diversas interferencias.
― 6 minilectura
La IA está mejorando los implantes cocleares para tener mejor audición y comunicación en entornos difíciles.
― 8 minilectura
Este método mejora la separación de audio al combinar descripciones de lenguaje con análisis de sonido.
― 7 minilectura
La investigación muestra que usar análisis de voz para identificar la enfermedad de Parkinson temprano tiene potencial.
― 6 minilectura
Un nuevo método mejora cómo los sistemas manejan errores en la comprensión del lenguaje hablado.
― 8 minilectura
Un nuevo método mejora la precisión del reconocimiento de texto en varias aplicaciones.
― 7 minilectura
Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.
― 7 minilectura