Últimos artículos para Reconocimiento de voz

Computación y lenguaje Avances en la identificación de idiomas con el marco LASR

Un nuevo enfoque mejora la identificación del lenguaje hablado usando aprendizaje auto-supervisado y etiquetas.

2025-10-26T08:12:10+00:00 ― 7 minilectura

Sonido Mejorando el reconocimiento de voz disártrica en árabe

Un nuevo método mejora el reconocimiento de voz para hablantes árabes con disartria.

2025-10-26T07:23:35+00:00 ― 7 minilectura

Computación y lenguaje Herramienta innovadora de reconocimiento de voz para idiomas de bajos recursos

Allophant mejora el reconocimiento de fonemas para idiomas con datos limitados.

2025-10-26T06:35:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el tiempo de las palabras en sistemas de reconocimiento de voz

Mejorando cómo los sistemas de reconocimiento de voz estiman el tiempo de las palabras para más precisión.

2025-10-26T01:43:30+00:00 ― 5 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Modelos Avanzados

Nuevos métodos mejoran el procesamiento del habla en modelos de lenguaje.

2025-10-26T00:54:55+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Desplazamiento Telescópico Alternativo: Un Nuevo Método para la Alineación de Datos Multimodales

Descubre un nuevo método para combinar diferentes tipos de datos de manera efectiva.

2025-10-25T22:40:24+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Los modelos auto-supervisados revelan ideas sobre las distinciones fonéticas y fonémicas en el habla.

2025-10-25T10:20:25+00:00 ― 6 minilectura

Neurociencia Examinando las Respuestas del Cerebro al Habla: Claves Principales

Investigaciones revelan cómo nuestro cerebro sigue las características del habla durante la comprensión.

2025-10-25T09:40:42+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Reconocimiento de Entidades Nombradas Habladas

Este estudio se centra en mejorar el NER hablado a través del aprendizaje por transferencia y modelos E2E.

2025-10-24T10:59:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el llenado de slots en sistemas de diálogo

Un nuevo método mejora los sistemas de diálogo orientados a tareas utilizando integración de audio y conocimiento.

2025-10-23T22:13:12+00:00 ― 8 minilectura

Computación y lenguaje Avances en Reconocimiento Automático de Voz para los Idiomas Noruegos

Investigaciones recientes mejoran los modelos de ASR para noruego, mejorando el rendimiento en Bokmål y Nynorsk.

2025-10-23T21:10:00+00:00 ― 5 minilectura

Procesado de Audio y Voz Avances en modelos de ASR bilingües y con cambio de código

Nuevos métodos mejoran el reconocimiento de voz multilingüe usando fuentes de datos existentes.

2025-10-23T04:05:20+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz para Idiomas de Bajos Recursos

La investigación se centra en mejorar la tecnología de voz para idiomas que no tienen suficientes datos.

2025-10-22T23:13:50+00:00 ― 7 minilectura

Sonido Un enfoque simplificado para HMM híbrido en ASR

Este artículo habla sobre un nuevo método para construir sistemas ASR eficientes.

2025-10-22T14:19:25+00:00 ― 5 minilectura

Procesado de Audio y Voz Nuevo conjunto de datos y modelo para texto a voz multilingüe

CML-TTS permite mejores sistemas de texto a voz en siete idiomas.

2025-10-21T18:04:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz de múltiples hablantes con SURT 2.0

SURT 2.0 mejora el reconocimiento de voz para múltiples hablantes en situaciones en tiempo real.

2025-10-21T05:07:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el aprendizaje de reconocimiento automático de voz

Un nuevo método mejora la tecnología de reconocimiento de voz sin perder el conocimiento aprendido anteriormente.

2025-10-20T13:44:25+00:00 ― 7 minilectura

Computación y lenguaje Nuevas métricas para evaluar la calidad del reconocimiento de voz

Un nuevo método evalúa los sistemas de ASR sin necesitar textos de referencia.

2025-10-19T19:07:00+00:00 ― 5 minilectura

Computación y lenguaje Evaluando la calidad de ASR sin textos de referencia

NoRefER ofrece una nueva forma de evaluar los resultados de reconocimiento de voz sin necesidad de transcripciones.

2025-10-19T16:41:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en Técnicas de Diarización de Lenguaje Hablado

Nuevos métodos mejoran la segmentación del habla en conversaciones multilingües.

2025-10-19T02:06:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento Automático de Voz para Uso Multilingüe

Un nuevo marco mejora el ASR para lenguas de bajos recursos y la escalabilidad multilingüe.

2025-10-18T19:38:05+00:00 ― 6 minilectura

Visión por Computador y Reconocimiento de Patrones Mejorando la Lectura de Labios con Entrenamiento de Visemes

Un nuevo método mejora la precisión de la lectura de labios usando visemas en el reconocimiento del habla.

2025-10-18T03:42:24+00:00 ― 6 minilectura

Sonido Avanzando el reconocimiento de voz para usuarios sordos

Los sistemas ASR personalizados mejoran la comunicación para personas DHH de manera significativa.

2025-10-18T03:26:25+00:00 ― 7 minilectura

Sonido Avances en las técnicas de diarización de hablantes

Nuevos métodos aprovechan resúmenes conversacionales para mejorar el reconocimiento de hablantes.

2025-10-18T00:12:05+00:00 ― 7 minilectura

Computación y lenguaje Mejorando la puntuación automática del habla para estudiantes de idiomas

Mejorando los sistemas de retroalimentación para los que aprenden inglés al abordar el problema del arranque en frío.

2025-10-17T16:54:50+00:00 ― 7 minilectura

Multimedia Mejorando la extracción del hablante objetivo con pistas visuales

Un nuevo modelo mejora la extracción de voz usando información de audio y visual.

2025-10-17T12:51:55+00:00 ― 7 minilectura

Sonido Avances en la tecnología de extracción de hablantes objetivo

Descubre cómo nuevas técnicas mejoran la claridad del habla en entornos ruidosos.

2025-10-16T10:08:40+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Modelos de Larga Contexto

Este artículo habla de nuevos modelos que mejoran la precisión del reconocimiento de voz al considerar contextos más largos.

2025-10-15T12:16:55+00:00 ― 7 minilectura

Computación Neuronal y Evolutiva Avanzando Redes Neuronales de Espigas a Través del Aprendizaje por Retraso

Nuevo método mejora el aprendizaje en Redes Neuronales Espigadas al incorporar ajustes de retraso.

2025-10-15T07:25:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando en la Privacidad de Género en Audio: Nuevas Perspectivas

La investigación destaca métodos para proteger la privacidad de género en audio hablado.

2025-10-14T21:42:25+00:00 ― 7 minilectura

Sonido Avances en la tecnología de síntesis de lip a voz

Nuevo marco mejora la claridad del habla en videos silenciosos mediante un procesamiento mejorado.

2025-10-13T19:47:45+00:00 ― 7 minilectura

Sonido Avances en la detección de audio falso usando modelos Conformer

Los investigadores desarrollan un modelo Conformer para mejorar la detección de audio falso.

2025-10-13T03:36:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en los Embeddings Acústicos de Palabras para el Lenguaje Hablado

Investigación sobre cómo mejorar los embeddings acústicos de palabras con comprensión semántica y datos multilingües.

2025-10-12T14:38:45+00:00 ― 7 minilectura

Procesado de Audio y Voz Integrando el habla con modelos de lenguaje: El método Speech-LLaMA

Un nuevo enfoque que combina el habla con modelos de lenguaje para mejorar la traducción.

2025-10-11T18:24:10+00:00 ― 5 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz con RNN-Transductores

Nuevos métodos mejoran la precisión del reconocimiento de voz, solucionando errores comunes de transcripción.

2025-10-11T04:38:15+00:00 ― 5 minilectura

Computación y lenguaje Avances en la Clasificación de Intenciones del Habla y Relleno de Slots

Este artículo explora un nuevo modelo para la identificación de intención de habla y slots.

2025-10-09T12:09:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz sin texto

Nuevo método mejora el reconocimiento de voz usando solo datos de audio en bruto.

2025-10-09T02:26:05+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz para Adultos Mayores

Un estudio mejora el reconocimiento de voz para personas mayores, usando técnicas innovadoras.

2025-10-09T01:37:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Nuevo conjunto de datos busca mejorar el reconocimiento de voz en hebreo

ivrit.ai ofrece recursos clave para mejorar la tecnología de ASR en hebreo.

2025-10-08T05:22:55+00:00 ― 8 minilectura

Sonido Avanzando en el Reconocimiento de Voz con Transductores Espaciados en el Tiempo

Nuevo modelo mejora la velocidad de reconocimiento de voz y el uso de memoria.

2025-10-07T23:42:50+00:00 ― 7 minilectura