Últimos artículos para Reconocimiento de voz

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz para Todos los Hablantes

Un nuevo método busca mejorar los sistemas de reconocimiento de voz para personas con disartria.

2025-11-04T22:58:25+00:00 ― 6 minilectura

Computación y lenguaje Avances en el Aprendizaje de Palabras Habladas con MAMLCon

Un nuevo método mejora la comprensión de las computadoras sobre comandos hablados con menos ejemplos.

2025-11-04T22:09:50+00:00 ― 5 minilectura

Computación y lenguaje Mejorando la Diarización de Altavoces Usando Análisis de Palabras

Mejorando la identificación de voces al combinar sonido y palabras habladas en audio.

2025-11-04T18:55:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de detección de hablantes activos

Un nuevo marco mejora la detección de hablantes activos usando pistas de audio y visuales.

2025-11-04T16:29:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando Modelos de Audio Generales para Tareas de Voz

Un nuevo método mejora los modelos de audio generales para un reconocimiento de voz efectivo.

2025-11-04T05:58:10+00:00 ― 8 minilectura

Procesado de Audio y Voz Avanzando en la comprensión del lenguaje hablado con aprendizaje continuo

Esta investigación aborda el olvido en la IA a través del aprendizaje continuo en la comprensión del lenguaje hablado.

2025-11-04T00:18:05+00:00 ― 9 minilectura

Sonido Desarrollando Asistentes de Voz Empáticos con CALLS

CALLS tiene como objetivo mejorar la capacidad de los asistentes de voz para manejar interacciones con clientes.

2025-11-03T19:26:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en el reconocimiento de voz con aprendizaje débilmente supervisado

Nuevos métodos usan la identidad del hablante para mejorar el rendimiento del reconocimiento de voz.

2025-11-03T01:37:45+00:00 ― 6 minilectura

Computación y lenguaje Avanzando el Reconocimiento de Voz Eslovaco con Conocimientos Checos

Usar transfer learning de modelos checos mejora la precisión del reconocimiento de voz en eslovaco.

2025-11-02T21:19:36+00:00 ― 4 minilectura

Procesado de Audio y Voz Avanzando la conversión de texto a voz para lenguas túrquicas

Construyendo sistemas de TTS para lenguas turcas menos conocidas usando datos en kazajo.

2025-11-02T18:20:30+00:00 ― 6 minilectura

Sonido Avances en la Separación de Voz con S4M

Un nuevo modelo mejora el aislamiento de voz en entornos ruidosos.

2025-11-02T10:14:40+00:00 ― 6 minilectura

Computación y lenguaje Avances en la tecnología de lectura de labios con OpenSR

OpenSR mejora los modelos de lectura labial usando datos de audio para una mejor precisión y accesibilidad.

2025-11-01T17:48:30+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Corrección de Disfluencias

La investigación revela un modelo para mejorar la corrección de disfluencias en los sistemas de reconocimiento de voz.

2025-11-01T17:32:42+00:00 ― 6 minilectura

Interacción Persona-Ordenador El impacto de la mala reconocimiento de voz en el aprendizaje con agentes enseñables

Un estudio sobre cómo los errores de habla afectan el aprendizaje con agentes enseñables.

2025-11-01T15:42:06+00:00 ― 7 minilectura

Sonido Abordando desafíos en el reconocimiento de voz con palabras enarmónicas

Un nuevo método mejora el reconocimiento de voz para nombres que suenan parecido.

2025-11-01T14:48:40+00:00 ― 6 minilectura

Aprendizaje automático Avances en Aprendizaje Auto-Supervisado Multitarea

Nuevos métodos mejoran la flexibilidad y el rendimiento del modelo en tareas de audio.

2025-11-01T08:20:00+00:00 ― 5 minilectura

Computación y lenguaje Avanzando en la comprensión del lenguaje hablado con unidades discretas

Un nuevo método mejora la comprensión del lenguaje hablado sin necesitar transcripciones escritas.

2025-11-01T00:14:10+00:00 ― 6 minilectura

Computación y lenguaje Avances en la traducción para lenguas subrepresentadas

Mejorando la tecnología de traducción para lenguas de pocos recursos como Tamasheq y Quechua.

2025-10-31T16:39:36+00:00 ― 7 minilectura

Computación y lenguaje Nuevo estándar para modelos de aprendizaje de voz

BabySLM evalúa qué tan bien las máquinas aprenden a entender el habla según el lenguaje de los niños.

2025-10-31T11:33:20+00:00 ― 8 minilectura

Sonido Avances en Interfaces de Habla Silenciosa

Mejorando sistemas para el reconocimiento de voz silenciosa con nuevas técnicas.

2025-10-31T07:13:55+00:00 ― 6 minilectura

Sonido Avances en la detección de palabras clave debidamente supervisada

Un nuevo método para entrenar modelos de detección de palabras clave usando supervisión débil en entornos ruidosos.

2025-10-31T01:33:50+00:00 ― 7 minilectura

Sonido Mejorando los modelos RNN-T con aprendizaje por refuerzo

Un nuevo enfoque mejora el rendimiento de RNN-T en el reconocimiento automático del habla.

2025-10-30T19:53:45+00:00 ― 8 minilectura

Computación y lenguaje Avances en sistemas de reconocimiento de voz multilingües

Explorando métodos para mejorar el reconocimiento de voz multilingüe en idiomas indios.

2025-10-30T10:10:45+00:00 ― 7 minilectura

Sonido Avanzando en la Detección de Actividad de Voz con SVVAD

Descubre cómo SVVAD mejora la detección de actividad de voz para una mejor verificación del hablante.

2025-10-30T09:22:10+00:00 ― 6 minilectura

Sonido Avances en la Evaluación Automática de Pronunciación

Un nuevo método mejora la retroalimentación de pronunciación para los que aprenden idiomas.

2025-10-30T08:33:35+00:00 ― 7 minilectura

Computación y lenguaje Midiendo la Adaptabilidad en Modelos de Reconocimiento de Voz

Un nuevo marco evalúa qué tan bien los modelos de voz se adaptan a tareas específicas.

2025-10-30T06:56:25+00:00 ― 7 minilectura

Computación y lenguaje Avances en la traducción de voz multilingüe

La investigación mejora la traducción de voz multilingüe usando conocimiento semántico.

2025-10-30T06:07:50+00:00 ― 5 minilectura

Arquitectura de hardware Presentamos Sparq: Una Nueva Solución de Procesamiento para Redes Neuronales Cuantizadas

Sparq busca mejorar el rendimiento en redes neuronales cuantizadas con menos necesidades de recursos.

2025-10-30T00:45:54+00:00 ― 5 minilectura

Sonido Desaceleración en el Reconocimiento de Voz: Una Mirada Más Cernida a SlothSpeech

SlothSpeech revela vulnerabilidades en sistemas de reconocimiento de voz, haciéndolos mucho más lentos.

2025-10-29T17:10:30+00:00 ― 5 minilectura

Sonido EmoMix: Avanzando en la Síntesis de Voz Emocional

EmoMix permite crear discursos que expresan emociones mixtas con una intensidad precisa.

2025-10-29T13:56:10+00:00 ― 6 minilectura

Computación y lenguaje HK-LegiCoST: Conectando el cantonés hablado y escrito

Un nuevo corpus para traducir audio en cantonés a texto en inglés.

2025-10-29T11:59:36+00:00 ― 6 minilectura

Sonido MW-MAE: Un Nuevo Enfoque para el Aprendizaje de Audio

Descubre el innovador método de Autoencoder Máscara de Ventana Múltiple para un mejor procesamiento de audio.

2025-10-29T11:30:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la tecnología ASR con minimización de entropía generalizada a nivel secuencial

Un nuevo método mejora los sistemas de reconocimiento de voz automático para una mejor precisión y adaptabilidad.

2025-10-29T02:36:00+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Sesgo Contextual

El sesgo contextual mejora los sistemas de reconocimiento de voz, aumentando la precisión en tareas especializadas.

2025-10-29T00:58:50+00:00 ― 6 minilectura

Sonido Nuevo método para mejorar la detección de la pronunciación del idioma

Este estudio presenta un nuevo sistema para detectar errores de pronunciación en los estudiantes de idiomas.

2025-10-28T21:44:30+00:00 ― 7 minilectura

Computación y lenguaje Avanzando en el reconocimiento de voz multilingüe con DistilXLSR

Un nuevo modelo reduce el tamaño mientras mejora el reconocimiento de voz multilingüe.

2025-10-28T11:12:55+00:00 ― 7 minilectura

Computación y lenguaje Avances en el Reconocimiento de Voz para Múltiples Hablantes

Un nuevo sistema mejora el reconocimiento de voz en entornos con múltiples hablantes.

2025-10-28T00:41:20+00:00 ― 7 minilectura

Procesado de Audio y Voz Combinando el procesamiento de voz con el aprendizaje visual

Este estudio examina los beneficios de combinar el procesamiento del habla con datos visuales.

2025-10-27T20:38:25+00:00 ― 7 minilectura

Computación y lenguaje Evaluando el rendimiento de Whisper en los dialectos árabes

Una mirada a cómo Whisper maneja varios dialectos y acentos árabes.

2025-10-27T13:21:10+00:00 ― 5 minilectura

Computación y lenguaje Avanzando en el reconocimiento de actos de habla en bengalí

Un nuevo método mejora el reconocimiento de actos de habla en bengalí usando análisis de audio y texto.

2025-10-27T10:55:25+00:00 ― 6 minilectura