Últimos artículos para Reconocimiento de voz

Procesado de Audio y Voz Avances en Técnicas de Mejora del Habla

Un nuevo modelo mejora la claridad del habla al atacar el ruido y los ecos.

2025-07-12T15:20:35+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en el Análisis de Imágenes Médicas Basado en Voz

Un nuevo conjunto de datos potencia la atención médica con sistemas de preguntas basados en voz para imágenes médicas.

2025-07-12T04:00:30+00:00 ― 8 minilectura

Computación y lenguaje Optimizando la corrección de errores de ASR con modelos de lenguaje

Un estudio sobre cómo mejorar la precisión de la transcripción a través de un mejor diseño de prompts.

2025-07-11T15:03:05+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Emociones en el Habla en Entornos Ruidosos

Un nuevo enfoque mejora los sistemas SER al usar descripciones de ambientes ruidosos.

2025-07-11T06:08:40+00:00 ― 7 minilectura

Sonido Enfoque innovador para el entrenamiento de asistentes de voz

Combinar TTS y datos reales mejora efectivamente los sistemas de reconocimiento de voz.

2025-07-10T00:59:40+00:00 ― 5 minilectura

Sonido Avances en Interfaces de Discurso Silencioso

Nuevo método mejora la conversión de el habla silenciosa a audio comprensible.

2025-07-09T22:33:55+00:00 ― 6 minilectura

Sonido Avances en Técnicas de Separación de Voz Audio-Visual

Un nuevo método mejora la separación de voces en entornos ruidosos con múltiples hablantes.

2025-07-09T16:53:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Un nuevo método para medir el significado del sonido

Este estudio presenta un método para evaluar el significado de las señales sonoras.

2025-07-09T16:05:15+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando las tecnologías de reconocimiento de voz susurrada

Nuevos métodos buscan mejorar el reconocimiento del habla susurrada en sistemas automáticos.

2025-07-08T08:30:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Colaboración de IA

Los modelos de IA mejoran la precisión de las conversiones de voz a texto.

2025-07-07T09:50:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Equilibrando la Privacidad y la Utilidad en el Análisis de Conversaciones

Examinando técnicas para proteger la privacidad mientras se analizan conversaciones grabadas.

2025-07-07T04:10:05+00:00 ― 6 minilectura

Procesado de Audio y Voz SynesLM: Avanzando la Tecnología de Voz Audiovisual

Un nuevo modelo integra datos de audio y visuales para el reconocimiento y la traducción del habla.

2025-07-06T20:04:15+00:00 ― 7 minilectura

Sonido Abordando los desafíos del reconocimiento de acentos en la tecnología de voz

Nuevos métodos mejoran la precisión del reconocimiento de voz para acentos diversos.

2025-07-05T05:12:15+00:00 ― 5 minilectura

Computación y lenguaje Nuevo marco transforma el habla en gráficos de conocimiento

Wav2graph crea grafos de conocimiento a partir del lenguaje hablado para mejorar la comprensión de la IA.

2025-07-04T04:06:10+00:00 ― 8 minilectura

Sonido Presentando MulliVC: Sistema de Conversión de Voz de Nueva Generación

MulliVC transforma voces entre idiomas con una precisión y claridad impresionantes.

2025-07-03T11:54:30+00:00 ― 6 minilectura

Robótica Los robots aprenden a leer las emociones humanas

Nuevo sistema de navegación para robots entiende órdenes habladas a través de emociones.

2025-07-02T20:42:06+00:00 ― 7 minilectura

Computación y lenguaje Nuevo Modelo TOGGL Mejora la Transcripción de Voz

El modelo TOGGL mejora la precisión de la transcripción en situaciones de habla superpuesta.

2025-07-02T03:31:10+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Aprendizaje de Representación de Ruido de Contexto

Un método para mejorar la calidad del reconocimiento de voz en entornos ruidosos.

2025-07-01T23:28:15+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en Tecnología de Voz con SaSLaW

Los investigadores desarrollan SaSLaW para mejorar la adaptación del habla de las máquinas en diferentes entornos.

2025-07-01T16:11:00+00:00 ― 6 minilectura

Computación y lenguaje Evaluando el sesgo en los modelos de lenguaje de habla

Un nuevo conjunto de datos resalta los sesgos en los modelos de lenguaje según el género y la edad.

2025-06-30T19:07:50+00:00 ― 9 minilectura

Computación y lenguaje Avances en Modelos de Voz a Través de Técnicas de Poda

La investigación revela cómo hacer que los modelos de voz sean más pequeños y eficientes.

2025-06-29T16:24:35+00:00 ― 6 minilectura

Sonido Mejorando la detección de palabras clave con entrenamiento adversarial

El entrenamiento adversarial mejora la precisión del reconocimiento de palabras clave en habla sintética y real.

2025-06-28T13:41:20+00:00 ― 6 minilectura

Computación y lenguaje Evaluando Modelos de Reconocimiento de Emociones en el Habla con un Nuevo Benchmark

Un nuevo estándar mejora la evaluación de los sistemas de reconocimiento de emociones en el habla a través de distintos idiomas y emociones.

2025-06-28T04:15:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz multilingüe sin datos originales

Nuevos métodos mejoran los modelos de ASR para múltiples idiomas, preservando el conocimiento pasado.

2025-06-27T15:01:00+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz bilingüe con XCB

Un nuevo enfoque mejora el reconocimiento de frases en código mezclado en el habla bilingüe.

2025-06-27T11:46:40+00:00 ― 6 minilectura

Aprendizaje automático Avances en el Procesamiento de Secuencias con MRConv

Un nuevo método para manejar mejor las secuencias de datos largas.

2025-06-26T07:21:36+00:00 ― 5 minilectura

Computación y lenguaje El papel de la prosodia y la pragmática en la tecnología del habla

Examinando cómo los patrones de voz afectan el significado y el rendimiento tecnológico.

2025-06-25T21:43:15+00:00 ― 6 minilectura

Sonido Desafíos en la detección de señales de voz parcialmente falsas

Una mirada a las complejidades de identificar pistas de audio mezcladas.

2025-06-25T06:20:10+00:00 ― 7 minilectura

Computación y lenguaje O-HuBERT: Un Paso Adelante en el Reconocimiento de Voz

O-HuBERT mejora el reconocimiento de voz al separar la información del contenido y la información expresiva.

2025-06-24T20:04:24+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz en hindi con pseudoetiquetado

Un nuevo método mejora el reconocimiento de voz para Hindi usando técnicas de pseudoetiquetado.

2025-06-24T06:02:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Preservando los dialectos tamil a través de la tecnología

Un sistema para clasificar los dialectos literarios y coloquiales del tamil usando características de sonido.

2025-06-23T13:51:00+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz: Susurrado vs. Normal

Nuevos métodos mejoran la comprensión de la computadora sobre el habla susurrada y normal.

2025-06-23T08:59:30+00:00 ― 6 minilectura

Aprendizaje automático Entendiendo el Recorte por Micro-lotes en Aprendizaje Automático

Una mirada a la recorte de micro-lotes y sus beneficios para el entrenamiento de modelos.

2025-06-23T05:45:10+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz japonés con técnicas GER

La investigación muestra cómo los LLMs mejoran el reconocimiento automático de voz en japonés.

2025-06-23T04:08:00+00:00 ― 7 minilectura

Computación y lenguaje Cómo los modelos de habla aprenden suprasegmentales

Este artículo examina cómo los modelos reconocen el tono, el estrés y los acentos de pitch.

2025-06-22T21:19:54+00:00 ― 6 minilectura

Computación y lenguaje Presentamos SALSA: Un nuevo método para mejorar el ASR

SALSA mejora la precisión del reconocimiento de voz para lenguas de pocos recursos al integrar ASR y modelos de lenguaje.

2025-06-22T06:16:15+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento Automático de Voz con Modelos de Lenguaje

Nuevo método mejora la precisión de ASR usando modelos de lenguaje para mejores transcripciones.

2025-06-21T20:33:15+00:00 ― 4 minilectura

Computación y lenguaje Mejorando la Precisión en el Etiquetado de Hablantes en Conversaciones

Un nuevo sistema corrige errores de identificación de hablantes para tener transcripciones de conversación más claras.

2025-06-21T18:56:05+00:00 ― 9 minilectura

Sonido Avances en técnicas de mejora de audio

Mejorando la claridad del habla a través de filtros híbridos y redes neuronales.

2025-06-21T17:18:55+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de voz audiovisual

Un nuevo modelo mejora el reconocimiento de voz al combinar de manera efectiva las entradas de audio y visuales.

2025-06-21T05:58:45+00:00 ― 6 minilectura