Últimos artículos para Reconocimiento de voz

Computación y lenguaje Decodificación por fusión generativa: Avanzando en el reconocimiento de texto

Un nuevo método mejora la precisión del reconocimiento de texto en varias aplicaciones.

2025-08-07T22:00:54+00:00 ― 7 minilectura

Computación y lenguaje Nuevo método de ataque silencia sistemas ASR

Un clip de audio universal puede silenciar modelos de ASR avanzados como Whisper.

2025-08-07T03:29:35+00:00 ― 7 minilectura

Computación y lenguaje Avances en Aprendizaje Federado para el Reconocimiento de Voz

Aprovechando modelos de salida temprana para un aprendizaje federado eficiente en sistemas de ASR.

2025-08-06T09:48:24+00:00 ― 10 minilectura

Computación y lenguaje Integrando Modelos de Audio y Lenguaje: SpeechVerse

SpeechVerse conecta la comprensión de audio y el procesamiento del lenguaje para mejorar la interacción humano-computadora.

2025-08-06T06:26:25+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz en el Aula con un Preentrenamiento Continuo

El reconocimiento de voz mejorado para aulas usando técnicas de entrenamiento avanzadas mejora el aprendizaje.

2025-08-05T19:06:15+00:00 ― 8 minilectura

Aprendizaje automático Avances en el Reconocimiento Automático de Voz con Modelos de Lenguaje de Desruido

Los modelos de lenguaje de eliminación de ruido mejoran la corrección de errores en los sistemas de reconocimiento de voz usando datos sintéticos.

2025-08-03T22:34:10+00:00 ― 9 minilectura

Sonido Avances en Técnicas de Relleno de Habla

Descubre cómo la pintura de voz está restaurando la calidad del audio en varios campos.

2025-08-02T18:13:45+00:00 ― 8 minilectura

Procesado de Audio y Voz Presentando el Modelo 4D en el Reconocimiento de Voz

Un nuevo modelo mejora el reconocimiento de voz usando múltiples métodos de decodificación.

2025-08-01T01:44:35+00:00 ― 8 minilectura

Computación y lenguaje Mejorando el reconocimiento de voz en árabe a través de la destilación de conocimiento

Un estudio sobre cómo mejorar el reconocimiento de voz automática (ASR) para dialectos árabes usando técnicas de modelos eficientes.

2025-07-31T23:18:50+00:00 ― 6 minilectura

Computación y lenguaje Avances en Aprendizaje Auto-Supervisado para el Habla

Explorando el papel del aprendizaje auto-supervisado en el procesamiento del habla y sus desafíos.

2025-07-30T15:51:24+00:00 ― 10 minilectura

Procesado de Audio y Voz Avances en la tecnología de diarización de habla objetivo

Una mirada a nuevos métodos para entender el habla entrecortada durante las conversaciones.

2025-07-30T14:06:55+00:00 ― 9 minilectura

Sonido Mejorando ataques de puerta trasera en el reconocimiento de voz

Nuevo método apunta a cambios de ritmo para ataques de habla sigilosos.

2025-07-29T08:09:20+00:00 ― 7 minilectura

Procesado de Audio y Voz AV-CrossNet: Mejorando el Reconocimiento de Voz en Ruido

Un nuevo sistema ayuda a separar el habla del ruido para una comunicación más clara.

2025-07-29T03:17:50+00:00 ― 7 minilectura

Sonido Diarización de hablantes en tiempo real: una visión general

Infórmate sobre la diarización de hablantes en línea y su importancia en varias aplicaciones.

2025-07-28T06:14:40+00:00 ― 8 minilectura

Sonido Evaluando Tokens de Audio Discretos para Tareas de Habla

Nueva herramienta de referencia evalúa tokens de audio discretos para varias tareas de procesamiento de voz.

2025-07-28T04:37:30+00:00 ― 10 minilectura

Computación y lenguaje Mejorando la corrección de errores de habla en sistemas de ASR

Un nuevo método combina características acústicas y puntuaciones de confianza para mejorar la corrección de errores.

2025-07-25T20:45:15+00:00 ― 6 minilectura

Computación y lenguaje Cómo los modelos de reconocimiento de voz manejan los cambios de sonido

Un estudio sobre cómo las máquinas se adaptan a los cambios fonológicos en el habla.

2025-07-25T20:31:00+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando la detección de hablantes con datos de audio y visuales

Un sistema combina audio y video para mejorar la precisión en la detección de hablantes.

2025-07-25T10:13:40+00:00 ― 6 minilectura

Computación y lenguaje Avances en Sistemas de Diálogo Hablado

Un nuevo método mejora el diálogo de las máquinas mediante datos pseudo-estéreo.

2025-07-25T08:36:30+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz Chino a Través de la Regularización de Pinyin

Este estudio presenta un conjunto de datos y un método para mejorar la precisión del reconocimiento de voz en chino usando Pinyin.

2025-07-25T07:47:55+00:00 ― 8 minilectura

Sonido Desglosando las técnicas para detectar audio deepfake

Este estudio se centra en mejorar la detección de audio deepfake usando métodos avanzados.

2025-07-25T02:56:25+00:00 ― 5 minilectura

Sonido La importancia de medir la incertidumbre en el reconocimiento de emociones en el habla

Entender la incertidumbre mejora la precisión del reconocimiento emocional en situaciones del mundo real.

2025-07-24T17:13:25+00:00 ― 7 minilectura

Procesado de Audio y Voz Nuevo Enfoque para la Diarización de Hablantes

Un sistema para el reconocimiento de hablantes en audio multilingüe sin necesidad de muchos datos.

2025-07-24T01:01:45+00:00 ― 6 minilectura

Computación y lenguaje Avances en la anonimización de hablantes multilingües

Mejorando la tecnología de anonimización de hablantes para nueve idiomas para asegurar la privacidad.

2025-07-23T03:58:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el Reconocimiento de Voz Audiovisual

La investigación destaca el papel del video en mejorar el reconocimiento del habla en entornos ruidosos.

2025-07-22T20:41:20+00:00 ― 6 minilectura

Sonido Avances en el reconocimiento de voz de múltiples hablantes

Un nuevo método mejora la precisión al reconocer el habla de múltiples hablantes.

2025-07-22T10:58:20+00:00 ― 6 minilectura

Neurociencia Entendiendo Cómo Nuestros Cerebros Procesan el Sonido

Explora cómo la corteza auditiva integra el sonido a lo largo del tiempo.

2025-07-22T08:05:26+00:00 ― 7 minilectura

Sonido Avances en la tecnología de mejora de voz

Un nuevo método mejora la claridad del habla en entornos ruidosos usando redes neuronales duales.

2025-07-22T06:55:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el reconocimiento automático de voz en streaming

El modelo XLSR-Transducer se destaca en la transcripción en tiempo real con datos mínimos.

2025-07-21T18:46:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Seed-ASR: Avanzando la tecnología de reconocimiento de voz

Un nuevo modelo mejora la precisión en las capacidades de conversión de voz a texto en varios idiomas.

2025-07-21T14:43:45+00:00 ― 6 minilectura

Sonido Vulnerabilidad en los sistemas de reconocimiento de voz expuesta

La investigación revela riesgos en modelos de habla multitarea como Whisper.

2025-07-21T09:52:15+00:00 ― 5 minilectura

Computación y lenguaje TokenVerse: Simplificando el Análisis de Conversaciones

TokenVerse simplifica el análisis de conversaciones habladas al integrar múltiples tareas en un solo modelo.

2025-07-21T08:15:05+00:00 ― 7 minilectura

Sonido Avanzando en la detección de palabras clave con pocos ejemplos usando Mix-Training

Este estudio examina el Mix-Training para detectar palabras clave en condiciones de habla ruidosa.

2025-07-19T16:39:18+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando el reconocimiento de voz para lenguas de poco recurso

Mejorando los sistemas de reconocimiento de voz para idiomas con pocos datos en línea.

2025-07-19T04:25:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Espectrogramas y Redes Neuronales en el Reconocimiento de Voz

Este estudio analiza cómo las redes neuronales interpretan el habla usando espectrogramas.

2025-07-18T22:45:40+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz con Pistas Contextuales

Aprende cómo el contexto mejora la precisión del reconocimiento automático de voz y el reconocimiento de palabras.

2025-07-16T14:53:25+00:00 ― 6 minilectura

Computación y lenguaje Analizando la armonía vocálica en asamés con fiwGAN

Este estudio utiliza fiwGAN para explorar los patrones de armonía vocálica en el idioma asamés.

2025-07-16T07:17:06+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el ASR de cambio de código con destilación de conocimiento

Un nuevo marco mejora el rendimiento de ASR usando datos y recursos limitados.

2025-07-15T22:41:45+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Formato de Números en Transcripciones de ASR

Este artículo habla sobre cómo mejorar el formato de expresión numérica en transcripciones automáticas.

2025-07-14T15:55:35+00:00 ― 6 minilectura

Computación y lenguaje Nuevos Métodos en el Procesamiento del Lenguaje Hablado

Los investigadores exploran enfoques sin texto para entender mejor el lenguaje hablado.

2025-07-13T18:11:30+00:00 ― 8 minilectura