Últimos artículos para Reconocimiento de voz

Sonido Avances en Restauración de Voz: MaskSR2

MaskSR2 mejora la claridad y calidad del habla usando técnicas innovadoras.

2025-06-11T07:06:40+00:00 ― 6 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Detección de Disfluencias

Un nuevo método mejora los sistemas de reconocimiento de voz al detectar interrupciones en el habla.

2025-06-11T05:08:42+00:00 ― 8 minilectura

Computación Neuronal y Evolutiva Avances en redes neuronales de picos con circuitos analógicos

Un nuevo sistema utiliza redes neuronales de picos para un procesamiento de datos eficiente.

2025-06-10T22:33:42+00:00 ― 7 minilectura

Computación y lenguaje Avances en Sistemas de Traducción de Voz Multilingüe

Nuevos métodos mejoran la precisión y eficiencia de la traducción para varios idiomas.

2025-06-10T16:14:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Desafíos y avances en la detección de palabras clave para el urdu

Una visión general de las tecnologías de detección de palabras clave y sus desafíos con el idioma urdu.

2025-06-10T10:52:05+00:00 ― 7 minilectura

Procesado de Audio y Voz Elecciones de diseño que impactan el rendimiento del modelo de voz

Un estudio sobre cómo las elecciones de diseño afectan los modelos de lenguaje de base.

2025-06-10T06:00:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz para acentos

Este artículo habla sobre métodos para mejorar el reconocimiento de voz en el habla con acento.

2025-06-08T12:42:50+00:00 ― 7 minilectura

Computación y lenguaje Mejorando los Modelos de Lenguaje de Audio para Tailandés e Inglés

Este estudio aborda los desafíos en modelos de lenguaje de audio para lenguas de pocos recursos.

2025-06-08T08:39:55+00:00 ― 7 minilectura

Procesado de Audio y Voz Mejorando los sistemas de TTS para lenguas indias

Mejorando la síntesis de voz en lenguas indias usando unidades inter-pauss.

2025-06-08T02:59:50+00:00 ― 8 minilectura

Sonido Avanzando el Reconocimiento Automático de Voz con CADA-GAN

CADA-GAN mejora el rendimiento de los sistemas de ASR en diferentes entornos de grabación.

2025-06-07T23:45:30+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Avances en el reconocimiento de voz audio-visual

Llama-AVSR combina entradas de audio y visuales para mejorar la precisión del reconocimiento de voz.

2025-06-07T18:05:25+00:00 ― 7 minilectura

Sonido Avances en los sistemas de retroalimentación para el aprendizaje de idiomas

Un nuevo método usa sombras virtuales para mejorar el feedback de pronunciación de los que aprenden idiomas.

2025-06-07T05:56:40+00:00 ― 7 minilectura

Aprendizaje automático Avances en el Reconocimiento de Voz para Niños

Un nuevo método de ASR ayuda a la tecnología a entender mejor el habla de los niños.

2025-06-06T20:13:40+00:00 ― 7 minilectura

Visión por Computador y Reconocimiento de Patrones Nuevo sistema combina sonido y visión para el reconocimiento de objetos

YOSS usa audio para mejorar la identificación de objetos en imágenes.

2025-06-05T10:22:06+00:00 ― 5 minilectura

Procesado de Audio y Voz Construyendo Mejores Conjuntos de Datos de Habla para Idiomas Desatendidos

Un proyecto que desarrolla conjuntos de datos de voz y texto para idiomas con recursos limitados.

2025-06-04T06:41:20+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la verificación de hablantes con CA-MHFA

Un nuevo marco mejora el reconocimiento de voz y se adapta a varias tareas de habla.

2025-06-04T05:52:45+00:00 ― 5 minilectura

Computación y lenguaje Avances en técnicas de procesamiento de habla sin texto

Nuevos métodos mejoran el reconocimiento de voz para lenguas de pocos recursos sin texto.

2025-06-03T18:32:35+00:00 ― 5 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz a Través de Técnicas Fonéticas

Nuevos métodos mejoran la precisión en los sistemas de reconocimiento de voz usando comprensión fonética.

2025-06-03T16:55:25+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Voz con Características Inspiradas en Humanos

Nuevas características acústicas mejoran el rendimiento de los sistemas ASR en entornos ruidosos.

2025-06-03T14:29:40+00:00 ― 5 minilectura

Procesado de Audio y Voz Whisper-Medusa: Mejorando la Eficiencia del Reconocimiento de Voz

Nuevo modelo consigue una transcripción de voz más rápida sin sacrificar la precisión.

2025-06-03T00:43:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Embeddings de altavoces Matryoshka: Un enfoque flexible para el reconocimiento de voz

Descubre cómo los embeddings Matryoshka mejoran la eficiencia y flexibilidad del reconocimiento de hablantes.

2025-06-02T20:40:50+00:00 ― 6 minilectura

Sonido Avances en la adaptación de texto a voz

El nuevo modelo VoiceGuider mejora el TTS para diferentes hablantes.

2025-06-02T19:03:40+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en la tecnología de reconocimiento de voz

Un nuevo método mejora el reconocimiento de voz para grabaciones largas.

2025-05-30T21:54:17+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en Modelos de Lenguaje de Habla Sin Necesidad de Muchos Datos de Entrenamiento

Nuevo método para modelos de lenguaje de voz reduce la necesidad de grandes cantidades de datos.

2025-05-29T17:50:26+00:00 ― 7 minilectura

Procesado de Audio y Voz La Evolución de la Diarización de Altavoces

Cómo los nuevos métodos están transformando la identificación de hablantes en grabaciones de audio.

2025-05-25T18:57:25+00:00 ― 7 minilectura

Sonido Extracción de hablantes objetivo: Mejorando la claridad en entornos ruidosos

Descubre cómo TSE mejora el reconocimiento de voz en entornos ruidosos usando señales de texto.

2025-05-25T00:14:51+00:00 ― 6 minilectura

Procesado de Audio y Voz Usando Asistentes de Voz para Detectar Deterioro Cognitivo Leve

Los asistentes de voz ayudan a identificar los primeros signos de problemas de memoria en personas mayores.

2025-05-24T01:31:44+00:00 ― 8 minilectura

Sonido Mamba: Avanzando la Tecnología de Reconocimiento de Voz

Mamba mejora el reconocimiento de voz con rapidez y precisión, transformando cómo interactuamos con los dispositivos.

2025-05-19T22:39:54+00:00 ― 5 minilectura

Sonido Usando pistas visuales para aclarar el habla en ruido

Nuevo método mejora la claridad del habla usando información visual del entorno.

2025-05-18T20:42:14+00:00 ― 6 minilectura

Sonido SAMOS: Mejorando la Evaluación de la Calidad del Habla

SAMOS ofrece una nueva forma de medir la calidad del habla, mejorando la naturalidad.

2025-05-11T19:57:24+00:00 ― 7 minilectura

Sonido Tiny-Align: Un Nuevo Enfoque para Asistentes de Voz

Tiny-Align mejora los asistentes de voz para una mejor interacción personal en dispositivos pequeños.

2025-05-07T01:43:40+00:00 ― 7 minilectura

Aprendizaje automático VQalAttent: Un Nuevo Enfoque para la Generación de Habla

Presentamos VQalAttent, un modelo más sencillo para generar un habla máquina realista.

2025-05-05T05:35:38+00:00 ― 6 minilectura

Procesado de Audio y Voz United-MedASR: Mejorando el Reconocimiento de Voz Médica

Un nuevo sistema de ASR mejora el reconocimiento de voz médica para una atención al paciente precisa.

2025-04-30T00:58:50+00:00 ― 7 minilectura

Sonido Detectando Deepfakes: El Papel de los Modelos ASR

Explorando cómo los modelos de ASR ayudan a identificar deepfakes de voz de manera efectiva.

2025-04-24T01:54:40+00:00 ― 8 minilectura

Computación y lenguaje Un nuevo método para el reconocimiento de voz atribuido al hablante

Realiza un seguimiento eficiente de los hablantes en entornos multilingües usando reconocimiento automático de voz.

2025-04-20T15:33:18+00:00 ― 7 minilectura

Procesado de Audio y Voz Avanzando el Reconocimiento de Voz para la Disfluencia

Mejorando la transcripción automática para entender mejor los trastornos del habla.

2025-04-17T08:35:42+00:00 ― 7 minilectura

Computación y lenguaje Mejorando el Reconocimiento de Voz con Pinyin

Un nuevo modelo mejora significativamente la precisión del reconocimiento de voz en chino.

2025-04-15T08:10:03+00:00 ― 7 minilectura

Sonido Presentamos a Noro: Un Sistema de Conversión de Voz Confiable

Noro mejora la conversión de voz, haciéndola efectiva incluso en ambientes ruidosos.

2025-04-15T07:14:42+00:00 ― 7 minilectura

Computación y lenguaje GLM-4-Voice: El Siguiente Paso en Chatbots

Un nuevo chatbot que ofrece conversaciones como las de humanos con conciencia emocional.

2025-04-02T18:12:36+00:00 ― 3 minilectura

Computación y lenguaje Transformando el Reconocimiento de Voz: Nuevos Métodos de Evaluación

Descubre cómo la evaluación independiente del estilo mejora los sistemas de Reconocimiento Automático de Voz.

2025-03-26T13:05:15+00:00 ― 8 minilectura