Últimos artículos para Tecnología de voz

Sonido Avances en Sistemas de Contramedidas de Voz

Los investigadores mejoran la detección del habla generada por máquinas usando ajustes en la información de fase.

2025-10-26T17:55:10+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz no supervisado

Un nuevo marco mejora el estudio de los sistemas de reconocimiento de voz no supervisados.

2025-10-25T13:34:45+00:00 ― 8 minilectura

Sonido LinDiff: Un Salto Adelante en la Síntesis de Voz

El nuevo modelo LinDiff mejora la velocidad y calidad de la síntesis de voz.

2025-10-25T00:37:25+00:00 ― 5 minilectura

Sonido Avances innovadores en tecnología de habla electrolaringea

Investigadores combinan características visuales y sonoras para mejorar el habla de los usuarios de electrolaringe.

2025-10-24T12:28:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el reconocimiento de voz con modelos de lenguaje grandes

Esta investigación resalta cómo los LLMs mejoran la comprensión del habla en videos largos.

2025-10-23T22:42:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Gestión eficiente de grandes modelos de voz

Un nuevo método optimiza los modelos de voz para un mejor rendimiento con menos recursos.

2025-10-23T21:54:10+00:00 ― 6 minilectura

Aprendizaje automático EM-Network: Un Nuevo Enfoque en el Aprendizaje de Secuencias

EM-Network mejora el aprendizaje de secuencias en tareas de procesamiento de habla y lenguaje.

2025-10-23T07:19:40+00:00 ― 6 minilectura

Sonido Evaluando la Calidad del Habla con Modelos de Aprendizaje Automático

Este estudio evalúa varios modelos para predecir la calidad del habla sintetizada.

2025-10-21T16:27:40+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando el Reconocimiento de Voz a través de Ensambles Basados en Confianza

Este artículo habla sobre cómo mejorar el reconocimiento de voz usando métodos de conjunto basados en confianza.

2025-10-16T18:14:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Avanzando en Texto a Voz: Explicación del Modelo GenerTTS

GenerTTS mejora la tecnología de texto a voz para aplicaciones multilingües.

2025-10-16T15:48:45+00:00 ― 6 minilectura

Sonido Avanzando la tecnología de aislamiento de voz

Un nuevo modelo mejora la extracción de voz de fondos ruidosos usando aprendizaje profundo.

2025-10-16T02:02:50+00:00 ― 5 minilectura

Sonido Avances en la síntesis de voz articulatoria

Un estudio sobre cómo mejorar la reproducción del sonido vocal con técnicas de síntesis avanzadas.

2025-10-11T02:12:30+00:00 ― 7 minilectura

Procesado de Audio y Voz Avances en técnicas de anonimización de hablantes

Nuevos métodos buscan ocultar las identidades de los hablantes mientras mantienen la claridad del habla.

2025-10-08T01:20:00+00:00 ― 6 minilectura

Sonido Avances en el Mejora del Habla Usando Redes Neuronales de Picos

Un nuevo método para mejorar la calidad del habla usando redes eficientes en energía.

2025-10-03T21:44:15+00:00 ― 6 minilectura

Inteligencia artificial Midiendo emociones en el habla: un nuevo enfoque

Los investigadores analizan cómo se comparten las emociones a través del habla usando datos diversos.

2025-10-03T09:07:42+00:00 ― 7 minilectura

Computación y lenguaje Avances en tecnología de texto a voz

Nuevos métodos mejoran la calidad del habla sintética usando aprendizaje auto-supervisado.

2025-09-30T17:37:25+00:00 ― 6 minilectura

Sonido Avanzando el Reconocimiento de Voz con Aprendizaje Federado

El Aprendizaje Federado mejora el reconocimiento de voz mientras mantiene los datos del usuario privados.

2025-09-30T08:43:00+00:00 ― 6 minilectura

Computación y lenguaje EmoDistill: Avanzando el reconocimiento de emociones en el habla

Un nuevo método mejora la detección de emociones en el habla usando solo audio.

2025-09-28T23:55:36+00:00 ― 6 minilectura

Aprendizaje automático O-1: Una Nueva Frontera en el Entrenamiento de Reconocimiento de Voz

O-1 mejora el reconocimiento de voz al optimizar métodos de autoentrenamiento.

2025-09-26T09:10:10+00:00 ― 6 minilectura

Sonido Nuevo estudio sobre la detección de voz generada por IA

La investigación destaca métodos de detección en tiempo real para audio falso creado por IA.

2025-09-21T19:02:50+00:00 ― 6 minilectura

Sonido Mejorando la Síntesis de Voz con Técnicas de Poda

Nuevos métodos de poda mejoran el rendimiento del modelo de texto a voz de múltiples hablantes sin entrenamiento previo.

2025-09-20T15:31:00+00:00 ― 9 minilectura

Procesado de Audio y Voz Avances en Aprendizaje Auto-Supervisado para el Reconocimiento de Voz

Nuevos métodos para seleccionar datos de voz minimizan el etiquetado mientras mejoran la precisión del reconocimiento.

2025-09-20T13:53:50+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la Evaluación de la Calidad del Habla con Puntuaciones de Preferencia

Un nuevo método mejora la clasificación de calidad del habla utilizando puntuaciones de preferencia de los oyentes.

2025-09-20T07:25:10+00:00 ― 6 minilectura

Sonido Mejorando el Reconocimiento de Voz para Personas con Tartamudez

Un método para mejorar los sistemas de ASR para usuarios que tartamudean.

2025-09-20T06:36:35+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en el seguimiento de formantes para el procesamiento del habla

Nuevos métodos de un solo paso mejoran la precisión en el seguimiento de formantes para los sonidos del habla.

2025-09-19T02:16:10+00:00 ― 5 minilectura

Computación y lenguaje Conectando el habla con modelos de lenguaje: El método BLSP

Un nuevo enfoque mejora la integración del habla con los modelos de lenguaje.

2025-09-18T15:44:35+00:00 ― 8 minilectura

Computación y lenguaje El papel de los modelos de lenguaje preentrenados en TTS

Examinando cómo los modelos de lenguaje preentrenados mejoran la calidad del texto a voz.

2025-09-17T20:18:35+00:00 ― 7 minilectura

Procesado de Audio y Voz MuLanTTS: Una Nueva Frontera en Texto a Voz

El MuLanTTS de Microsoft ofrece capacidades de texto a voz en francés que suenan naturales y expresivas.

2025-09-15T22:57:55+00:00 ― 5 minilectura

Computación y lenguaje Avances en Aprendizaje Auto-Supervisado para Tecnologías de Voz en Francés

Un proyecto tiene como objetivo mejorar el procesamiento del habla en francés usando aprendizaje auto-supervisado.

2025-09-14T12:57:25+00:00 ― 6 minilectura

Procesado de Audio y Voz Avances en la anotación automática de prosodia

Nuevos métodos mejoran cómo las máquinas reconocen el ritmo y la emoción del habla.

2025-09-14T12:08:50+00:00 ― 8 minilectura

Procesado de Audio y Voz Avances en el reconocimiento de voz para niños

Este estudio mejora la capacidad de los sistemas de reconocimiento de voz para entender el habla de los niños.

2025-09-14T02:25:50+00:00 ― 7 minilectura

Procesado de Audio y Voz VoxtLM: Un enfoque unificado para voz y texto

VoxtLM combina reconocimiento de voz, síntesis, generación de texto y continuación en un solo modelo.

2025-09-13T11:02:45+00:00 ― 5 minilectura

Procesado de Audio y Voz Libriheavy: Un Nuevo Conjunto de Datos para el Reconocimiento de Voz

Libriheavy ofrece 50,000 horas de inglés hablado para mejorar la tecnología de reconocimiento de voz.

2025-09-12T18:51:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando la claridad del habla con la tecnología AV2Wav

AV2Wav mejora la calidad del habla usando pistas de audio y visuales.

2025-09-12T17:13:55+00:00 ― 6 minilectura

Sonido Optimizando el Texto a Voz con Selección de Conjuntos Básicos

La selección de core-set mejora los modelos de texto a voz al centrarse en datos diversos.

2025-09-12T08:19:30+00:00 ― 6 minilectura

Procesado de Audio y Voz Emo-StarGAN: Avanzando la Tecnología de Conversión de Voz

Nuevo método preserva el tono emocional en la conversión de voz para mejorar la interacción humano-computadora.

2025-09-11T23:25:05+00:00 ― 7 minilectura

Sonido Los desafíos emocionales en el discurso ponen a prueba los modelos de separación de sonidos

La investigación revela que el habla emocional afecta el rendimiento del modelo en tareas de separación de voz.

2025-09-11T18:33:35+00:00 ― 8 minilectura

Procesado de Audio y Voz Mejorando la inversión de voz a través del aprendizaje auto-supervisado

La investigación combina aprendizaje auto-supervisado y nuevas técnicas de medición para mejorar la inversión del habla.

2025-09-10T01:15:50+00:00 ― 7 minilectura

Sonido Mejorando la claridad en el habla electrolaríngea

Los investigadores desarrollan un nuevo marco para mejorar la claridad del habla para los usuarios de electrolaringe.

2025-09-09T22:50:05+00:00 ― 6 minilectura

Procesado de Audio y Voz Mejorando los sistemas ASR con datos sintéticos

Un nuevo método utiliza datos sintéticos para mejorar los sistemas de ASR en áreas desconocidas.

2025-09-09T15:32:50+00:00 ― 7 minilectura