Haibin Wu

AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.

2025-09-08T22:32:35+00:00 ― 6 minilectura

El proyecto EMO-SUPERB mejora el reconocimiento de emociones en el habla a través de técnicas mejoradas y la colaboración de la comunidad.

2025-08-23T00:52:20+00:00 ― 8 minilectura

Un nuevo sistema para evaluar el rendimiento de los códecs de audio en diferentes aplicaciones.

2025-08-22T23:15:10+00:00 ― 8 minilectura

Un nuevo marco para evaluar modelos base en tareas de habla.

2025-08-11T09:31:05+00:00 ― 9 minilectura

Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.

2025-07-12T06:26:10+00:00 ― 7 minilectura

Este artículo habla sobre métodos de entrenamiento eficientes para modelos de voz usando aprendizaje auto-supervisado.

2025-06-16T15:02:50+00:00 ― 5 minilectura

El modelo MCMamba mejora la calidad del habla en entornos ruidosos usando información espacial y espectral.

2025-06-09T21:54:45+00:00 ― 5 minilectura

Este estudio evalúa métodos de baja latencia para mejorar la calidad del habla en condiciones ruidosas.

2025-06-09T20:17:35+00:00 ― 8 minilectura

Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.

2025-06-05T06:58:50+00:00 ― 6 minilectura

ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.

2025-06-03T03:09:30+00:00 ― 8 minilectura

Un nuevo método mejora la eficiencia en las cargas de trabajo de atención para sistemas de IA.

2025-06-01T21:34:30+00:00 ― 8 minilectura

VERSA evalúa la calidad de voz, audio y música de manera efectiva.

2025-01-28T09:33:18+00:00 ― 10 minilectura