AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
AV-SUPERB evalúa modelos de audio y visuales en diferentes tareas para mejorar el rendimiento.
― 6 minilectura
El proyecto EMO-SUPERB mejora el reconocimiento de emociones en el habla a través de técnicas mejoradas y la colaboración de la comunidad.
― 8 minilectura
Un nuevo sistema para evaluar el rendimiento de los códecs de audio en diferentes aplicaciones.
― 8 minilectura
Un nuevo marco para evaluar modelos base en tareas de habla.
― 9 minilectura
Examinando cómo los códecs mantienen los tonos emocionales en los datos de voz.
― 7 minilectura
Este artículo habla sobre métodos de entrenamiento eficientes para modelos de voz usando aprendizaje auto-supervisado.
― 5 minilectura
El modelo MCMamba mejora la calidad del habla en entornos ruidosos usando información espacial y espectral.
― 5 minilectura
Este estudio evalúa métodos de baja latencia para mejorar la calidad del habla en condiciones ruidosas.
― 8 minilectura
Una mirada a los resultados del desafío Codec-SUPERB y las métricas de rendimiento del codec.
― 6 minilectura
ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.
― 8 minilectura
Un nuevo método mejora la eficiencia en las cargas de trabajo de atención para sistemas de IA.
― 8 minilectura
VERSA evalúa la calidad de voz, audio y música de manera efectiva.
― 10 minilectura