Bhiksha Raj

Un nuevo estándar evalúa el rendimiento de los sistemas de reconocimiento de voz en medio de diversas interferencias.

2025-08-19T14:16:50+00:00 ― 6 minilectura

Investigando cómo pequeños errores en los datos de entrenamiento mejoran el contenido generado por IA.

2025-08-04T09:29:06+00:00 ― 6 minilectura

Nuevo marco evalúa el rendimiento de SLAM en condiciones desafiantes.

2025-07-25T00:06:30+00:00 ― 8 minilectura

Nuevos métodos mejoran los modelos de habla para idiomas con datos limitados.

2025-07-24T19:39:10+00:00 ― 6 minilectura

Nuevos métodos mejoran la comprensión de las emociones humanas en el habla por parte de las máquinas.

2025-07-12T18:34:55+00:00 ― 5 minilectura

Este estudio evalúa las habilidades de razonamiento de modelos de audio-lenguaje con una nueva tarea.

2025-07-10T09:54:05+00:00 ― 9 minilectura

Este estudio examina cómo diferentes métodos de resumen afectan la calidad y el contenido.

2025-07-02T05:56:55+00:00 ― 6 minilectura

Un nuevo marco mejora la precisión en la confirmación de la identidad vocal.

2025-06-15T01:50:18+00:00 ― 7 minilectura

Nuevas características acústicas mejoran el rendimiento de los sistemas ASR en entornos ruidosos.

2025-06-03T14:29:40+00:00 ― 5 minilectura

ESPnet-Codec mejora el entrenamiento y la evaluación de códecs neuronales para audio y voz.

2025-06-03T03:09:30+00:00 ― 8 minilectura

MACE mejora la subtitulación de audio al conectar sonidos con descripciones de texto precisas.

2025-05-28T17:47:08+00:00 ― 6 minilectura

Explora cómo POGAT mejora el análisis de estructuras de grafo complejas.

2025-05-04T12:20:00+00:00 ― 7 minilectura

Descubre cómo SoftVQ-VAE mejora la creación de imágenes con eficiencia y calidad.

2025-03-08T21:22:03+00:00 ― 7 minilectura