Luis Fernando D'Haro

Efforts to improve multilingual metrics for dialogue systems showcased in recent challenge.

2025-10-28T02:01:24+00:00 ― 8 min read

AdvEval exposes weaknesses in Natural Language Generation evaluation metrics.

2025-08-08T07:29:42+00:00 ― 6 min read

Introducing a new model and benchmark for evaluating multi-audio tasks.

2025-05-31T19:17:15+00:00 ― 5 min read