MARBLE établit une norme pour évaluer les modèles d'IA musicale sur plusieurs tâches.
― 9 min lire
La science de pointe expliquée simplement
MARBLE établit une norme pour évaluer les modèles d'IA musicale sur plusieurs tâches.
― 9 min lire
GIEBench évalue les réponses empathiques des LLM en se basant sur des identités de groupe diverses.
― 9 min lire