Évaluation de gros modèles sur des tâches visuelles de bas niveau à travers Q-Bench.
― 7 min lire
La science de pointe expliquée simplement
Évaluation de gros modèles sur des tâches visuelles de bas niveau à travers Q-Bench.
― 7 min lire
Un nouveau benchmark évalue les modèles de langage multi-modalité dans des tâches de vision de bas niveau.
― 8 min lire