Un nouveau benchmark révèle des lacunes dans la compréhension visuelle des grands modèles de langage.
― 9 min lire
La science de pointe expliquée simplement
Un nouveau benchmark révèle des lacunes dans la compréhension visuelle des grands modèles de langage.
― 9 min lire
Inclure des données non anglophones améliore la performance des modèles vision-langage et la compréhension culturelle.
― 7 min lire
Une nouvelle méthode améliore la façon dont les modèles d'IA interprètent les relations spatiales et temporelles.
― 7 min lire
Des chercheurs transforment des vidéos ordinaires en scènes 3D immersives grâce à la technologie IA.
― 9 min lire