Ranjay Krishna

Une méthode innovante simplifie l'entraînement des modèles pour la classification d'images complexes.

2025-09-01T23:12:18+00:00 ― 8 min lire

Un nouveau benchmark évalue comment les machines planifient des tâches complexes avec différents types de données.

2025-08-28T12:09:36+00:00 ― 8 min lire

Une nouvelle méthode d'entraînement améliore la capacité de composition des modèles vision-langage.

2025-08-23T08:47:18+00:00 ― 7 min lire

EVE simplifie la formation des robots grâce à la réalité augmentée pour les utilisateurs du quotidien.

2025-08-20T22:19:42+00:00 ― 10 min lire

Un nouveau benchmark révèle des lacunes dans la compréhension visuelle des grands modèles de langage.

2025-08-18T12:23:42+00:00 ― 9 min lire

Une nouvelle méthode améliore les descriptions d'images pour entraîner des modèles d'IA.

2025-08-13T22:58:48+00:00 ― 6 min lire

Inclure des données non anglophones améliore la performance des modèles vision-langage et la compréhension culturelle.

2025-08-06T05:35:36+00:00 ― 7 min lire

Un nouveau cadre améliore le raisonnement dans les modèles de langage grâce à des croquis visuels.

2025-07-29T11:40:48+00:00 ― 4 min lire

Une nouvelle méthode améliore la façon dont les modèles d'IA interprètent les relations spatiales et temporelles.

2025-07-03T21:51:00+00:00 ― 7 min lire

Découvre comment RONAR aide les robots à expliquer leurs actions en termes simples.

2025-05-18T22:08:00+00:00 ― 8 min lire

OneDiffusion transforme le texte en images, boostant la créativité pour tout le monde.

2025-05-08T10:04:00+00:00 ― 6 min lire

Les jetons de perception améliorent la capacité de l'IA à comprendre et interpréter des images.

2025-04-17T02:42:00+00:00 ― 8 min lire

Découvrez comment la fusion de tokens négatifs transforme la génération d'images par IA.

2025-03-31T19:53:26+00:00 ― 7 min lire

Une nouvelle approche améliore le raisonnement spatial des machines pour des applications réelles.

2025-03-25T21:50:24+00:00 ― 9 min lire

Une nouvelle méthode pour évaluer la génération d'images et de vidéos par l'IA en utilisant des graphes de scènes.

2025-03-19T12:33:45+00:00 ― 8 min lire