Zequn Jie

LLaVA-MoLE améliore les modèles multimodaux en utilisant un routage d'experts pour de meilleures performances.

2025-09-13T14:51:54+00:00 ― 9 min lire

Lumen améliore l'apprentissage des tâches visuelles grâce à un processus en deux étapes pour une meilleure compréhension de l'IA.

2025-08-29T23:34:42+00:00 ― 9 min lire

MindBench améliore l'évaluation des modèles pour comprendre des cartes mentales complexes.

2025-07-20T01:44:24+00:00 ― 6 min lire

OV-DINO améliore la détection d'objets en reconnaissant des noms pas vus pendant l'entraînement.

2025-07-15T23:15:12+00:00 ― 8 min lire

Une nouvelle approche améliore la segmentation 3D en utilisant des annotations et un langage moins détaillés.

2025-07-14T01:26:00+00:00 ― 7 min lire

Nouveau cadre améliore la compréhension des images, du texte et des objets 3D.

2025-01-24T04:30:00+00:00 ― 8 min lire