Ming Yan

Une nouvelle approche améliore l'efficacité des tâches de pré-entraînement Vision-Langue.

2025-10-11T17:07:48+00:00 ― 7 min lire

Une nouvelle méthode améliore la détection de stance pour les petits modèles de langue en utilisant des connaissances externes.

2025-10-02T00:28:30+00:00 ― 6 min lire

Un nouveau modèle améliore la récupération de signaux rares dans des environnements bruyants.

2025-09-27T17:32:57+00:00 ― 9 min lire

TRIPS améliore l'efficacité des tâches vision-langage en sélectionnant les morceaux d'images pertinents.

2025-09-17T20:38:36+00:00 ― 9 min lire

Une nouvelle approche utilisant des systèmes multi-agents pour améliorer les petits modèles de langage.

2025-09-17T04:26:54+00:00 ― 8 min lire

Cet article parle d'un nouveau cadre pour évaluer les hallucinassions dans les LVLMs.

2025-09-04T12:02:06+00:00 ― 9 min lire

Un nouveau critère évalue comment les agents de jeu de rôle interagissent socialement.

2025-08-27T12:43:24+00:00 ― 8 min lire

Un nouveau cadre améliore la façon dont les agents linguistiques apprennent et accomplissent des tâches.

2025-08-27T05:28:54+00:00 ― 8 min lire

Un nouveau cadre améliore l'efficacité et la précision dans la résolution de problèmes physiques complexes.

2025-08-01T22:06:12+00:00 ― 9 min lire

MIBench teste la performance des modèles multimodaux sur plusieurs images.

2025-07-09T14:23:18+00:00 ― 7 min lire

mPLUG-Owl3 améliore la compréhension des images et des vidéos pour des réponses plus efficaces.

2025-06-30T17:13:12+00:00 ― 8 min lire

Une nouvelle méthode pour combiner les modèles de langage de manière plus efficace.

2025-06-29T22:23:30+00:00 ― 8 min lire

MaVEn améliore la capacité de l'IA à traiter plusieurs images pour un meilleur raisonnement.

2025-06-23T15:38:00+00:00 ― 7 min lire