Zechen Bai

Une nouvelle méthode améliore la détection d'objets dans les vidéos sans données étiquetées.

2025-09-25T10:20:36+00:00 ― 7 min lire

Une nouvelle méthode pour créer des animations faciales de manière efficace pour des personnages personnalisés en utilisant l'apprentissage profond.

2025-09-05T11:20:24+00:00 ― 7 min lire

Un aperçu concis des hallucinations dans les MLLM et des stratégies pour améliorer la fiabilité.

2025-08-15T14:44:36+00:00 ― 8 min lire

De nouvelles méthodes améliorent les modèles multimodaux en ajoutant des tâches de questionnement et d'évaluation.

2025-08-08T12:22:00+00:00 ― 10 min lire

Cette méthode ajuste les slots de représentation des objets en fonction de la complexité de l'image.

2025-07-29T07:59:36+00:00 ― 7 min lire

VideoLISA utilise le langage pour segmenter et suivre les objets dans les vidéos de manière efficace.

2025-06-03T09:15:24+00:00 ― 8 min lire

La quantification factorisée améliore la génération d'images grâce à une gestion efficace des tokens.

2025-05-09T02:57:20+00:00 ― 6 min lire