Hongxu Yin

Une nouvelle méthode s'attaque aux problèmes de surexposition dans l'enregistrement vidéo quotidien en utilisant l'apprentissage profond.

2025-10-03T02:32:42+00:00 ― 8 min lire

Une nouvelle approche pour ajuster les modèles améliore l'efficacité et la précision dans les tâches d'apprentissage automatique.

2025-09-08T00:10:12+00:00 ― 8 min lire

Un aperçu détaillé des capacités de RegionGPT à analyser les régions d'images.

2025-09-01T19:23:12+00:00 ― 10 min lire

SpatialRGPT améliore la compréhension de l'agencement des objets dans les Modèles de Langage Visuel.

2025-08-03T05:10:36+00:00 ― 9 min lire

De nouveaux modèles adaptables peuvent répondre à des besoins variés sans avoir besoin de se requalifier.

2025-07-31T06:44:06+00:00 ― 10 min lire

Une nouvelle méthode améliore la qualité des données pour les modèles de langage visuel en utilisant des techniques d'augmentation.

2025-07-07T17:53:06+00:00 ― 9 min lire

VILA-U intègre des tâches vidéo, image et langue dans un seul cadre.

2025-06-16T03:07:06+00:00 ― 8 min lire

Une nouvelle méthode améliore la performance des LLM tout en réduisant la complexité.

2025-06-06T07:41:54+00:00 ― 8 min lire

NaVILA aide les robots à naviguer en utilisant le langage et la vision.

2025-04-12T05:32:06+00:00 ― 7 min lire