Examiner des modèles de base qui combinent vision et langage pour des applications variées.
― 7 min lire
La science de pointe expliquée simplement
Examiner des modèles de base qui combinent vision et langage pour des applications variées.
― 7 min lire
De nouvelles techniques améliorent la fiabilité des outils d'imagerie médicale face aux altérations de données nuisibles.
― 6 min lire
De nouvelles méthodes améliorent la compréhension des différents types de données.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance d'actions avec peu d'exemples sur différents types de données.
― 8 min lire
Combiner les données RGB et profondeur améliore la reconnaissance d'actions dans les systèmes robotiques.
― 8 min lire
FSViewFusion génère des vues 3D réalistes à partir d'images limitées de manière efficace.
― 7 min lire
Un nouveau cadre améliore les recherches vidéo en combinant des visuels et des descriptions détaillées en langage.
― 8 min lire
Un nouveau cadre améliore l'explicabilité dans les systèmes d'apprentissage profond.
― 8 min lire
Une nouvelle approche pour détecter le cancer du poumon tôt grâce à l'analyse d'images automatisée.
― 8 min lire
X-Former améliore comment les modèles combinent la compréhension des images et des textes.
― 11 min lire
FinePseudo améliore la reconnaissance d'actions fine avec moins d'exemples étiquetés.
― 9 min lire
Une nouvelle méthode améliore l'alignement des vidéos dans de grands ensembles de données.
― 11 min lire
Une nouvelle méthode aide les robots à accomplir des tâches plus efficacement en décomposant les objectifs.
― 6 min lire
Un nouveau cadre améliore l'identification en générant des images de vêtements variés.
― 8 min lire