Une nouvelle méthode améliore la localisation des objets en utilisant les relations entre le langage et les images.
― 8 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la localisation des objets en utilisant les relations entre le langage et les images.
― 8 min lire
Un nouveau cadre améliore l'accès et l'organisation des ensembles de données visuelles pour de meilleurs algorithmes.
― 9 min lire
Une nouvelle méthode pour améliorer le suivi d'objets en réalité augmentée avec des appareils mobiles.
― 8 min lire
Une nouvelle méthode cible des zones difficiles pour des attaques adversariales efficaces dans la segmentation vidéo.
― 8 min lire
Une nouvelle méthode améliore la classification de précision en utilisant la découverte de parties et l'apprentissage contrastif.
― 7 min lire
De nouvelles méthodes améliorent le suivi d'objets et la séparation des mouvements dans des scènes vidéo difficiles.
― 9 min lire
Examiner l'impact des attaques adversariales sur la technologie de Re-ID.
― 7 min lire
Cette étude se concentre sur l'apprentissage profond pour détecter les connecteurs de faisceau de câbles automobiles.
― 8 min lire
ViWS-Net enlève efficacement différentes conditions météo des vidéos, améliorant la clarté et la qualité.
― 8 min lire
LogicSeg combine l'apprentissage basé sur les données et le raisonnement logique pour mieux comprendre les images.
― 8 min lire
Ce jeu de données aide les robots à mieux comprendre les environnements urbains.
― 8 min lire
Une nouvelle méthode offre plusieurs raisons pour les classifications d'images, améliorant la compréhension et la confiance.
― 6 min lire
SINCERE améliore l'apprentissage contrastif supervisé avec une meilleure séparation des classes et représentation.
― 8 min lire
Évaluation de gros modèles sur des tâches visuelles de bas niveau à travers Q-Bench.
― 7 min lire
AsymFormer améliore la compréhension de l'environnement des robots grâce à un traitement RGB-D efficace.
― 6 min lire
Stratégies pour améliorer l'interprétabilité des systèmes d'IA pour mieux comprendre.
― 7 min lire
Cet article explore le rôle des modèles de langue dans la réponse aux questions à partir de documents.
― 9 min lire
Un nouveau jeu de données destiné à améliorer la reconnaissance d'objets pendant la découpe.
― 8 min lire
Une nouvelle méthode permet aux modèles de reconnaître à la fois des objets connus et inconnus.
― 9 min lire
Une nouvelle méthode génère des étiquettes détaillées pour la segmentation sémantique en utilisant des données synthétiques.
― 14 min lire
De nouvelles méthodes améliorent l'évaluation des performances des petits objets en WSSS.
― 7 min lire
La méthode BoIR améliore le suivi de plusieurs personnes dans les images, augmentant la précision dans les scènes bondées.
― 6 min lire
Une nouvelle méthode améliore l'apprentissage d'objets 3D sans données étiquetées.
― 8 min lire
Une nouvelle méthode améliore le placement des caméras pour générer des images 3D de haute qualité.
― 8 min lire
De nouvelles méthodes améliorent l'efficacité mémoire et la précision dans la segmentation d'objets vidéo.
― 9 min lire
Une nouvelle méthode améliore l'estimation de pose 3D à partir d'images 2D de plusieurs personnes.
― 6 min lire
Une nouvelle approche simplifie l'adaptation pour la détection d'objets dans différents environnements.
― 9 min lire
M 3D améliore la compréhension machine des données visuelles en utilisant des images et des infos de profondeur.
― 6 min lire
Une nouvelle méthode améliore le fine-tuning des vision transformers, réduisant les besoins en calcul.
― 7 min lire
ObVi-SLAM améliore la localisation des robots en combinant des caractéristiques visuelles et la détection d'objets.
― 10 min lire
Une méthode pour transformer des visages en dessins animés tout en gardant leurs caractéristiques uniques.
― 8 min lire
Une nouvelle méthode traduit des descriptions textuelles en séquences vidéo.
― 7 min lire
Une nouvelle approche simplifie la conception de modèles pour les appareils avec une puissance de calcul limitée.
― 7 min lire
Améliorer le Zero-Shot NAS en utilisant la correction de biais pour de meilleures performances du modèle.
― 6 min lire
Mask4D améliore le suivi et la reconnaissance d'objets dans des environnements dynamiques en utilisant des données LiDAR.
― 7 min lire
On te présente une méthode d'apprentissage actif qui mélange incertitude et diversité pour mieux gérer l'efficacité du labellisation.
― 10 min lire
Combiner des points et des lignes améliore la précision dans l'estimation des relations d'image.
― 5 min lire
Présentation de Q-REG, une méthode qui optimise l'enregistrement de nuages de points 3D grâce à un entraînement de bout en bout.
― 8 min lire
De nouvelles méthodes améliorent la performance de VideoQA en utilisant un minimum de données d'entraînement.
― 7 min lire
STRPCA améliore la soustraction de fond pour une meilleure détection d'objets dans les vidéos.
― 7 min lire