Des chercheurs testent des modèles pour comprendre des séquences d'actions grâce à un nouveau jeu de données vidéo.
― 7 min lire
La science de pointe expliquée simplement
Des chercheurs testent des modèles pour comprendre des séquences d'actions grâce à un nouveau jeu de données vidéo.
― 7 min lire
GCA-HNG améliore l'entraînement des modèles en créant des échantillons négatifs difficiles.
― 9 min lire
Un nouveau cadre améliore la compréhension des machines dans les environnements de conduite.
― 9 min lire
Un nouveau cadre traite le biais d'action dans la compréhension vidéo.
― 6 min lire
MEGL combine des visuels et du texte pour des explications IA plus claires.
― 8 min lire
Un aperçu de comment TinTeM améliore l'apprentissage de l'IA avec des méthodes plus intelligentes.
― 7 min lire
NexusSplats améliore la précision et la vitesse de modélisation 3D dans des environnements chaotiques.
― 8 min lire
Un aperçu des descriptions d'images détaillées grâce à la légende d'images compositionnelle.
― 7 min lire
SAM segmente les images mais galère à les comprendre, ce qui limite son utilité.
― 8 min lire
Explorer l'utilisation de RTDETR pour des routes plus sûres au Bangladesh.
― 7 min lire
Un système aide les ordis à associer des images avec des descriptions compliquées de manière efficace.
― 7 min lire
XTRA améliore la façon dont les ordinateurs reconnaissent les images en utilisant moins de données et de ressources.
― 5 min lire
Utiliser le langage pour améliorer la classification des données dans différents contextes.
― 7 min lire
Une nouvelle méthode améliore la détection des anomalies en apprentissage automatique.
― 8 min lire
Combiner le langage et les visuels pour une meilleure perception de la profondeur.
― 6 min lire
Apprends à entraîner des ordis à reconnaître des images sans biais.
― 7 min lire
Une nouvelle méthode améliore la façon dont les ordis reconnaissent les images en segmentant les parties.
― 6 min lire
FastTrackTr propose une solution rapide et efficace pour suivre plusieurs objets dans des vidéos.
― 7 min lire
Une nouvelle méthode détecte la symétrie en 3D à partir d'une seule image.
― 6 min lire
CFPS améliore la gestion des données de nuages de points en mettant l'accent sur les détails importants.
― 7 min lire
Apprendre aux caméras à reconnaître des objets en 3D sans liste préétablie.
― 6 min lire
Améliorer les DNN pour qu'ils imitent mieux la vision humaine peut booster leurs applications dans le monde réel.
― 9 min lire
De nouvelles méthodes améliorent l'analyse d'images en utilisant des infos 3D pour mieux reconnaître les objets.
― 7 min lire
Des chercheurs améliorent la capacité des ordinateurs à reconnaître des objets fonctionnels dans des environnements 3D.
― 5 min lire
Cet article explore des méthodes pour transformer des images 2D en modèles 3D de personnes.
― 7 min lire
Une nouvelle approche améliore la reconnaissance d'objets dans des espaces 3D en utilisant le suivi de masques 2D.
― 7 min lire
De nouvelles techniques améliorent la reconnaissance faciale dans des images de mauvaise qualité.
― 5 min lire
De nouvelles méthodes améliorent la compréhension des interactions humain-objet dans les images.
― 10 min lire
Une nouvelle stratégie pour cibler plusieurs tâches dans les réseaux de neurones profonds.
― 7 min lire
Découvrez comment les chercheurs gèrent l'incertitude des données pour améliorer les systèmes de détection d'objets.
― 8 min lire
DROID-Splat combine le suivi et la cartographie pour une meilleure navigation des robots.
― 6 min lire
HyperSeg améliore la segmentation d'images et de vidéos avec un meilleur raisonnement et interaction.
― 6 min lire
DGGS améliore la modélisation 3D en réduisant les distractions de fond pour des visuels plus propres.
― 8 min lire
Apprends comment les vidéos synthétiques aident les ordinateurs à reconnaître des actions.
― 7 min lire
Un système plus intelligent pour suivre des objets, en se concentrant sur l'évitement des distractions.
― 8 min lire
Découvrez comment les ordinateurs reconnaissent des images en utilisant deux tâches clés.
― 7 min lire
L'attaque ABBG perturbe les trackers d'objets visuels utilisant la technologie des transformeurs.
― 8 min lire
De nouvelles techniques aident les robots à s'adapter à différentes conditions d'éclairage pendant les tâches.
― 9 min lire
NumGrad-Pull reconstruit efficacement des surfaces à partir de nuages de points 3D avec plus de détails.
― 9 min lire
Une nouvelle référence examine comment les modèles comprennent les indices de profondeur à partir des images.
― 8 min lire