OfCaM améliore la précision du suivi des mouvements humains grâce aux vidéos.
― 7 min lire
La science de pointe expliquée simplement
OfCaM améliore la précision du suivi des mouvements humains grâce aux vidéos.
― 7 min lire
Une nouvelle méthode améliore le suivi d'objets en intégrant des données 3D.
― 7 min lire
Une nouvelle approche basée sur la diffusion s'attaque efficacement à plusieurs tâches de vision par ordinateur.
― 7 min lire
Présentation de BADM pour une formation plus rapide et plus précise des modèles d'apprentissage profond.
― 6 min lire
DeepMoveSORT améliore l'efficacité du suivi d'objets, surtout dans des scénarios de mouvement complexes.
― 5 min lire
Un nouveau cadre améliore la façon dont les modèles génèrent des images à partir de demandes textuelles complexes.
― 7 min lire
De nouveaux modèles produisent des descriptions vidéo de haute qualité efficacement.
― 6 min lire
Les robots peuvent apprendre plus efficacement en utilisant leur propre forme dans la prise de décision.
― 7 min lire
ESGNN améliore la génération de graphes de scène à partir de nuages de points 3D en préservant la symétrie.
― 6 min lire
Une nouvelle approche pour améliorer les performances de l'UDA en utilisant CLIP et des conseils linguistiques.
― 8 min lire
Une nouvelle méthode pour améliorer les modèles génératifs en utilisant le contexte de manière efficace.
― 9 min lire
Ce système s'attaque aux problèmes de perspective dans les recherches d'images de croquis.
― 10 min lire
Un aperçu pour améliorer les modèles de deep learning pour l'efficacité dans le traitement d'images.
― 6 min lire
ReGround3D améliore la compréhension des instructions humaines dans des environnements 3D.
― 6 min lire
FastCLIP permet de former des modèles CLIP efficacement avec moins de ressources.
― 7 min lire
Une nouvelle méthode améliore l'apprentissage dans les modèles image-texte en utilisant des exemples composites.
― 7 min lire
Une nouvelle méthode améliore la modélisation 3D sans connaissance préalable de l'objet.
― 6 min lire
AdaDistill améliore la reconnaissance faciale en optimisant le transfert de connaissances entre les modèles.
― 7 min lire
Une nouvelle méthode améliore la performance du modèle dans la reconnaissance des classes sous-représentées.
― 7 min lire
RoDyn-SLAM améliore la cartographie et le suivi dans des environnements avec des objets en mouvement.
― 8 min lire
Une nouvelle méthode améliore l'apprentissage des robots avec peu de données étiquetées.
― 15 min lire
Examiner le besoin de vérification formelle dans la technologie de détection d'objets.
― 7 min lire
MARS aide les robots à mieux percevoir et interagir avec des objets articulés.
― 7 min lire
CPT améliore la performance des modèles boîte noire sans accès direct aux paramètres internes.
― 8 min lire
M IST améliore l'interaction entre les modèles visuels et de langage pour de meilleures performances.
― 7 min lire
Un nouvel outil pour améliorer l'analyse des formes en science et technologie.
― 9 min lire
LatentDEM s'attaque efficacement aux problèmes inverses aveugles en vision par ordinateur et en graphisme.
― 7 min lire
De nouvelles méthodes améliorent la génération d'images en alignant les résultats avec des descriptions textuelles spécifiques.
― 9 min lire
Un réseau léger pour l'estimation de pose en temps réel sur les appareils mobiles.
― 8 min lire
On propose une méthode pour améliorer l'efficacité des vision transformers sur les appareils edge.
― 7 min lire
Apprends à comparer des mesures de probabilité sur des structures de données complexes.
― 9 min lire
Une nouvelle méthode améliore la capacité des robots à trouver des objets dans des environnements ouverts.
― 10 min lire
De nouvelles méthodes améliorent la détection des petits objets en vision par ordinateur.
― 9 min lire
Une nouvelle méthode réduit le besoin de données étiquetées dans les tâches de vision par ordinateur.
― 7 min lire
Le modèle GCF améliore la précision de la reconnaissance des expressions faciales grâce à des techniques de deep learning innovantes.
― 7 min lire
Un nouveau cadre vise à détecter et corriger les erreurs dans les résultats des LVLM.
― 9 min lire
De nouvelles méthodes améliorent la création de plusieurs objets dans les images avec une précision améliorée.
― 9 min lire
Une nouvelle approche améliore la prédiction des actions futures en utilisant des insights visuels et sémantiques.
― 7 min lire
Une nouvelle méthode utilisant la topologie améliore la détection de points clés dans les images.
― 9 min lire
HRSAM améliore l'efficacité et la précision de la segmentation d'images pour des entrées haute résolution.
― 7 min lire