La vue d'ensemble améliore la reconnaissance visuelle des lieux pour une meilleure précision dans la conduite autonome.
― 9 min lire
La science de pointe expliquée simplement
La vue d'ensemble améliore la reconnaissance visuelle des lieux pour une meilleure précision dans la conduite autonome.
― 9 min lire
FACENet améliore l'identification des véhicules dans des conditions d'éclairage difficiles.
― 5 min lire
Un modèle unifié améliore l'identification et le positionnement des objets dans l'espace 3D.
― 7 min lire
Un regard plus proche sur les CNN et leur fonctionnement interne à travers la matrice Hessienne.
― 7 min lire
Une nouvelle méthode basée sur des graphes améliore l'extraction d'entités à partir de différents types de documents.
― 7 min lire
Explorer des méthodes pour reconnaître des actions humaines dans des vidéos pour différentes applications.
― 7 min lire
Cette nouvelle méthode réduit l'effort d'annotation en segmentation sémantique.
― 8 min lire
Découvrez le rôle de l'algorithme Mean Shift dans le clustering et l'estimation de mode.
― 5 min lire
RoMa améliore la précision de la correspondance des caractéristiques dans des conditions difficiles pour différentes applications.
― 9 min lire
Une nouvelle méthode pour le matting d'images qui allie simplicité et performance.
― 8 min lire
Des méthodes innovantes utilisant des données synthétiques améliorent la détection d'anomalies dans divers domaines.
― 6 min lire
Un nouveau jeu de données aide les modèles à générer des expressions de référence à partir d'images.
― 11 min lire
Découvrez les dernières avancées en IA incarnée grâce au modèle EmbodiedGPT.
― 8 min lire
De nouveaux modèles imitent la perception du mouvement humain pour améliorer les systèmes artificiels.
― 7 min lire
De nouveaux modèles améliorent la façon dont les machines identifient et regroupent les objets dans les images.
― 9 min lire
Apprends comment les modèles de deep learning gardent leur performance dans des conditions réelles variées.
― 9 min lire
De nouvelles méthodes et ensembles de données améliorent la segmentation d'image pour la télédétection.
― 9 min lire
Une nouvelle méthode améliore le transfert de connaissances en apprentissage automatique grâce à des augmentations de données.
― 9 min lire
Une nouvelle méthode améliore la reconnaissance faciale en renforçant l'évaluation de la qualité d'image.
― 6 min lire
La recherche améliore la performance des modèles pour les langues à faibles ressources en utilisant l'apprentissage par méta.
― 7 min lire
Une nouvelle méthode améliore l'efficacité des Vision Transformers grâce à un filtrage de tokens efficace.
― 6 min lire
Explore les concepts de drapeaux et de pliage de drapeaux pour analyser des structures de données complexes.
― 7 min lire
Une nouvelle méthode améliore la détection d'objets avec des données étiquetées et non étiquetées.
― 10 min lire
Examiner comment le biais de genre influence les métriques d'évaluation dans la légende d'image.
― 8 min lire
ALGO identifie des activités dans les vidéos sans avoir besoin d'étiquettes prédéfinies.
― 9 min lire
Explore les bases et les applications de l'apprentissage profond et de sa variante géométrique.
― 8 min lire
MixFormerV2 combine des transformers pour un suivi d'objets efficace et précis dans des applis en temps réel.
― 6 min lire
Explorer les méthodes et défis actuels dans la technologie d'estimation de pose d'objet en 6D.
― 8 min lire
Cette étude explore une nouvelle méthode pour que les robots gèrent les portes en utilisant des données visuelles.
― 8 min lire
Un nouveau jeu de données et une méthode améliorent l'analyse 3D des mouvements humains.
― 7 min lire
Cette méthode améliore les données d'entraînement en utilisant des descriptions de langue pour générer des variations d'images.
― 7 min lire
OVO permet une prédiction flexible de l'occupation des objets en 3D sans avoir besoin d'un gros étiquetage.
― 7 min lire
Une nouvelle méthode améliore la prédiction d'actions dans des vidéos égocentriques en utilisant une attention guidée.
― 7 min lire
Présentation d'une méthode efficace pour le transfert de connaissances dans les modèles de machine learning.
― 9 min lire
Une nouvelle méthode améliore la génération de données multimodales et leur cohérence.
― 8 min lire
L'analyse vidéo automatique améliore les inspections sous-marines des navires grâce à des modèles avancés.
― 11 min lire
DynaShare adapte le partage de modèles pour améliorer les performances sur plusieurs tâches.
― 7 min lire
i-SRN améliore l'estimation de pose pour les robots en utilisant des représentations implicites et le rendu neural.
― 7 min lire
Explorer des méthodes pour améliorer le codage d'images pour des applis IA avancées.
― 8 min lire
Une technique pour repérer l'instabilité dans la reconstruction de maillages du corps humain.
― 7 min lire