Une nouvelle méthode identifie les attaques sur les systèmes de deep hashing sans données étiquetées.
― 8 min lire
La science de pointe expliquée simplement
Une nouvelle méthode identifie les attaques sur les systèmes de deep hashing sans données étiquetées.
― 8 min lire
De nouvelles techniques aident les agents AI à prédire les futures scènes pour une meilleure navigation.
― 9 min lire
Deux nouvelles méthodes améliorent l'estimation des normales à partir de nuages de points en utilisant des techniques non supervisées.
― 7 min lire
Une nouvelle mesure analyse les biais dans la description d'images pour des systèmes d'IA plus équitables.
― 9 min lire
POMP améliore la reconnaissance visuelle en utilisant des invites basées sur le langage pour une meilleure classification des images.
― 10 min lire
Une nouvelle méthode améliore le suivi d'objets et la segmentation dans l'analyse vidéo.
― 5 min lire
Une étude montre comment les politiques de contrôle affectent la performance des modèles de vision en robotique.
― 8 min lire
DetCLIPv2 améliore la reconnaissance d'objets en utilisant des paires image-texte pour plus de flexibilité.
― 6 min lire
Une nouvelle méthode améliore la performance du démaillage d'images avec des modèles plus petits.
― 9 min lire
Présentation de HDT-HDR : Une nouvelle méthode pour réduire le ghosting dans les images HDR.
― 8 min lire
Cette méthode améliore les attaques adversariales en modifiant des caractéristiques sans altérer la qualité visuelle.
― 6 min lire
Un nouveau repère pour reconnaître du texte petit et dense dans les vidéos.
― 6 min lire
Étudier l'impact de la taille du modèle sur les tâches de télédétection.
― 10 min lire
StageInteractor améliore la détection d'objets grâce à une attribution de labels innovante et une optimisation des ressources.
― 9 min lire
Les variations proposées des modules Squeeze et Excitation améliorent la fonctionnalité et la précision des CNN.
― 7 min lire
De nouveaux designs de cellules RNN améliorent significativement les performances de classification d'images.
― 7 min lire
Une nouvelle méthode améliore l'édition de texte dans les images en utilisant une approche à double encodeur.
― 7 min lire
VAL-PAT améliore la reconnaissance et la recherche de piétons en utilisant des images et du texte.
― 7 min lire
Cette étude met en avant des méthodes pour améliorer la performance des classificateurs d'images grâce au zoom et en s'attaquant aux biais.
― 7 min lire
Un nouveau modèle simplifie l'entraînement et améliore les performances des réseaux de neurones sur différentes tâches.
― 10 min lire
Une nouvelle méthode améliore l'entraînement pour identifier des objets camouflés avec des images variées.
― 9 min lire
Une nouvelle méthode améliore la segmentation d'image en optimisant les facteurs de redimensionnement de manière efficace.
― 9 min lire
La méthode MOST détecte plusieurs objets dans les images sans avoir besoin de plein d'étiquettes.
― 7 min lire
Une nouvelle méthode améliore l'efficacité de l'enregistrement des nuages de points avec des SDF compressés.
― 9 min lire
Une nouvelle méthode prédit comment les gouttes de liquide se comportent sur les surfaces.
― 8 min lire
Une méthode utilisant des caméras stéréo pour estimer avec précision la vitesse des véhicules.
― 7 min lire
SportsMOT propose des données super utiles pour suivre les athlètes en basket, volley et foot.
― 7 min lire
Cet article présente une méthode plus rapide pour optimiser les positions des caméras dans la modélisation 3D.
― 6 min lire
Une nouvelle méthode améliore la détection d'objets avec une formation sur des données limitées.
― 7 min lire
CrowdSim2 propose un dataset synthétique pour améliorer les modèles de détection d'objets.
― 7 min lire
Une nouvelle approche dans les mannequins de mode se concentre sur des attributs précis.
― 8 min lire
MUREN améliore la détection d'interaction humain-objet grâce à un meilleur partage de contexte.
― 7 min lire
Explorer le potentiel de l'apprentissage Few-Shot en segmentation sémantique.
― 8 min lire
Une nouvelle méthode pour localiser avec précision les réflexions cornéennes dans les images des yeux.
― 4 min lire
Un nouvel algorithme améliore l'efficacité et la précision dans l'annotation des nuages de points 3D.
― 6 min lire
Présentation d'une méthode simple pour une détection efficace des points clés en vision par ordinateur.
― 8 min lire
Une nouvelle méthode améliore l'inpainting du visage, préservant l'identité et la qualité.
― 8 min lire
CLIP économe en ressources réduit les besoins en calcul tout en gardant de bonnes performances dans les tâches image-texte.
― 9 min lire
Découvre comment l'augmentation de données améliore la performance des machines apprenantes avec des données déséquilibrées.
― 8 min lire
NoisyTwins améliore les StyleGANs pour générer de meilleures images à partir de jeux de données limités.
― 7 min lire