Une nouvelle méthode pour localiser avec précision les réflexions cornéennes dans les images des yeux.
― 4 min lire
La science de pointe expliquée simplement
Une nouvelle méthode pour localiser avec précision les réflexions cornéennes dans les images des yeux.
― 4 min lire
Un nouvel algorithme améliore l'efficacité et la précision dans l'annotation des nuages de points 3D.
― 6 min lire
Présentation d'une méthode simple pour une détection efficace des points clés en vision par ordinateur.
― 8 min lire
Une nouvelle méthode améliore l'inpainting du visage, préservant l'identité et la qualité.
― 8 min lire
CLIP économe en ressources réduit les besoins en calcul tout en gardant de bonnes performances dans les tâches image-texte.
― 9 min lire
Découvre comment l'augmentation de données améliore la performance des machines apprenantes avec des données déséquilibrées.
― 8 min lire
NoisyTwins améliore les StyleGANs pour générer de meilleures images à partir de jeux de données limités.
― 7 min lire
Utiliser des données synthétiques améliore la détection des mains dans un cadre industriel.
― 7 min lire
Un nouveau modèle transforme les sons en images claires, reliant les infos audio et visuelles.
― 8 min lire
Dynamic Mobile-Former améliore l'efficacité et les performances de la vision par ordinateur grâce à la convolution dynamique.
― 7 min lire
Une approche innovante pour aligner des vidéos sans exemples ou entraînement préalables.
― 5 min lire
Une nouvelle approche aligne des nuages de points 3D sans données étiquetées.
― 7 min lire
KD-DLGAN améliore la qualité de génération d'images en utilisant la distillation de connaissances.
― 7 min lire
Explorer de nouvelles méthodes pour améliorer l'apprentissage avec peu de données.
― 6 min lire
Le benchmark RoboBEV évalue les systèmes BEV face à des défis du monde réel.
― 10 min lire
SpectFormer combine des couches spectrales et d'attention pour améliorer l'analyse d'image.
― 6 min lire
Ce cadre utilise l'adaptation en temps de test pour mieux prédire les mouvements humains.
― 7 min lire
Une nouvelle méthode identifie des actions dans des vidéos sans avoir besoin de données pré-étiquetées.
― 6 min lire
Le prompting hiérarchique améliore la précision et l'efficacité de la classification d'images grâce à un étiquetage structuré.
― 8 min lire
De nouvelles techniques améliorent la prédiction de profondeur à partir d'images uniques.
― 8 min lire
La recherche vise à améliorer la représentation des données en utilisant des méthodes non linéaires et des structures temporelles.
― 8 min lire
EWT combine des transformations en ondelettes et des Transformers pour une meilleure clarté d'image et efficacité.
― 7 min lire
Une nouvelle façon de classer efficacement les images sans étiquettes.
― 7 min lire
Une nouvelle méthode améliore la précision du VPR en générant des images de référence supplémentaires.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance des actions en utilisant des données partiellement étiquetées.
― 6 min lire
Apprends comment Smooth IoU Loss améliore la précision de détection d'objets.
― 6 min lire
PARFormer améliore la reconnaissance des piétons grâce aux réseaux de transformateurs pour une meilleure précision.
― 8 min lire
Cette méthode améliore l'estimation du flux optique sans se baser sur des données étiquetées.
― 7 min lire
Un système qui associe des images aux significations des mots en utilisant le contexte.
― 8 min lire
Un récent concours a mis en avant les progrès dans la mesure de la profondeur avec des images uniques.
― 7 min lire
Combiner le LIDAR avec des images en niveaux de gris améliore la précision et économise de l'énergie.
― 6 min lire
Une nouvelle méthode combine la lumière visible et l'imagerie thermique pour améliorer la précision de classification.
― 8 min lire
Une nouvelle méthode améliore la précision de détection d'objets en s'attaquant aux problèmes de confiance dans les prédictions.
― 6 min lire
Un nouveau cadre améliore la reconnaissance dans des environnements bondés malgré des vues obstruées.
― 5 min lire
Une nouvelle méthode pour améliorer la reconstruction d'objets derrière des surfaces réfléchissantes.
― 7 min lire
Une nouvelle méthode améliore la réponse à des questions vidéo en utilisant des hyper-graphes de situation.
― 8 min lire
ProPanDL améliore la segmentation panoptique en intégrant l'incertitude dans la détection d'objets.
― 6 min lire
Une nouvelle méthode améliore la précision de l'estimation de l'agencement des pièces pour les murs éloignés.
― 7 min lire
On examine comment les données synthétiques améliorent la précision de classification des images sur ImageNet.
― 7 min lire
Une nouvelle méthode pour créer des images réalistes en utilisant juste deux photos.
― 7 min lire