Dynamic Mobile-Former améliore l'efficacité et les performances de la vision par ordinateur grâce à la convolution dynamique.
― 7 min lire
La science de pointe expliquée simplement
Dynamic Mobile-Former améliore l'efficacité et les performances de la vision par ordinateur grâce à la convolution dynamique.
― 7 min lire
Une approche innovante pour aligner des vidéos sans exemples ou entraînement préalables.
― 5 min lire
Une nouvelle approche aligne des nuages de points 3D sans données étiquetées.
― 7 min lire
KD-DLGAN améliore la qualité de génération d'images en utilisant la distillation de connaissances.
― 7 min lire
Explorer de nouvelles méthodes pour améliorer l'apprentissage avec peu de données.
― 6 min lire
Le benchmark RoboBEV évalue les systèmes BEV face à des défis du monde réel.
― 10 min lire
SpectFormer combine des couches spectrales et d'attention pour améliorer l'analyse d'image.
― 6 min lire
Ce cadre utilise l'adaptation en temps de test pour mieux prédire les mouvements humains.
― 7 min lire
Une nouvelle méthode identifie des actions dans des vidéos sans avoir besoin de données pré-étiquetées.
― 6 min lire
Le prompting hiérarchique améliore la précision et l'efficacité de la classification d'images grâce à un étiquetage structuré.
― 8 min lire
De nouvelles techniques améliorent la prédiction de profondeur à partir d'images uniques.
― 8 min lire
La recherche vise à améliorer la représentation des données en utilisant des méthodes non linéaires et des structures temporelles.
― 8 min lire
EWT combine des transformations en ondelettes et des Transformers pour une meilleure clarté d'image et efficacité.
― 7 min lire
Une nouvelle façon de classer efficacement les images sans étiquettes.
― 7 min lire
Une nouvelle méthode améliore la précision du VPR en générant des images de référence supplémentaires.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance des actions en utilisant des données partiellement étiquetées.
― 6 min lire
Apprends comment Smooth IoU Loss améliore la précision de détection d'objets.
― 6 min lire
PARFormer améliore la reconnaissance des piétons grâce aux réseaux de transformateurs pour une meilleure précision.
― 8 min lire
Cette méthode améliore l'estimation du flux optique sans se baser sur des données étiquetées.
― 7 min lire
Un système qui associe des images aux significations des mots en utilisant le contexte.
― 8 min lire
Un récent concours a mis en avant les progrès dans la mesure de la profondeur avec des images uniques.
― 7 min lire
Combiner le LIDAR avec des images en niveaux de gris améliore la précision et économise de l'énergie.
― 6 min lire
Une nouvelle méthode combine la lumière visible et l'imagerie thermique pour améliorer la précision de classification.
― 8 min lire
Une nouvelle méthode améliore la précision de détection d'objets en s'attaquant aux problèmes de confiance dans les prédictions.
― 6 min lire
Un nouveau cadre améliore la reconnaissance dans des environnements bondés malgré des vues obstruées.
― 5 min lire
Une nouvelle méthode pour améliorer la reconstruction d'objets derrière des surfaces réfléchissantes.
― 7 min lire
Une nouvelle méthode améliore la réponse à des questions vidéo en utilisant des hyper-graphes de situation.
― 8 min lire
ProPanDL améliore la segmentation panoptique en intégrant l'incertitude dans la détection d'objets.
― 6 min lire
Une nouvelle méthode améliore la précision de l'estimation de l'agencement des pièces pour les murs éloignés.
― 7 min lire
On examine comment les données synthétiques améliorent la précision de classification des images sur ImageNet.
― 7 min lire
Une nouvelle méthode pour créer des images réalistes en utilisant juste deux photos.
― 7 min lire
Voici EVAD, une méthode pour détecter les actions dans les vidéos plus rapidement et avec précision.
― 7 min lire
Un nouveau traqueur identifie et suit efficacement divers objets dans les vidéos.
― 9 min lire
Explorer les avancées en deep learning dans la technologie des caméras omnidirectionnelles pour diverses applications.
― 8 min lire
De nouvelles méthodes pour détecter les poses humaines à partir d'images omnidirectionnelles montrent des résultats prometteurs.
― 7 min lire
Une nouvelle méthode améliore la précision de l'inspection des PCB en utilisant plusieurs angles.
― 7 min lire
Une nouvelle méthode améliore le suivi de la position de la caméra pendant les procédures chirurgicales difficiles.
― 8 min lire
Une nouvelle méthode améliore l'apprentissage à partir d'images non centrées sur les objets grâce à une sensibilité géométrique.
― 7 min lire
Une étude qui examine la fiabilité des explications visuelles dans les réseaux de neurones.
― 7 min lire
Examiner comment les systèmes de deep learning identifient des objets avec des vues limitées.
― 9 min lire