Une étude sur la performance des modèles visuels fondamentaux face à des distorsions réelles dans les tâches de segmentation.
― 11 min lire
La science de pointe expliquée simplement
Une étude sur la performance des modèles visuels fondamentaux face à des distorsions réelles dans les tâches de segmentation.
― 11 min lire
DiffAug améliore les systèmes de reconnaissance d'images grâce à des techniques de bruit innovantes.
― 7 min lire
Découvrez CANN, une méthode pour une localisation visuelle précise en utilisant des caractéristiques locales.
― 9 min lire
Une nouvelle méthode améliore la génération d'images à partir de texte en reliant correctement les entités et les modificateurs.
― 7 min lire
De nouvelles méthodes améliorent la segmentation des instruments chirurgicaux pour de meilleures chirurgies robotiques.
― 9 min lire
Une nouvelle méthode améliore l'analyse d'images pour les applications biomédicales.
― 7 min lire
FETNet améliore les méthodes de suppression de texte dans les scènes pour un meilleur respect de la vie privée et une meilleure restauration d'image.
― 7 min lire
Un aperçu du défi Topologie OpenLane et de ses méthodes innovantes.
― 7 min lire
Un nouveau cadre améliore la segmentation de nuages de points en utilisant des modèles de fondation visuels.
― 6 min lire
La recherche montre que des neurones communs aident à la compréhension dans différents modèles d'IA.
― 6 min lire
Découvrez DreamSim, une métrique alignée avec la perception visuelle humaine.
― 8 min lire
Un nouveau modèle analyse les interactions sociales en utilisant des images 2D pour simuler un comportement 3D.
― 5 min lire
Présentation d'une nouvelle méthode pour la reconnaissance d'objets sans entraînement en utilisant des descriptions textuelles.
― 9 min lire
OpenOOD v1.5 améliore les méthodes d'évaluation de la détection OOD pour des performances fiables.
― 8 min lire
Un aperçu des méthodes de segmentation d'images alimentaires et de leur importance pour la nutrition.
― 7 min lire
La perte ELM améliore la précision de classification pour les classes minoritaires dans les modèles de reconnaissance d'images.
― 6 min lire
Une nouvelle méthode améliore l'adaptation de domaine dans la segmentation sémantique en utilisant l'apprentissage contrastif.
― 10 min lire
Une nouvelle approche améliore l'adaptabilité des agents dans des environnements complexes.
― 9 min lire
Une approche simple pour créer des plans de pièces 3D détaillés en utilisant des annotations 2D.
― 8 min lire
Combiner des filtres passe-haut et des autoencodeurs améliore les graphiques vectoriels à partir d'images.
― 6 min lire
Recherche sur les techniques pour améliorer la performance de la réponse visuelle aux questions.
― 7 min lire
De nouvelles méthodes améliorent l'efficacité et les performances du filtrage inverse d'images.
― 8 min lire
Une étude sur le couplage d'actions dans des vidéos à travers le temps et l'espace.
― 7 min lire
Cette méthode améliore la perception 3D pour les voitures autonomes en utilisant les données de la caméra.
― 8 min lire
Une nouvelle méthode améliore les performances de segmentation d'image grâce à des techniques innovantes.
― 7 min lire
Un nouveau modèle améliore l'efficacité et l'adaptabilité de l'apprentissage avec peu d'exemples.
― 8 min lire
MOSAIC révolutionne la reconstruction d'images à partir de données limitées en utilisant des techniques flexibles.
― 7 min lire
Cet article présente une méthode qui combine l'apprentissage automatique avec les retours humains pour un étiquetage d'images plus rapide.
― 9 min lire
Examen du rôle de l'apprentissage auto-supervisé dans l'amélioration des modèles transformer pour les tâches de nuages de points.
― 12 min lire
CID propose une nouvelle façon de traiter les nuages de points 3D de manière efficace.
― 7 min lire
Améliorer la précision dans la détection 3D en utilisant des techniques innovantes de cartes de profondeur.
― 7 min lire
DH-PTAM combine des caméras stéréo et des caméras d'événement pour une cartographie améliorée.
― 7 min lire
De nouvelles méthodes améliorent la qualité et l'efficacité du débruitage d'images.
― 7 min lire
Une nouvelle approche améliore les configurations de pooling dans les réseaux de neurones convolutionnels.
― 9 min lire
BEVScope améliore l'estimation de profondeur pour mieux comprendre les environnements en robotique.
― 9 min lire
De nouvelles méthodes améliorent l'efficacité et la qualité de l'entraînement des modèles d'image.
― 7 min lire
Une nouvelle architecture matérielle améliore l'efficacité et la précision de la détection de texte dans les scènes.
― 7 min lire
Une nouvelle méthode pour associer des images avec des nuages de points en utilisant des données géométriques et de couleur.
― 13 min lire
Une nouvelle méthode d'entraînement améliore la résistance des classificateurs d'images aux patchs trompeurs.
― 7 min lire
Une stratégie pour optimiser le rangement des données dans les tâches de vision par ordinateur.
― 9 min lire