Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes LLaVA-3D : Relier la compréhension 2D et 3D

LLaVA-3D mélange des infos 2D et 3D pour un raisonnement spatial plus poussé.

2025-06-05T06:01:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'apprentissage des représentations désentrelacées avec des données synthétiques

Explorer l'utilisation de données synthétiques pour améliorer le DRL dans des applications réelles.

2025-06-05T03:15:30+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de l'estimation de l'homographie avec InterNet

InterNet améliore l'estimation de l'homographie en apprenant à partir d'images sans données étiquetées.

2025-06-05T02:28:06+00:00 ― 5 min lire

Traitement de l'image et de la vidéo Techniques pour des images plus claires : Méthodes de débruitage

Apprends des techniques de débruitage d'image pour améliorer la clarté et la qualité.

2025-06-05T02:07:20+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données améliore la précision de l'estimation de profondeur monoculaire

Un nouveau jeu de données traite des changements de point de vue dans l'estimation de profondeur pour la conduite autonome.

2025-06-05T00:05:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de l'estimation de mouvement avec des caméras événements

Une méthode qui combine les données d'événements et des images traditionnelles pour une meilleure analyse du mouvement.

2025-06-04T23:41:35+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la distillation de connaissances avec la méthode Rank-Kendall

Une nouvelle méthode améliore le processus d'apprentissage entre les modèles d'enseignant et d'élève.

2025-06-04T22:54:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Présentation de l'apprentissage par invite en cascade pour les modèles

Une nouvelle méthode pour équilibrer les connaissances générales et l'adaptation spécifique aux tâches dans les modèles.

2025-06-04T22:23:12+00:00 ― 9 min lire

Robotique Avancées dans la perception des robots avec le cadre AP-VLM

AP-VLM améliore la perception des robots et leur interaction grâce à des techniques de perception active.

2025-06-04T18:10:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Présentation de P4Q : Une nouvelle méthode pour les modèles de langage visuel

P4Q combine le fine-tuning et la quantification pour une performance efficace des modèles visuels-langages.

2025-06-04T18:02:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes TA-Cleaner : Une nouvelle défense contre les attaques sur les modèles multimodaux

Voici TA-Cleaner, une méthode pour améliorer les défenses des modèles multimodaux contre l'empoisonnement des données.

2025-06-04T16:51:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Présentation de CompressTracker : Suivi d'objets efficace

Un nouveau cadre pour un suivi d'objet visuel léger et efficace.

2025-06-04T15:48:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de CAMOT : Une nouvelle façon de suivre des objets dans les vidéos

CAMOT améliore le suivi multi-objets en estimant les angles de caméra et les profondeurs.

2025-06-04T15:00:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de SimVG : Un nouveau cadre pour l'ancrage visuel

SimVG améliore l'ancrage visuel en liant le texte à des zones spécifiques de l'image de manière plus efficace.

2025-06-04T14:52:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation d'EAGLE : Une nouvelle frontière dans l'analyse vidéo égocentrique

Le modèle et le dataset EAGLE améliorent la compréhension des vidéos égocentriques.

2025-06-04T14:37:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancer le comptage de foules avec la technologie BTN

Une nouvelle méthode améliore la précision du comptage de foule et la fiabilité du modèle.

2025-06-04T12:14:54+00:00 ― 6 min lire

Apprentissage automatique Mémorisation dans les modèles d'apprentissage auto-supervisé

Examiner comment les modèles SSL mémorisent des points de données et ses implications.

2025-06-04T10:40:06+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la taille des jetons pour les SSMs

De nouvelles méthodes améliorent l'efficacité et la précision des modèles de vision basés sur SSM.

2025-06-04T10:16:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconstruction de formes 3D à partir de vidéos

Une nouvelle méthode améliore la précision des formes 3D dans des scènes dynamiques.

2025-06-04T08:33:42+00:00 ― 6 min lire

Analyse numérique Progrès dans les techniques de déflouage d'image

De nouvelles méthodes améliorent la vitesse et la qualité des tâches de défloutage d'image.

2025-06-04T07:19:17+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la distillation de connaissances orientée étudiant

Une nouvelle méthode améliore le transfert de connaissances dans les modèles d'apprentissage automatique.

2025-06-04T07:14:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour la génération d'images en utilisant l'apprentissage auto-supervisé

Présentation d'une méthode pour que l'IA génère des images sans avoir besoin de gros jeux de données étiquetés.

2025-06-04T05:08:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes GeCo : Une nouvelle méthode pour le comptage d'objets avec peu d'exemples

GeCo améliore le comptage d'objets avec moins d'exemples, ce qui augmente la précision et la fiabilité.

2025-06-04T05:00:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la ré-identification des personnes avec le cadre CION

CION améliore la réidentification des personnes en se concentrant sur les corrélations d'identité à travers les vidéos.

2025-06-04T02:38:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection de la cible du regard

Une nouvelle méthode améliore la détection de la cible du regard avec moins de données étiquetées.

2025-06-04T02:06:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la segmentation sémantique avec le contraste de pixels prototypiques probabilistes

Un nouveau cadre améliore le marquage des pixels en s'attaquant à l'incertitude dans la segmentation sémantique.

2025-06-04T01:35:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluer le pré-entraînement dans les tâches d'observation de la Terre

Cette étude évalue l'efficacité des modèles pré-entraînés dans les applications d'observation de la Terre.

2025-06-04T01:19:12+00:00 ― 8 min lire

Apprentissage automatique Faire avancer l'appariement de distribution avec PWAN

Une nouvelle méthode améliore l'alignement des données, surtout avec des ensembles de données bruyants.

2025-06-03T23:26:40+00:00 ― 6 min lire

Apprentissage automatique Examen des encodages neuronaux dans les CNN

Un aperçu de comment les CNN apprennent les caractéristiques des images et leurs similitudes universelles.

2025-06-03T21:06:24+00:00 ― 9 min lire

Calcul et langage Amélioration de la décomposition des questions visuelles dans les modèles multimodaux

Explorer des méthodes pour améliorer les modèles multimodaux dans l'analyse des questions visuelles.

2025-06-03T18:52:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer aux risques de sécurité dans les modèles de langage visuels

TrojVLM expose des vulnérabilités dans les modèles de langage visuels aux attaques de backdoor.

2025-06-03T16:22:00+00:00 ― 9 min lire

Apprentissage automatique Avancement des modèles génératifs multimodaux avec des approches basées sur l'énergie

Un nouveau cadre améliore la génération de données à partir de plusieurs sources en utilisant des modèles basés sur l'énergie.

2025-06-03T14:55:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Vision Transformers avec une analyse spatiale

SATA renforce la robustesse et l'efficacité des Vision Transformers pour les tâches de classification d'images.

2025-06-03T14:47:12+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Faire progresser la segmentation sémantique avec des images non étiquetées

Une nouvelle méthode améliore la reconnaissance d'objets en utilisant des masques sans étiquettes détaillées.

2025-06-03T14:39:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Nouveaux Sauts en Vision par Machine avec les PPLNs

Les PPLNs améliorent le traitement des données des caméras événementielles pour de meilleures capacités de vision machine.

2025-06-03T12:48:42+00:00 ― 7 min lire

Apprentissage automatique Techniques de taille dans les réseaux de neurones : performance et interprétabilité

Analyser les effets des méthodes de taille sur la performance et l'interprétabilité de GoogLeNet.

2025-06-03T11:45:30+00:00 ― 6 min lire

Traitement de l'image et de la vidéo Défis dans la restauration de cartes de profondeur pour la RA et la RV

Méthodes innovantes pour améliorer les cartes de profondeur essentielles à la réalité augmentée et virtuelle.

2025-06-03T11:15:20+00:00 ― 8 min lire

Apprentissage automatique Améliorer les modèles vision-langage avec des étiquettes bruyantes

Une méthode pour améliorer les performances du modèle malgré des étiquettes de données incorrectes.

2025-06-03T11:06:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la découverte de catégories généralisées avec FlipClass

FlipClass propose une nouvelle méthode pour mieux apprendre dans la Découverte de Catégories Généralisées.

2025-06-03T10:26:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la ré-identification des personnes avec une nouvelle méthode d'apprentissage

Une nouvelle méthode améliore l'identification des personnes à travers les caméras avec moins de supervision.

2025-06-03T08:28:00+00:00 ― 6 min lire