Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour l'averaging de multiples rotations

Cette méthode estime les orientations sans données étiquetées en utilisant l'apprentissage profond.

Shiqi Li, Jihua Zhu, Yifan Xie

2025-06-11T19:29:48+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Évaluation du raisonnement spatial dans les modèles vision-langage

Ce papier évalue la capacité des VLM à raisonner sur les tailles et les distances.

Yuan-Hong Liao, Rafid Mahmood, Sanja Fidler

2025-06-11T19:21:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes de reconnaissance d'activité humaine

Aperçu des techniques pour détecter et classer les actions humaines.

Jungpil Shin, Najmul Hassan, Abu Saleh Musa Miah1

2025-06-11T17:47:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes SparX : Une nouvelle approche de la vision par ordinateur

SparX améliore le traitement d'images en imitant le système visuel humain.

Meng Lou, Yunxiang Fu, Yizhou Yu

2025-06-11T17:07:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance d'objets avec des caméras événementielles

Des recherches montrent le potentiel des LLM pour reconnaître des objets dans des visuels basés sur des événements.

Zongyou Yu, Qiang Qu, Xiaoming Chen

2025-06-11T16:36:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'objets avec des données de mouvement

L'intégration des infos de mouvement améliore la précision de détection d'objets dans les images.

Cagri Gungor, Adriana Kovashka

2025-06-11T16:12:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées en estimation de mouvement 3D avec ScaleFlow++

ScaleFlow++ améliore l'estimation de mouvement 3D avec des caméras monoculaires pour différentes applis.

Han Ling, Yinghui Sun, Quansen Sun

2025-06-11T15:48:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Approche innovante pour la super résolution dans les images

NSSR-DIL transforme les images de mauvaise qualité efficacement sans avoir besoin de gros ensembles de données.

Sree Rama Vamsidhar S, Rama Krishna Gorthi

2025-06-11T15:40:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode pour apprendre à partir de flux vidéo

Une approche d'apprentissage machine qui utilise le mouvement pour un apprentissage visuel efficace des données.

Simone Marullo, Matteo Tiezzi, Marco Gori

2025-06-11T15:24:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour la détection d'objets

Ce cadre permet d'apprendre rapidement de nouvelles catégories d'objets avec peu de données.

Yanan Jian, Fuxun Yu, Qi Zhang

2025-06-11T12:46:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'efficacité de l'annotation vidéo

Un nouveau système améliore la vitesse et la précision du marquage vidéo.

Alexandru Bobe, Jan C. van Gemert

2025-06-11T11:27:54+00:00 ― 7 min lire

Apprentissage automatique Présentation du modèle de transformateur Kolmogorov-Arnold

KAT améliore l'apprentissage profond en utilisant des KANs avancés pour remplacer les MLPs.

Xingyi Yang, Xinchao Wang

2025-06-11T11:04:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'apprentissage de la représentation des squelettes avec MacDiff

Un nouveau cadre améliore la compréhension des actions humaines grâce aux données de squelette.

Lehong Wu, Lilang Lin, Jiahang Zhang

2025-06-11T10:01:00+00:00 ― 8 min lire

Robotique HiFi-CS : Améliorer la saisie d'objets par les robots avec le langage

Une nouvelle méthode améliore la capacité des robots à saisir des objets en utilisant des commandes en langage naturel.

Vineet Bhat, Prashanth Krishnamurthy, Ramesh Karri

2025-06-11T09:29:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage auto-supervisé avec FOLK

FOLK améliore l'apprentissage auto-supervisé grâce à un masquage de fréquence adaptatif et un design professeur-étudiant.

Amin Karimi Monsefi, Mengxi Zhou, Nastaran Karimi Monsefi

2025-06-11T08:49:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation à vue d'oiseau avec DINOv2

Adapter DINOv2 améliore la segmentation BEV pour des voitures autonomes plus sûres.

Merve Rabia Barın, Görkay Aydemir, Fatma Güney

2025-06-11T06:43:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes FACEMORPHIC : Faire avancer la reconnaissance des émotions faciales

Un nouveau dataset regroupe des données RGB et de caméras événementielles pour améliorer l'analyse faciale.

Federico Becattini, Luca Cultrera, Lorenzo Berlincioni

2025-06-11T06:27:42+00:00 ― 11 min lire

Robotique SteeredMarigold : Une nouvelle approche pour la complétion de profondeur

SteeredMarigold améliore les cartes de profondeur, aidant les robots à naviguer et interagir.

Jakub Gregorek, Lazaros Nalpantidis

2025-06-11T06:04:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire progresser l'estimation de profondeur avec le modèle GRIN

Voici GRIN, un nouveau modèle pour l'estimation de profondeur avec des données éparses.

Vitor Guizilini, Pavel Tokmakov, Achal Dave

2025-06-10T23:49:25+00:00 ― 9 min lire

Calcul et langage NVLM : Faire avancer la compréhension de l'IA multimodale

NVLM améliore la compréhension du langage et des visuels par l'IA pour des tâches variées.

Wenliang Dai, Nayeon Lee, Boxin Wang

2025-06-10T18:52:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la performance de CLIP avec des adaptateurs légers

Ce boulot booste la précision de CLIP en s'attaquant au chevauchement intra-modal avec des adaptateurs légers.

Alexey Kravets, Vinay Namboodiri

2025-06-10T17:41:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Amélioration des techniques de segmentation sémantique à quelques exemples

Un nouveau cadre améliore la segmentation avec peu d'exemples.

Amirreza Fateh, Mohammad Reza Mohammadi, Mohammad Reza Jahed Motlagh

2025-06-10T17:25:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le suivi d'objets à vocabulaire ouvert

SLAck propose une nouvelle façon de suivre des objets variés dans les vidéos.

Siyuan Li, Lei Ke, Yung-Hsu Yang

2025-06-10T15:27:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données et défi pour la segmentation few-shot en télédétection

Un référentiel pour la segmentation à faible échantillonnage généralisée en télédétection est introduit.

Clifford Broni-Bediako, Junshi Xia, Jian Song

2025-06-10T15:11:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'estimation de la pose humaine en 3D grâce aux données de profondeur

Une nouvelle méthode améliore l'estimation de pose en utilisant des images RGB avec des données de profondeur.

Alessandro Simoni, Francesco Marchetti, Guido Borghi

2025-06-10T12:49:06+00:00 ― 8 min lire

Calcul et langage La méthode de réduction de jetons améliore l'efficacité dans les MLLMs

La méthode TRIM réduit les tokens d'image dans les modèles de langage multimodaux tout en maintenant la performance.

Dingjie Song, Wenjun Wang, Shunian Chen

2025-06-10T11:06:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'estimation de profondeur avec des images floues

Un nouveau cadre estime avec précision la profondeur à partir d'images uniques floues.

Jinchang Zhang, Ningning Xu, Hao Zhang

2025-06-10T05:42:30+00:00 ― 7 min lire

Robotique Avancées dans les techniques de scan 3D d'objets

Une nouvelle méthode améliore l'efficacité de la capture de données 3D pour diverses applications.

Zhizhou Jia, Shaohui Zhang, Qun Hao

2025-06-10T01:21:48+00:00 ― 8 min lire

Traitement de l'image et de la vidéo Avancées dans la super-résolution d'image avec WaveMixSR-V2

WaveMixSR-V2 transforme les images basse résolution en sorties de haute qualité de manière efficace.

Pranav Jeevan, Neeraj Nixon, Amit Sethi

2025-06-10T01:09:05+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la classification d'images SSS avec les Vision Transformers

Ce papier compare les Vision Transformers et les CNN pour classifier des images de sonar latéral.

BW Sheffield, Jeffrey Ellen, Ben Whitmore

2025-06-09T23:47:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la prévision panoptique en profondeur pour la robotique

Une nouvelle méthode améliore la façon dont les robots prédisent les futures scènes et les interactions entre objets.

Juana Valeria Hurtado, Riya Mohan, Abhinav Valada

2025-06-09T22:59:36+00:00 ― 8 min lire

Robotique Avancées dans la ré-identification d'objets pour la robotique

Une nouvelle approche à double voie améliore la reconnaissance des objets pour les robots dans des environnements difficiles.

Aneesh Chavan, Vaibhav Agrawal, Vineeth Bhat

2025-06-09T22:43:48+00:00 ― 7 min lire

Apprentissage automatique Améliorer les techniques de détection des données hors distribution

Un aperçu des méthodes pour détecter des données inattendues dans les modèles d'IA.

Shuo Lu, Yingsheng Wang, Lijun Sheng

2025-06-09T20:53:12+00:00 ― 8 min lire

Robotique Avancer l'ajustement de paquets photométriques pour des surfaces complexes

Une nouvelle méthode améliore l'estimation de la position de la caméra dans des conditions d'éclairage et de surface difficiles.

Lei Cheng, Junpeng Hu, Haodong Yan

2025-06-09T20:13:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage incrémental par classe avec peu d'exemples

Une nouvelle méthode améliore l'apprentissage de nouvelles classes avec peu de données.

Ye Wang, Yaxiong Wang, Guoshuai Zhao

2025-06-09T19:02:36+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes RockTrack : Améliorer le suivi d'objets 3D avec des systèmes multi-caméras

RockTrack améliore le suivi d'objets 3D avec flexibilité et précision dans différents environnements.

Xiaoyu Li, Peidong Li, Lijun Zhao

2025-06-09T18:31:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Mesurer la valeur d'une image avec la 'featureness'

Un nouveau concept évalue l'utilité des caractéristiques d'image pour améliorer les tâches de vision par ordinateur.

Yash Turkar, Timothy Chase, Christo Aluckal

2025-06-09T15:45:06+00:00 ― 8 min lire

Robotique Avancées dans la technologie SLAM avec MGSO

MGSO améliore la cartographie en temps réel et la localisation pour les robots en utilisant une technologie à caméra unique.

Yan Song Hu, Nicolas Abboud, Muhammad Qasim Ali

2025-06-09T13:30:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Réduire les hallucinations dans l'analyse de trafic avec SelfCheckGPT

Cette recherche teste un outil pour améliorer la précision des modèles de langage basés sur le trafic.

Malsha Ashani Mahawatta Dona, Beatriz Cabrero-Daniel, Yinan Yu

2025-06-09T06:40:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection des relations visuelles en vidéo

Un nouveau cadre améliore la détection des relations entre objets dans les vidéos, rendant ça plus précis et adaptable.

Yongqi Wang, Shuo Yang, Xinxiao Wu

2025-06-09T05:44:42+00:00 ― 8 min lire