Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes Améliorer la reconnaissance visuelle des lieux avec une vue d'oiseau

La vue d'ensemble améliore la reconnaissance visuelle des lieux pour une meilleure précision dans la conduite autonome.

2025-11-11T15:35:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à un flare intense dans la reconnaissance de véhicules

FACENet améliore l'identification des véhicules dans des conditions d'éclairage difficiles.

2025-11-11T12:02:36+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancée dans la reconnaissance d'objets 3D et l'estimation de pose

Un modèle unifié améliore l'identification et le positionnement des objets dans l'espace 3D.

2025-11-11T11:38:54+00:00 ― 7 min lire

Apprentissage automatique Comprendre les Réseaux de Neurones Convolutionnels et le Hessien

Un regard plus proche sur les CNN et leur fonctionnement interne à travers la matrice Hessienne.

2025-11-11T10:24:20+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance d'entités dans les images de documents

Une nouvelle méthode basée sur des graphes améliore l'extraction d'entités à partir de différents types de documents.

2025-11-11T08:45:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance de comportements vidéo

Explorer des méthodes pour reconnaître des actions humaines dans des vidéos pour différentes applications.

2025-11-11T06:30:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une façon plus simple de segmenter des images

Cette nouvelle méthode réduit l'effort d'annotation en segmentation sémantique.

2025-11-11T04:40:12+00:00 ― 8 min lire

Apprentissage automatique Algorithme Mean Shift : Un outil de clustering flexible

Découvrez le rôle de l'algorithme Mean Shift dans le clustering et l'estimation de mode.

2025-11-11T04:33:52+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le Matching de Caractéristiques Robustes avec RoMa

RoMa améliore la précision de la correspondance des caractéristiques dans des conditions difficiles pour différentes applications.

2025-11-11T02:33:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Matting d'images efficace avec des Vision Transformers

Une nouvelle méthode pour le matting d'images qui allie simplicité et performance.

2025-11-10T23:40:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans les techniques de détection d'anomalies

Des méthodes innovantes utilisant des données synthétiques améliorent la détection d'anomalies dans divers domaines.

2025-11-10T22:36:48+00:00 ― 6 min lire

Calcul et langage Former des modèles pour les expressions référentielles en utilisant des entrées visuelles

Un nouveau jeu de données aide les modèles à générer des expressions de référence à partir d'images.

2025-11-10T19:58:48+00:00 ― 11 min lire

Robotique Avancées dans l'IA incarnée avec EmbodiedGPT

Découvrez les dernières avancées en IA incarnée grâce au modèle EmbodiedGPT.

2025-11-10T17:52:24+00:00 ― 8 min lire

Intelligence artificielle Comprendre la perception du mouvement : Lier l'humain et la machine

De nouveaux modèles imitent la perception du mouvement humain pour améliorer les systèmes artificiels.

2025-11-10T16:41:54+00:00 ― 7 min lire

Apprentissage automatique Avancées dans la découverte d'objets grâce à des autoencodeurs à valeurs complexes

De nouveaux modèles améliorent la façon dont les machines identifient et regroupent les objets dans les images.

2025-11-10T16:33:24+00:00 ― 9 min lire

Apprentissage automatique L'importance de la robustesse non-adverse dans l'apprentissage profond

Apprends comment les modèles de deep learning gardent leur performance dans des conditions réelles variées.

2025-11-10T15:53:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancer la segmentation sémantique avec des données multi-modales

De nouvelles méthodes et ensembles de données améliorent la segmentation d'image pour la télédétection.

2025-11-10T14:03:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la Distillation de Connaissances avec le Framework HARD

Une nouvelle méthode améliore le transfert de connaissances en apprentissage automatique grâce à des augmentations de données.

2025-11-10T13:31:42+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de l'évaluation de la qualité des images faciales pour une meilleure reconnaissance

Une nouvelle méthode améliore la reconnaissance faciale en renforçant l'évaluation de la qualité d'image.

2025-11-10T12:20:36+00:00 ― 6 min lire

Calcul et langage Avancement des Modèles Vision-Langage pour les Tâches Multilingues

La recherche améliore la performance des modèles pour les langues à faibles ressources en utilisant l'apprentissage par méta.

2025-11-10T12:04:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Transformateurs de Vision avec le Filtrage de Tokens

Une nouvelle méthode améliore l'efficacité des Vision Transformers grâce à un filtrage de tokens efficace.

2025-11-10T11:56:54+00:00 ― 6 min lire

Analyse classique et EDO Drapeaux et Pliages de Drapeaux : Nouveaux Outils pour l'Analyse de Données

Explore les concepts de drapeaux et de pliage de drapeaux pour analyser des structures de données complexes.

2025-11-10T11:52:32+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes CascadeMatch : Faire avancer la détection d'objets grâce à l'apprentissage semi-supervisé

Une nouvelle méthode améliore la détection d'objets avec des données étiquetées et non étiquetées.

2025-11-10T11:33:12+00:00 ― 10 min lire

Calcul et langage Biais de genre dans les métriques de légende d'image

Examiner comment le biais de genre influence les métriques d'évaluation dans la légende d'image.

2025-11-10T09:03:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes ALGO : Une nouvelle approche pour la reconnaissance d'activités vidéo

ALGO identifie des activités dans les vidéos sans avoir besoin d'étiquettes prédéfinies.

2025-11-10T07:59:54+00:00 ― 9 min lire

Apprentissage automatique Un aperçu de l'apprentissage profond et de l'apprentissage profond géométrique

Explore les bases et les applications de l'apprentissage profond et de sa variante géométrique.

2025-11-10T07:59:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de MixFormerV2 : Une nouvelle ère dans le suivi d'objets

MixFormerV2 combine des transformers pour un suivi d'objets efficace et précis dans des applis en temps réel.

2025-11-10T06:25:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Défis et innovations dans l'estimation de pose d'objet 6D

Explorer les méthodes et défis actuels dans la technologie d'estimation de pose d'objet en 6D.

2025-11-10T06:17:12+00:00 ― 8 min lire

Apprentissage automatique Avancées dans l'interaction des portes robotiques

Cette étude explore une nouvelle méthode pour que les robots gèrent les portes en utilisant des données visuelles.

2025-11-10T02:51:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes EgoHumans : Faire avancer le suivi 3D des humains

Un nouveau jeu de données et une méthode améliorent l'analyse 3D des mouvements humains.

2025-11-10T01:24:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la classification avec l'augmentation d'images guidée par le langage

Cette méthode améliore les données d'entraînement en utilisant des descriptions de langue pour générer des variations d'images.

2025-11-09T22:39:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Occupance de vocabulaire ouvert : une nouvelle approche pour comprendre les scènes 3D

OVO permet une prédiction flexible de l'occupation des objets en 3D sans avoir besoin d'un gros étiquetage.

2025-11-09T20:56:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Prédire des actions dans des vidéos égocentriques

Une nouvelle méthode améliore la prédiction d'actions dans des vidéos égocentriques en utilisant une attention guidée.

2025-11-09T20:16:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Distillation de Connaissances Triplette : Une Nouvelle Approche pour l'Entraînement des Modèles

Présentation d'une méthode efficace pour le transfert de connaissances dans les modèles de machine learning.

2025-11-09T19:05:42+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les autoencodeurs multimodaux en utilisant des modèles basés sur les scores

Une nouvelle méthode améliore la génération de données multimodales et leur cohérence.

2025-11-09T14:13:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie d'inspection des coques de navires sous-marins

L'analyse vidéo automatique améliore les inspections sous-marines des navires grâce à des modèles avancés.

2025-11-09T09:52:42+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes DynaShare : Une approche flexible pour l'apprentissage multitâche

DynaShare adapte le partage de modèles pour améliorer les performances sur plusieurs tâches.

2025-11-09T08:33:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'estimation de pose avec i-SRN

i-SRN améliore l'estimation de pose pour les robots en utilisant des représentations implicites et le rendu neural.

2025-11-09T07:22:36+00:00 ― 7 min lire

Traitement de l'image et de la vidéo Optimiser le codage d'images pour l'IA et les humains

Explorer des méthodes pour améliorer le codage d'images pour des applis IA avancées.

2025-11-09T07:07:31+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore la précision de l'estimation de la pose humaine

Une technique pour repérer l'instabilité dans la reconstruction de maillages du corps humain.

2025-11-09T06:58:54+00:00 ― 7 min lire