Derniers articles pour Vision par ordinateur

Calcul et langage SlimFit : Une solution pour les soucis de mémoire des modèles Transformer

SlimFit réduit l'utilisation de mémoire pour les modèles de transformeurs pendant le fine-tuning.

2025-11-07T23:38:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes LaFTer : Une nouvelle approche des modèles de vision et de langage

Cette méthode améliore les modèles de vision et de langage sans avoir besoin d'images étiquetées.

2025-11-07T21:56:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'objets avec une compréhension contextuelle

Une nouvelle méthode améliore la capacité des modèles d'IA à détecter des objets en utilisant le contexte.

2025-11-07T21:48:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Vision Transformers avec un taux de compression différentiable

Une méthode pour améliorer l'efficacité des transformateurs de vision sans sacrifier la performance.

2025-11-07T18:06:54+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage zéro-shot compositionnel

Nouvelle approche qui améliore la façon dont l'IA reconnaît les combinaisons uniques d'attributs et d'objets.

2025-11-07T17:35:18+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes ReSup : Une nouvelle approche pour les étiquettes bruyantes dans la reconnaissance des expressions faciales

ReSup améliore la reconnaissance des émotions en gérant efficacement les étiquettes bruyantes.

2025-11-07T16:40:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la correspondance dense grâce à la diffusion conditionnelle

Nouveau cadre améliore la correspondance d'images pour des applis variées en vision par ordinateur.

2025-11-07T15:28:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes multi-caméras pour véhicules autonomes

Occ-BEV améliore la perception des véhicules grâce à une modélisation 3D multi-caméra et à l'intégration de données.

2025-11-07T14:57:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Réduire la taille des Vision Transformers pour une utilisation mobile

Une revue des petits Vision Transformers adaptés aux applis mobiles.

2025-11-07T12:03:30+00:00 ― 7 min lire

Apprentissage automatique Améliorer l'analyse de données avec un pooling global invariant au groupe

Une nouvelle méthode améliore la façon dont on traite les données complexes en reconnaissant les symétries.

2025-11-07T10:36:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la reconstruction 3D avec peu d'images

Une nouvelle méthode combine NeRF et MDE pour améliorer la modélisation 3D à partir de quelques images.

2025-11-07T10:20:48+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Tester des modèles de vision par ordinateur pour des défis du monde réel

Des méthodes innovantes révèlent des failles dans les modèles de reconnaissance d'images.

2025-11-07T09:41:18+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Présentation de DisCLIP : Une nouvelle approche pour la génération d'expressions référentielles

DisCLIP améliore la précision des descriptions d'images en utilisant des modèles visuels-linguistiques avancés.

2025-11-07T08:53:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Un nouveau modèle pour le traitement des données multi-modales

Présentation d'un modèle qui intègre différents types de données pour des tâches complexes.

2025-11-07T05:13:30+00:00 ― 7 min lire

Calcul et langage Faire avancer la question-réponse visuelle avec une nouvelle approche

Une nouvelle méthode améliore la précision de la réponse à des questions visuelles en utilisant des connaissances externes.

2025-11-07T05:12:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans l'estimation de la pose humaine à partir de vidéos

Une nouvelle méthode améliore la précision pour estimer les poses humaines à partir de vidéos.

2025-11-07T04:25:18+00:00 ― 7 min lire

Apprentissage automatique S'attaquer à la reconnaissance à longue traîne avec WCDAS

Une nouvelle méthode améliore la précision pour reconnaître des classes moins courantes dans des ensembles de données déséquilibrés.

2025-11-07T03:53:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'adaptation de domaine avec VAEGAN

Un nouveau modèle s'attaque aux défis de l'adaptation de domaine pour l'apprentissage automatique.

2025-11-07T02:11:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la reconnaissance de l'écriture manuscrite en bangla

Une nouvelle méthode améliore la précision de la reconnaissance de l'écriture manuscrite en bangla.

2025-11-07T01:55:12+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'apprentissage auto-supervisé avec la prise en compte des augmentations

Une nouvelle approche améliore l'apprentissage auto-supervisé en se concentrant sur les augmentations de données.

2025-11-07T01:47:18+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Transformer des images infrarouges thermiques en images colorées de jour

Un nouveau modèle améliore la traduction des images thermiques nocturnes en couleurs de jour.

2025-11-07T01:10:35+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées en apprentissage automatique grâce à l'algèbre des invites

Des chercheurs combinent des instructions pour améliorer les modèles d'apprentissage automatique pour différentes tâches.

2025-11-07T00:44:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'estimation de la pose des objets avec des Vision Transformers

Explorer l'impact des Vision Transformers sur la précision de l'estimation de la pose d'objet.

2025-11-06T22:29:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancer la modélisation et le suivi 3D des humains

Une nouvelle méthode améliore la modélisation 3D et le suivi des figures humaines dans les images et les vidéos.

2025-11-06T21:50:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la formation des IA grâce à la qualité des données

De nouvelles méthodes montrent que des ensembles de données plus petits et de haute qualité donnent de meilleures performances en IA.

2025-11-06T21:42:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Apprentissage profond et détection du cancer du sein

Comment l'IA aide à identifier le cancer du sein à travers des images médicales.

2025-11-06T21:18:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes LOWA : Faire avancer la détection d'objets avec des traits

LOWA améliore la détection d'objets en se concentrant sur les traits et des descriptions flexibles.

2025-11-06T20:39:12+00:00 ― 7 min lire

Apprentissage automatique Comprendre l'Extracteur et le Tunnel dans les Réseaux Profonds

Cet article examine comment fonctionnent les réseaux profonds à travers l'extracteur et le tunnel.

2025-11-06T16:42:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la récupération de surface grâce aux techniques de réfraction

Nouvelles méthodes simplifient la récupération de la forme de surface à partir d'une seule image.

2025-11-06T16:10:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans l'apprentissage profond économe en données

Les ateliers VIPriors mettent en avant des approches innovantes pour entraîner des modèles avec peu de données.

2025-11-06T14:59:30+00:00 ― 6 min lire

Apprentissage automatique L'impact du deep learning sur le traitement des signaux d'image

Examiner comment l'apprentissage profond révolutionne les techniques de traitement d'images.

2025-11-06T14:39:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer aux biais dans la réponse à des questions visuelles

Une nouvelle approche s'attaque aux biais linguistiques et visuels dans les systèmes VQA.

2025-11-06T14:27:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage de scènes 3D avec Point-GCC

Point-GCC améliore la compréhension des scènes 3D grâce à l'intégration de la géométrie et de la couleur.

2025-11-06T13:56:18+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Amélioration de l'analyse d'image avec l'attribution d'échelle de wavelet

Une nouvelle méthode améliore la compréhension des modèles d'apprentissage profond dans la classification d'images.

2025-11-06T13:35:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation d'objets avec la localité spatiale

Une nouvelle méthode améliore la façon dont les machines reconnaissent et segmentent les objets dans les images.

2025-11-06T13:01:00+00:00 ― 8 min lire

Apprentissage automatique UnMixMatch : Faire avancer l'apprentissage semi-supervisé

UnMixMatch améliore l'apprentissage en utilisant efficacement des données étiquetées et non étiquetées.

2025-11-06T12:45:12+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le Fine-Tuning pour les Modèles Vision-Langage

CoPrompt améliore l'entraînement des modèles tout en évitant le surapprentissage et en maintenant la généralisation.

2025-11-06T12:37:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes CDFormer : Faire avancer l'analyse de nuages de points

Une nouvelle méthode pour mieux comprendre les données de nuages de points 3D en utilisant des transformeurs.

2025-11-06T09:51:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage semi-supervisé pour la reconnaissance des expressions faciales

Cette étude examine les méthodes semi-supervisées pour améliorer la précision de la reconnaissance des expressions faciales.

2025-11-06T09:19:48+00:00 ― 10 min lire

Robotique Avancées dans les techniques d'estimation de la pose des objets

Une nouvelle méthode améliore l'estimation de la pose des objets grâce à une approche probabiliste sans appariement.

2025-11-06T04:11:42+00:00 ― 7 min lire