Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de reconstruction 3D

Créer des modèles 3D détaillés en utilisant des méthodes d'imagerie avancées pour diverses applications.

2025-11-01T16:37:24+00:00 ― 8 min lire

Apprentissage automatique S'attaquer à la confiance excessive dans les modèles Transformer

Un nouveau modèle réduit la confiance excessive dans les prédictions, garantissant des applications plus sûres.

2025-11-01T15:26:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la clarté dans la visualisation des caractéristiques en deep learning

Une nouvelle méthode améliore la visualisation des caractéristiques des réseaux de neurones pour une meilleure interprétabilité.

2025-11-01T14:23:06+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation vidéo panoptique

Une nouvelle approche intégrée améliore la segmentation des objets dans les vidéos.

2025-11-01T13:19:54+00:00 ― 6 min lire

Apprentissage automatique Faire avancer l'apprentissage automatique avec des techniques de transfert semi-supervisées

Améliorer la performance des modèles en utilisant des stratégies semi-supervisées en machine learning.

2025-11-01T12:40:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Créer des agents intelligents pour l'interaction visuelle

Une méthode pour générer des questions à partir d'images et de légendes pour une meilleure interaction avec l'IA.

2025-11-01T11:45:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées des Vision Transformers avec équivariance de décalage

De nouvelles méthodes améliorent la précision et la cohérence des modèles de reconnaissance d'images.

2025-11-01T07:56:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancer l'entraînement adversarial avec la méthode AROID

Une nouvelle approche utilisant l'augmentation de données instance par instance pour une meilleure robustesse des modèles face aux attaques.

2025-11-01T05:25:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'efficacité de l'analyse d'images avec l'élagage de tokens

Une nouvelle méthode améliore les Vision Transformers pour une meilleure compréhension des images avec moins de ressources.

2025-11-01T03:59:00+00:00 ― 7 min lire

Robotique Optimisation des points de vue dans les systèmes de vision robotique

Une approche structurée pour un positionnement efficace des capteurs dans des tâches de vision robotique.

2025-11-01T02:55:48+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Intégration du contrôle 3D dans les modèles de diffusion

Une nouvelle méthode améliore le réalisme des images grâce au contrôle de la forme 3D dans les modèles de diffusion.

2025-10-31T23:46:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le question-réponse visuel avec des systèmes guidés par l'utilisateur

Le système AVIS améliore la réponse à des questions visuelles grâce à des workflows structurés et des graphiques de transition.

2025-10-31T21:16:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection des piétons avec des caméras événementielles

Explorer le potentiel des caméras événementielles pour améliorer la détection des piétons dans les véhicules autonomes.

2025-10-31T19:22:40+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes GeneCIS : Faire avancer la similarité d'image conditionnelle en vision par ordinateur

Un critère pour évaluer la similitude d'images selon des conditions définies par l'utilisateur.

2025-10-31T19:09:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'estimation de profondeur à partir d'images à double pixel

Une nouvelle méthode améliore l'estimation de la profondeur en utilisant des capteurs à double pixel dans divers appareils d'imagerie.

2025-10-31T18:46:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Reconstruction de modèles 3D à partir d'images 2D

Une méthode pour créer des formes 3D réalistes en utilisant seulement des données 2D.

2025-10-31T18:06:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Méthode améliorée de suppression de texte pour les images

Une nouvelle méthode améliore les techniques de suppression de texte dans les images.

2025-10-31T17:42:48+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Patches adverses : Une menace pour la détection d'objets

Les exemples adversariaux peuvent embrouiller les systèmes de détection d'objets, révélant des failles de sécurité.

2025-10-31T16:47:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes E2E-LOAD : Avancer la détection d'action en temps réel

Un nouveau modèle améliore la vitesse et la précision de détection d'action dans l'analyse vidéo en temps réel.

2025-10-31T15:20:36+00:00 ― 9 min lire

Calcul et langage Comprendre le problème de l'anisotropie dans les Transformers

L'anisotropie affecte la performance des modèles Transformer sur différents types de données.

2025-10-31T14:33:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles de vision et de langage pour mieux comprendre

Une nouvelle méthode améliore la façon dont les modèles comprennent les relations entre les images et le texte.

2025-10-31T12:42:36+00:00 ― 8 min lire

Apprentissage automatique OCAtari : Une nouvelle façon d'apprendre aux machines

OCAtari se concentre sur les objets de jeu pour améliorer l'apprentissage automatique.

2025-10-31T11:55:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la détection de la falsification faciale avec la recherche d'architecture neuronale

Une nouvelle méthode utilise la recherche d'architecture neuronale pour améliorer la détection de falsifications de visages.

2025-10-31T10:20:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes de recherche image-texte

Un nouveau modèle améliore le lien entre les images et leurs descriptions textuelles.

2025-10-31T09:17:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la création d'avatars 3D en tête

Une nouvelle méthode crée des avatars 3D ultra réalistes à partir d'une seule photo.

2025-10-31T08:53:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la génération d'images avec des techniques guidées par les normes

De nouvelles méthodes améliorent la qualité et la vitesse des modèles de texte à image.

2025-10-31T07:26:36+00:00 ― 8 min lire

Calcul et langage Nouvelles méthodes pour enseigner le langage de l'IA à travers des images

Cette étude explore comment l'IA peut apprendre des mots en les reliant à des images.

2025-10-31T07:18:42+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Avancer la reconstruction 3D avec des données RGBD

Une nouvelle méthode prédit des formes 3D à partir d'images RGB uniques en utilisant des données de profondeur.

2025-10-31T07:02:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes TomoSAM : Faire avancer la segmentation d'images 3D

TomoSAM simplifie la segmentation d'images 3D, améliorant l'efficacité et la précision pour les chercheurs.

2025-10-31T06:39:12+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Relier des croquis et des formes 3D

La recherche améliore la reconnaissance des croquis pour un meilleur matching de formes 3D.

2025-10-31T06:15:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection d'objets 3D avec P2D

P2D améliore la détection d'objets 3D dans les voitures autonomes en utilisant la prédiction de mouvement.

2025-10-31T06:07:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Techniques de super-résolution de champ lumineux en avance

De nouvelles méthodes améliorent la qualité des images en utilisant des données de champs lumineux du monde réel.

2025-10-31T04:48:10+00:00 ― 8 min lire

Robotique Avancement de l'odométrie visuelle-inertielle monoculaire avec des caractéristiques du sol

Ground-VIO améliore l'estimation de la pose du véhicule en utilisant les relations caméra-sol.

2025-10-31T02:50:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la reconnaissance d'images avec le Global Advantage Stream

Un nouveau modèle améliore la façon dont les machines reconnaissent les images en mêlant des caractéristiques globales et locales.

2025-10-31T02:34:18+00:00 ― 8 min lire

Multimédia Équilibrer l'apprentissage actif dans des données multimodales

Une nouvelle stratégie garantit une représentation égale des types de données en apprentissage automatique.

2025-10-31T02:02:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la fiabilité des modèles de détection d'objets

Une nouvelle approche pour renforcer la confiance dans la détection d'objets grâce à des techniques de calibration fiables.

2025-10-31T01:23:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Reconstruction de scènes 3D à travers les réflexions des yeux

Une nouvelle méthode montre comment les réflexions des yeux peuvent reconstituer des environnements en 3D.

2025-10-30T23:40:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de MaskDiT : Une nouvelle approche des modèles de diffusion

MaskDiT améliore l'efficacité de l'entraînement des modèles de diffusion tout en gardant la qualité de l'image.

2025-10-30T23:32:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluer la robustesse des modèles de fond visuel dans les tâches de segmentation

Une étude sur la performance des modèles visuels fondamentaux face à des distorsions réelles dans les tâches de segmentation.

2025-10-30T23:24:42+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la classification d'images avec DiffAug

DiffAug améliore les systèmes de reconnaissance d'images grâce à des techniques de bruit innovantes.

2025-10-30T23:01:00+00:00 ― 7 min lire