Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes Révolutionner l'estimation du flux de scène avec GMSF

GMSF propose une nouvelle façon d'estimer le mouvement dans l'espace 3D.

2025-11-08T15:34:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconstruction d'objets réfléchissants

De nouvelles méthodes améliorent la reconstruction 3D des surfaces réfléchissantes en utilisant des techniques de rendu neural.

2025-11-08T14:31:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Examiner le rôle de la requête dans les Transformers

Cet article explore la nécessité du composant de requête dans les modèles de transformateurs.

2025-11-08T12:17:06+00:00 ― 4 min lire

Apprentissage automatique Avancer les techniques de génération de données croisées

Un nouveau modèle améliore la génération de données à partir de plusieurs types d'entrée.

2025-11-08T11:45:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes T2FNorm : Une nouvelle approche pour la détection OOD

T2FNorm améliore la capacité des réseaux de neurones à détecter des données inconnues.

2025-11-08T09:15:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Un guide pratique sur YOLO pour la détection d'objets

Découvre le YOLO pour la détection d'objets en temps réel.

2025-11-08T09:07:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Construire un système de détection de roues de véhicule avec YOLOv5

Apprends à créer un système qui identifie les roues de véhicules dans différentes conditions.

2025-11-08T08:59:36+00:00 ― 8 min lire

Robotique Faire avancer l'apprentissage des robots avec des données visuelles

Les chercheurs utilisent des images pour apprendre aux robots comment interagir avec le monde.

2025-11-08T08:51:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'objets 3D pour les voitures autonomes

Un nouveau cadre améliore la précision de la localisation d'objets 3D avec une seule caméra.

2025-11-08T08:20:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'apprentissage profond : La logique dans les illusions visuelles

Cette étude examine comment les modèles d'apprentissage profond interprètent la logique dans les diagrammes en utilisant des illusions visuelles.

2025-11-08T07:56:24+00:00 ― 8 min lire

Calcul et langage HaVQA : Faire avancer la langue haoussa dans l'IA

Nouveau jeu de données améliore la capacité de questions sur les images dans le traitement de la langue hausa.

2025-11-08T07:09:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de Caterpillar : Une nouvelle approche en vision par ordinateur

Caterpillar est une nouvelle architecture MLP pour capturer les détails locaux des images.

2025-11-08T06:13:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Optimiser la performance des CNN 3D sur les appareils FPGA

Une nouvelle méthode pour faire tourner le modèle X3D sur des FPGA pour une analyse vidéo efficace.

2025-11-08T05:34:12+00:00 ― 8 min lire

Apprentissage automatique Exploiter les modèles de diffusion pour l'entraînement des modèles génératifs

Un cadre pour améliorer les modèles génératifs en utilisant des modèles de diffusion pré-entraînés.

2025-11-08T05:10:30+00:00 ― 10 min lire

Apprentissage automatique Combiner des méthodes de noyau et du deep learning

Une nouvelle approche combine les méthodes par noyau avec l'apprentissage profond pour de meilleures performances.

2025-11-08T04:48:08+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec les retours de CLIP

Une nouvelle méthode améliore les modèles vision-langage grâce à des retours en temps réel pour de meilleures performances.

2025-11-08T04:38:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la compréhension des documents avec LayoutMask

LayoutMask améliore l'interaction entre le texte et la mise en page pour une meilleure compréhension des documents.

2025-11-08T03:35:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération efficace de graphes de scènes

Une nouvelle approche pour améliorer la génération de graphes de scènes pour une meilleure compréhension visuelle.

2025-11-08T02:08:48+00:00 ― 13 min lire

Vision par ordinateur et reconnaissance des formes Présentation de PaLI-X : Un nouveau modèle vision-langage

PaLI-X combine des compétences en vision et en langage, excelle dans plein de tâches différentes.

2025-11-08T00:34:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des méthodes pour reconnaître des formes 3D rotatives

Cette étude évalue différentes techniques pour détecter des formes 3D en rotation.

2025-11-08T00:18:12+00:00 ― 10 min lire

Apprentissage automatique Avancées dans les Réseaux de Groupes Linéaires

De nouveaux réseaux de neurones apprennent les transformations directement à partir des données, ce qui améliore l'efficacité et la compréhension des symétries.

2025-11-07T23:54:30+00:00 ― 9 min lire

Calcul et langage SlimFit : Une solution pour les soucis de mémoire des modèles Transformer

SlimFit réduit l'utilisation de mémoire pour les modèles de transformeurs pendant le fine-tuning.

2025-11-07T23:38:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes LaFTer : Une nouvelle approche des modèles de vision et de langage

Cette méthode améliore les modèles de vision et de langage sans avoir besoin d'images étiquetées.

2025-11-07T21:56:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'objets avec une compréhension contextuelle

Une nouvelle méthode améliore la capacité des modèles d'IA à détecter des objets en utilisant le contexte.

2025-11-07T21:48:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Vision Transformers avec un taux de compression différentiable

Une méthode pour améliorer l'efficacité des transformateurs de vision sans sacrifier la performance.

2025-11-07T18:06:54+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage zéro-shot compositionnel

Nouvelle approche qui améliore la façon dont l'IA reconnaît les combinaisons uniques d'attributs et d'objets.

2025-11-07T17:35:18+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes ReSup : Une nouvelle approche pour les étiquettes bruyantes dans la reconnaissance des expressions faciales

ReSup améliore la reconnaissance des émotions en gérant efficacement les étiquettes bruyantes.

2025-11-07T16:40:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la correspondance dense grâce à la diffusion conditionnelle

Nouveau cadre améliore la correspondance d'images pour des applis variées en vision par ordinateur.

2025-11-07T15:28:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes multi-caméras pour véhicules autonomes

Occ-BEV améliore la perception des véhicules grâce à une modélisation 3D multi-caméra et à l'intégration de données.

2025-11-07T14:57:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Réduire la taille des Vision Transformers pour une utilisation mobile

Une revue des petits Vision Transformers adaptés aux applis mobiles.

2025-11-07T12:03:30+00:00 ― 7 min lire

Apprentissage automatique Améliorer l'analyse de données avec un pooling global invariant au groupe

Une nouvelle méthode améliore la façon dont on traite les données complexes en reconnaissant les symétries.

2025-11-07T10:36:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la reconstruction 3D avec peu d'images

Une nouvelle méthode combine NeRF et MDE pour améliorer la modélisation 3D à partir de quelques images.

2025-11-07T10:20:48+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Tester des modèles de vision par ordinateur pour des défis du monde réel

Des méthodes innovantes révèlent des failles dans les modèles de reconnaissance d'images.

2025-11-07T09:41:18+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Présentation de DisCLIP : Une nouvelle approche pour la génération d'expressions référentielles

DisCLIP améliore la précision des descriptions d'images en utilisant des modèles visuels-linguistiques avancés.

2025-11-07T08:53:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Un nouveau modèle pour le traitement des données multi-modales

Présentation d'un modèle qui intègre différents types de données pour des tâches complexes.

2025-11-07T05:13:30+00:00 ― 7 min lire

Calcul et langage Faire avancer la question-réponse visuelle avec une nouvelle approche

Une nouvelle méthode améliore la précision de la réponse à des questions visuelles en utilisant des connaissances externes.

2025-11-07T05:12:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans l'estimation de la pose humaine à partir de vidéos

Une nouvelle méthode améliore la précision pour estimer les poses humaines à partir de vidéos.

2025-11-07T04:25:18+00:00 ― 7 min lire

Apprentissage automatique S'attaquer à la reconnaissance à longue traîne avec WCDAS

Une nouvelle méthode améliore la précision pour reconnaître des classes moins courantes dans des ensembles de données déséquilibrés.

2025-11-07T03:53:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'adaptation de domaine avec VAEGAN

Un nouveau modèle s'attaque aux défis de l'adaptation de domaine pour l'apprentissage automatique.

2025-11-07T02:11:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la reconnaissance de l'écriture manuscrite en bangla

Une nouvelle méthode améliore la précision de la reconnaissance de l'écriture manuscrite en bangla.

2025-11-07T01:55:12+00:00 ― 6 min lire