Derniers articles pour Vision par ordinateur

Traitement de l'image et de la vidéo Optimiser le codage d'images pour l'IA et les humains

Explorer des méthodes pour améliorer le codage d'images pour des applis IA avancées.

2025-11-09T07:07:31+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore la précision de l'estimation de la pose humaine

Une technique pour repérer l'instabilité dans la reconstruction de maillages du corps humain.

2025-11-09T06:58:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes VoxDet : Faire avancer la reconnaissance d'objets avec des modèles 3D

VoxDet améliore la reconnaissance d'objets en utilisant des modèles 3D pour gérer des scènes complexes.

2025-11-09T06:43:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation de vidéo par instance avec GRAtt

GRAtt améliore l'efficacité du suivi dans des tâches de segmentation vidéo difficiles.

2025-11-09T05:08:18+00:00 ― 7 min lire

Apprentissage automatique Réseaux de neurones et équivariance de groupe : une plongée profonde

Explorer comment les réseaux de neurones reconnaissent les symétries dans les données grâce à l'équivariance.

2025-11-09T03:41:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de distillation de connaissances

De nouvelles méthodes en distillation de connaissances améliorent l'efficacité de l'entraînement des modèles.

2025-11-09T03:25:36+00:00 ― 8 min lire

Apprentissage automatique Repenser les fonctions d'influence en apprentissage automatique

Analyser les limites et les corrections dans les fonctions d'influence pour améliorer la performance du modèle.

2025-11-09T02:38:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Renaître les techniques de détection d'objets linéaires

Cette étude améliore une méthode classique pour détecter des lignes dans des images de documents.

2025-11-09T02:30:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la reconstruction de scènes 3D avec PlaNeRF

PlaNeRF améliore la modélisation 3D à partir d'images 2D, en améliorant la géométrie et la qualité de l'image.

2025-11-09T01:27:06+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les techniques d'échantillonnage pour des données complexes

Une nouvelle méthode améliore l'échantillonnage de données en utilisant des flux de normalisation et la dynamique de Langevin.

2025-11-08T23:59:40+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de généralisation des domaines

De nouvelles méthodes améliorent la capacité des modèles d'apprentissage automatique à gérer des données inconnues.

2025-11-08T22:25:24+00:00 ― 7 min lire

Neurones et cognition Aligner les CNN avec le traitement visuel biologique

La recherche intègre des principes biologiques dans les CNN pour améliorer l'analyse d'images.

2025-11-08T21:26:09+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour répondre aux questions visuelles

Présentation d'une méthode modulaire pour la réponse visuelle à des questions sans apprentissage préalable.

2025-11-08T19:07:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'objets dans les cadres vidéo

Une nouvelle méthode vise à améliorer la précision de la localisation d'objets dans l'analyse vidéo.

2025-11-08T18:36:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour l'apprentissage d'images et de légendes

Cette méthode améliore la façon dont les ordis relient les images avec les légendes.

2025-11-08T17:56:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de super-résolution d'images

Une nouvelle méthode améliore la qualité d'image en utilisant des données haute résolution limitées.

2025-11-08T17:09:24+00:00 ― 7 min lire

Calcul et langage Améliorer l'analyse des graphes de scènes avec FACTUAL-MR

Un nouveau jeu de données améliore le parsing des graphes de scènes pour de meilleures connexions entre images et textes.

2025-11-08T17:01:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Révolutionner l'estimation du flux de scène avec GMSF

GMSF propose une nouvelle façon d'estimer le mouvement dans l'espace 3D.

2025-11-08T15:34:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconstruction d'objets réfléchissants

De nouvelles méthodes améliorent la reconstruction 3D des surfaces réfléchissantes en utilisant des techniques de rendu neural.

2025-11-08T14:31:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Examiner le rôle de la requête dans les Transformers

Cet article explore la nécessité du composant de requête dans les modèles de transformateurs.

2025-11-08T12:17:06+00:00 ― 4 min lire

Apprentissage automatique Avancer les techniques de génération de données croisées

Un nouveau modèle améliore la génération de données à partir de plusieurs types d'entrée.

2025-11-08T11:45:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes T2FNorm : Une nouvelle approche pour la détection OOD

T2FNorm améliore la capacité des réseaux de neurones à détecter des données inconnues.

2025-11-08T09:15:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Un guide pratique sur YOLO pour la détection d'objets

Découvre le YOLO pour la détection d'objets en temps réel.

2025-11-08T09:07:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Construire un système de détection de roues de véhicule avec YOLOv5

Apprends à créer un système qui identifie les roues de véhicules dans différentes conditions.

2025-11-08T08:59:36+00:00 ― 8 min lire

Robotique Faire avancer l'apprentissage des robots avec des données visuelles

Les chercheurs utilisent des images pour apprendre aux robots comment interagir avec le monde.

2025-11-08T08:51:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'objets 3D pour les voitures autonomes

Un nouveau cadre améliore la précision de la localisation d'objets 3D avec une seule caméra.

2025-11-08T08:20:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'apprentissage profond : La logique dans les illusions visuelles

Cette étude examine comment les modèles d'apprentissage profond interprètent la logique dans les diagrammes en utilisant des illusions visuelles.

2025-11-08T07:56:24+00:00 ― 8 min lire

Calcul et langage HaVQA : Faire avancer la langue haoussa dans l'IA

Nouveau jeu de données améliore la capacité de questions sur les images dans le traitement de la langue hausa.

2025-11-08T07:09:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de Caterpillar : Une nouvelle approche en vision par ordinateur

Caterpillar est une nouvelle architecture MLP pour capturer les détails locaux des images.

2025-11-08T06:13:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Optimiser la performance des CNN 3D sur les appareils FPGA

Une nouvelle méthode pour faire tourner le modèle X3D sur des FPGA pour une analyse vidéo efficace.

2025-11-08T05:34:12+00:00 ― 8 min lire

Apprentissage automatique Exploiter les modèles de diffusion pour l'entraînement des modèles génératifs

Un cadre pour améliorer les modèles génératifs en utilisant des modèles de diffusion pré-entraînés.

2025-11-08T05:10:30+00:00 ― 10 min lire

Apprentissage automatique Combiner des méthodes de noyau et du deep learning

Une nouvelle approche combine les méthodes par noyau avec l'apprentissage profond pour de meilleures performances.

2025-11-08T04:48:08+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec les retours de CLIP

Une nouvelle méthode améliore les modèles vision-langage grâce à des retours en temps réel pour de meilleures performances.

2025-11-08T04:38:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la compréhension des documents avec LayoutMask

LayoutMask améliore l'interaction entre le texte et la mise en page pour une meilleure compréhension des documents.

2025-11-08T03:35:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération efficace de graphes de scènes

Une nouvelle approche pour améliorer la génération de graphes de scènes pour une meilleure compréhension visuelle.

2025-11-08T02:08:48+00:00 ― 13 min lire

Vision par ordinateur et reconnaissance des formes Présentation de PaLI-X : Un nouveau modèle vision-langage

PaLI-X combine des compétences en vision et en langage, excelle dans plein de tâches différentes.

2025-11-08T00:34:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des méthodes pour reconnaître des formes 3D rotatives

Cette étude évalue différentes techniques pour détecter des formes 3D en rotation.

2025-11-08T00:18:12+00:00 ― 10 min lire

Apprentissage automatique Avancées dans les Réseaux de Groupes Linéaires

De nouveaux réseaux de neurones apprennent les transformations directement à partir des données, ce qui améliore l'efficacité et la compréhension des symétries.

2025-11-07T23:54:30+00:00 ― 9 min lire

Calcul et langage SlimFit : Une solution pour les soucis de mémoire des modèles Transformer

SlimFit réduit l'utilisation de mémoire pour les modèles de transformeurs pendant le fine-tuning.

2025-11-07T23:38:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes LaFTer : Une nouvelle approche des modèles de vision et de langage

Cette méthode améliore les modèles de vision et de langage sans avoir besoin d'images étiquetées.

2025-11-07T21:56:00+00:00 ― 8 min lire