Derniers articles pour Vision par ordinateur

Vision par ordinateur et reconnaissance des formes Présentation de gsplat : une nouvelle bibliothèque open-source pour le splatting gaussien 3D

gsplat simplifie le Gaussian Splatting pour créer des images 3D de manière efficace.

2025-06-14T11:13:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancer la reconnaissance machine des objets dynamiques

Une nouvelle méthode permet aux machines de modéliser avec précision des formes en mouvement et qui changent.

2025-06-14T11:05:30+00:00 ― 9 min lire

Analyse des EDP Comparaison d'images avancée avec des modèles d'élasticité non linéaire

Cet article parle des méthodes pour comparer des images en utilisant des modèles d'élasticité non linéaire.

2025-06-14T10:41:58+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'estimation de la pose des objets avec des modèles CAO

Utiliser des modèles CAO peut améliorer l'estimation de la pose des robots en gérant les incertitudes.

2025-06-14T10:10:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la localisation des robots avec les infos des caméras RGB-D

Une méthode pour améliorer la compréhension des robots des composants de bâtiment en utilisant des données RGB-D.

2025-06-14T09:22:48+00:00 ― 5 min lire

Apprentissage automatique Évaluer l'apprentissage auto-supervisé avec des données non étiquetées

De nouvelles métriques aident à évaluer les méthodes SSL en utilisant des données non étiquetées de manière efficace.

2025-06-14T08:19:36+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation d'images avec Seg-HGNN

Seg-HGNN améliore la segmentation d'image en utilisant des réseaux de neurones graphiques hyperboliques.

2025-06-14T07:40:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Transtreaming : Faire avancer la détection d'objets en temps réel

Une nouvelle méthode améliore la détection d'objets dans les applis en temps réel.

2025-06-14T07:24:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Comprendre les modèles CLIP : une nouvelle approche

Cet article dévoile des méthodes pour interpréter des modèles comme CLIP en IA.

2025-06-14T07:16:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Aligner l'IA à la compréhension visuelle humaine

Un cadre pour améliorer la performance de l'IA dans les tâches visuelles en imitant les jugements humains.

2025-06-14T06:13:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation d'objets inconnus dans les systèmes d'IA

Un nouveau module améliore la segmentation des objets inconnus sans avoir à réentraîner les modèles de base.

2025-06-14T05:17:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de Texture-AD : un nouveau benchmark pour la détection d'anomalies dans les usines

Le dataset Texture-AD comble les lacunes de données dans la détection d'anomalies industrielles.

2025-06-14T04:14:42+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Évaluer le Seam Carving comme une méthode de pooling dans les CNN

Cette étude propose le seam carving pour améliorer la classification d’images dans les CNN.

2025-06-14T03:27:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation à peu d'exemples avec des modèles de base

Ce cadre améliore la performance de segmentation avec moins d'exemples et une utilisation efficace du modèle.

2025-06-14T03:19:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'estimation de profondeur pour la chirurgie endoscopique

Une nouvelle méthode améliore l'estimation de la profondeur dans les images endoscopiques pour de meilleurs résultats chirurgicaux.

2025-06-14T00:25:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les machines de Turing avec Vision Token

ViTTM améliore le traitement d'image grâce à des mécanismes innovants basés sur des tokens.

2025-06-13T22:03:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Équilibrer la performance du modèle avec la perte de similarité

Une méthode pour améliorer l'adaptabilité des modèles tout en préservant leurs compétences originales.

2025-06-13T21:16:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Adaptation de Modèle Efficace avec Réseaux Auto-Masquants

Une nouvelle méthode pour adapter des modèles d'IA avec peu de données étiquetées.

2025-06-13T20:52:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Transformers pour une détection d'objets efficace

ENACT améliore l'efficacité des modèles de transformateurs dans la détection d'objets tout en gardant la précision.

2025-06-13T20:12:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la réponse à des questions visuelles avec RACC

RACC optimise la recherche de connaissances pour des réponses visuelles aux questions plus efficaces.

2025-06-13T17:50:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la prédiction de saillance avec des techniques de données améliorées

De nouvelles méthodes améliorent la prédiction de saillance grâce à des modifications d'image contrôlées.

2025-06-13T17:19:00+00:00 ― 8 min lire

Apprentissage automatique Faire avancer l'apprentissage automatique avec des techniques semi-supervisées et contrastives

Explore les avantages de combiner l'apprentissage semi-supervisé et l'apprentissage par contraste en apprentissage automatique.

2025-06-13T17:03:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie de l'échange de visages réaliste

Une nouvelle méthode améliore la qualité et le réalisme des échanges de visages.

2025-06-13T16:23:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la vision robotique avec des modèles 3D à partir d'une seule image

Une nouvelle méthode permet aux robots de créer des modèles 3D à partir d'une seule image.

2025-06-13T16:00:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode pour créer des ensembles de données image-texte en télédétection

Un méthode automatise la génération de paires image-texte pour les ensembles de données de télédétection.

2025-06-13T11:31:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Fusion de poids adaptative : Une nouvelle approche de l'apprentissage incrémental

AWF améliore la segmentation sémantique en empêchant l'oubli catastrophique dans les modèles d'apprentissage machine.

2025-06-13T10:04:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation à vocabulaire ouvert avec des modèles vision-langage

De nouveaux adaptateurs améliorent les capacités de segmentation d'image des modèles vision-langage.

2025-06-13T09:01:18+00:00 ― 9 min lire

Apprentissage automatique Avancées des modèles de diffusion grâce à l'apprentissage par renforcement

Un nouveau cadre cherche à améliorer la génération d'images en utilisant des retours humains.

2025-06-13T07:34:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'apprentissage continu pour les nuages de points 3D

Un nouveau cadre améliore l'apprentissage des modèles en 3D avec la sélection d'exemples.

2025-06-13T07:18:36+00:00 ― 7 min lire

Intelligence artificielle Nouvelle méthode pour un apprentissage automatique rapide

Les machines peuvent maintenant apprendre avec moins d'exemples grâce à des techniques innovantes.

2025-06-13T07:02:48+00:00 ― 8 min lire

Robotique Apprendre aux robots à manipuler des objets grâce à l'apprentissage vidéo

Une nouvelle méthode aide les robots à apprendre des compétences de manipulation à partir de vidéos humaines.

2025-06-13T06:39:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la synthèse texte-image

Une nouvelle méthode améliore la précision de génération d'images avec plusieurs objets.

2025-06-13T06:07:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec un alignement compositionnel

Une nouvelle approche affine la connexion entre les images et le texte dans les VLMs.

2025-06-13T05:12:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la stylisation d'images de portrait

MagicStyle mélange le contenu de portrait avec des styles artistiques de manière efficace.

2025-06-13T04:01:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de classification Few-Shot

La recherche présente une méthode pour améliorer la reconnaissance d'images en utilisant moins d'exemples.

2025-06-13T01:15:12+00:00 ― 8 min lire

Apprentissage automatique Intégration des factorisations tensorielle et des représentations de circuits pour des données complexes

Explore comment combiner des factorisations de tenseurs et des représentations de circuits améliore la modélisation des données.

2025-06-13T00:27:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer au changement de distribution en apprentissage automatique

De nouvelles méthodes aident à comprendre comment les modèles réagissent aux changements de données.

2025-06-13T00:12:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes YOLOv9 : Avancées dans la technologie de détection d'objets

YOLOv9 améliore la détection d'objets avec une précision et une efficacité accrues.

2025-06-12T21:41:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore le questionnement vidéo

Une nouvelle approche utilisant des images en grille améliore les performances de VideoQA sur des tâches complexes.

2025-06-12T20:22:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes de questions-réponses vidéo

Une nouvelle méthode améliore la réponse aux questions vidéo en se concentrant sur les événements multi-objets.

2025-06-12T20:15:00+00:00 ― 7 min lire