i-SRN améliore l'estimation de pose pour les robots en utilisant des représentations implicites et le rendu neural.
― 7 min lire
La science de pointe expliquée simplement
i-SRN améliore l'estimation de pose pour les robots en utilisant des représentations implicites et le rendu neural.
― 7 min lire
Explorer des méthodes pour améliorer le codage d'images pour des applis IA avancées.
― 8 min lire
Une technique pour repérer l'instabilité dans la reconstruction de maillages du corps humain.
― 7 min lire
VoxDet améliore la reconnaissance d'objets en utilisant des modèles 3D pour gérer des scènes complexes.
― 8 min lire
GRAtt améliore l'efficacité du suivi dans des tâches de segmentation vidéo difficiles.
― 7 min lire
Explorer comment les réseaux de neurones reconnaissent les symétries dans les données grâce à l'équivariance.
― 9 min lire
De nouvelles méthodes en distillation de connaissances améliorent l'efficacité de l'entraînement des modèles.
― 8 min lire
Analyser les limites et les corrections dans les fonctions d'influence pour améliorer la performance du modèle.
― 7 min lire
Cette étude améliore une méthode classique pour détecter des lignes dans des images de documents.
― 9 min lire
PlaNeRF améliore la modélisation 3D à partir d'images 2D, en améliorant la géométrie et la qualité de l'image.
― 7 min lire
Une nouvelle méthode améliore l'échantillonnage de données en utilisant des flux de normalisation et la dynamique de Langevin.
― 5 min lire
De nouvelles méthodes améliorent la capacité des modèles d'apprentissage automatique à gérer des données inconnues.
― 7 min lire
La recherche intègre des principes biologiques dans les CNN pour améliorer l'analyse d'images.
― 7 min lire
Présentation d'une méthode modulaire pour la réponse visuelle à des questions sans apprentissage préalable.
― 6 min lire
Une nouvelle méthode vise à améliorer la précision de la localisation d'objets dans l'analyse vidéo.
― 6 min lire
Cette méthode améliore la façon dont les ordis relient les images avec les légendes.
― 7 min lire
Une nouvelle méthode améliore la qualité d'image en utilisant des données haute résolution limitées.
― 7 min lire
Un nouveau jeu de données améliore le parsing des graphes de scènes pour de meilleures connexions entre images et textes.
― 8 min lire
GMSF propose une nouvelle façon d'estimer le mouvement dans l'espace 3D.
― 7 min lire
De nouvelles méthodes améliorent la reconstruction 3D des surfaces réfléchissantes en utilisant des techniques de rendu neural.
― 9 min lire
Cet article explore la nécessité du composant de requête dans les modèles de transformateurs.
― 4 min lire
Un nouveau modèle améliore la génération de données à partir de plusieurs types d'entrée.
― 8 min lire
T2FNorm améliore la capacité des réseaux de neurones à détecter des données inconnues.
― 9 min lire
Découvre le YOLO pour la détection d'objets en temps réel.
― 6 min lire
Apprends à créer un système qui identifie les roues de véhicules dans différentes conditions.
― 8 min lire
Les chercheurs utilisent des images pour apprendre aux robots comment interagir avec le monde.
― 6 min lire
Un nouveau cadre améliore la précision de la localisation d'objets 3D avec une seule caméra.
― 7 min lire
Cette étude examine comment les modèles d'apprentissage profond interprètent la logique dans les diagrammes en utilisant des illusions visuelles.
― 8 min lire
Nouveau jeu de données améliore la capacité de questions sur les images dans le traitement de la langue hausa.
― 7 min lire
Caterpillar est une nouvelle architecture MLP pour capturer les détails locaux des images.
― 8 min lire
Une nouvelle méthode pour faire tourner le modèle X3D sur des FPGA pour une analyse vidéo efficace.
― 8 min lire
Un cadre pour améliorer les modèles génératifs en utilisant des modèles de diffusion pré-entraînés.
― 10 min lire
Une nouvelle approche combine les méthodes par noyau avec l'apprentissage profond pour de meilleures performances.
― 7 min lire
Une nouvelle méthode améliore les modèles vision-langage grâce à des retours en temps réel pour de meilleures performances.
― 7 min lire
LayoutMask améliore l'interaction entre le texte et la mise en page pour une meilleure compréhension des documents.
― 7 min lire
Une nouvelle approche pour améliorer la génération de graphes de scènes pour une meilleure compréhension visuelle.
― 13 min lire
PaLI-X combine des compétences en vision et en langage, excelle dans plein de tâches différentes.
― 9 min lire
Cette étude évalue différentes techniques pour détecter des formes 3D en rotation.
― 10 min lire
De nouveaux réseaux de neurones apprennent les transformations directement à partir des données, ce qui améliore l'efficacité et la compréhension des symétries.
― 9 min lire
SlimFit réduit l'utilisation de mémoire pour les modèles de transformeurs pendant le fine-tuning.
― 7 min lire