Une nouvelle méthode améliore la détection d'objets dans les vidéos sans données étiquetées.
― 7 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la détection d'objets dans les vidéos sans données étiquetées.
― 7 min lire
EoRaS améliore la compréhension des formes d'objets dans la segmentation vidéo.
― 7 min lire
Une nouvelle méthode améliore la façon dont les voitures autonomes détectent les objets avec LiDAR.
― 6 min lire
Cet article examine comment le type d'observation impacte l'apprentissage des tâches par les robots.
― 9 min lire
Une nouvelle approche génère efficacement des modèles 3D détaillés à partir de descriptions textuelles.
― 7 min lire
Un aperçu concis des hallucinations dans les MLLM et des stratégies pour améliorer la fiabilité.
― 8 min lire
Cette méthode ajuste les slots de représentation des objets en fonction de la complexité de l'image.
― 7 min lire
Un nouveau jeu de données de mouvement humain en 2D ouvre des portes pour des animations réalistes.
― 6 min lire
Un nouveau critère répond au besoin d'évaluation standard dans la prédiction spatio-temporelle.
― 10 min lire
Des chercheurs développent des méthodes pour mieux aligner les modèles de langage avec les préférences humaines.
― 9 min lire
Une nouvelle approche améliore le lien entre les images et le texte pour une meilleure interprétation.
― 8 min lire
Un nouveau cadre pour évaluer la performance des systèmes RAG.
― 10 min lire
DynaSurfGS améliore la modélisation d'objets vidéo avec une meilleure qualité d'image et une précision de forme.
― 7 min lire
De nouvelles méthodes améliorent la création d'images à partir de descriptions textuelles complexes.
― 7 min lire
GigaGS s'attaque aux défis de la modélisation de grandes scènes 3D avec des techniques innovantes.
― 6 min lire
VideoLISA utilise le langage pour segmenter et suivre les objets dans les vidéos de manière efficace.
― 8 min lire
Une nouvelle approche pour améliorer le suivi de caméra dans des scènes vidéo à grande vitesse.
― 6 min lire
La quantification factorisée améliore la génération d'images grâce à une gestion efficace des tokens.
― 6 min lire
CoSurfGS propose une nouvelle approche pour la reconstruction 3D en utilisant le travail d'équipe entre les appareils.
― 9 min lire