Un nouveau jeu de données aide les robots à répondre à des questions complexes sur les conditions domestiques.
― 9 min lire
La science de pointe expliquée simplement
Un nouveau jeu de données aide les robots à répondre à des questions complexes sur les conditions domestiques.
― 9 min lire
Une méthode améliore la création de vidéos en personnalisant plusieurs concepts pour plus de clarté.
― 9 min lire
Une nouvelle méthode améliore la création d'images à partir de plusieurs invites textuelles.
― 8 min lire
Cet article parle des hallucinations dans les LVLMs et propose des méthodes pour les gérer.
― 10 min lire
Une nouvelle méthode améliore la circulation et l'efficacité du carburant aux intersections complexes.
― 8 min lire
ABEX utilise Abstract-and-Expand pour améliorer les données d'entraînement pour les tâches de compréhension du langage naturel.
― 10 min lire
Un nouveau modèle génère de la musique en utilisant à la fois des infos textuelles et visuelles.
― 9 min lire
GAMA améliore le traitement audio en fusionnant des infos sur le son et le langage.
― 7 min lire
Un nouveau modèle combine des données audio et visuelles pour une meilleure compréhension.
― 7 min lire
Une méthode pour générer des personnages numériques expressifs en utilisant des données audio et vidéo.
― 9 min lire
Deux robots qui bossent ensemble améliorent la localisation des objets sans entraînement préalable.
― 9 min lire
Des chercheurs améliorent la technologie lidar pour une navigation robotique plus sûre autour des objets transparents.
― 7 min lire
ReCLAP améliore la classification audio avec des indications détaillées pour plus de précision.
― 6 min lire
Combiner les instructions humaines et la technologie pour une navigation robotique plus sûre.
― 6 min lire
Une nouvelle méthode améliore le mouvement des robots quadrupèdes sur des terrains difficiles.
― 6 min lire
SOAR améliore la précision de reconnaissance d'actions dans l'analyse de vidéos de drones.
― 7 min lire
Une nouvelle méthode améliore la capacité des robots à naviguer dans des environnements extérieurs variés.
― 7 min lire
De nouvelles méthodes s'attaquent aux défis de la recherche de réponses dans des documents visuellement riches.
― 7 min lire
Nouveau système qui transforme le contrôle audio grâce à des descriptions textuelles détaillées.
― 9 min lire
Le dataset DAVE capture des scénarios de route complexes pour un meilleur entraînement de l'IA.
― 10 min lire
Les LVLMs ont du mal à reconnaître la réalité, ce qui peut avoir des conséquences graves.
― 6 min lire