Un gros ensemble de données de prompts et de vidéos fait avancer la technologie du texte à vidéo.
― 9 min lire
La science de pointe expliquée simplement
Un gros ensemble de données de prompts et de vidéos fait avancer la technologie du texte à vidéo.
― 9 min lire
Apprends comment les cartes de saillance améliorent la génération d'images et de vidéos.
― 6 min lire
SV3D crée des visuels 3D magnifiques à partir d'images 2D uniques.
― 8 min lire
Crée des vidéos avec des avatars qui parlent facilement grâce au système innovant de Virbo.
― 9 min lire
Un nouveau modèle améliore l'estimation de la profondeur en combinant les prédictions et l'analyse multi-images.
― 6 min lire
Des chercheurs créent un ensemble de données pour étudier comment les gens apprennent en imitant les autres.
― 9 min lire
Une nouvelle approche d'IA vise à améliorer la vitesse et l'efficacité de la génération d'images et de vidéos.
― 6 min lire
Cette étude met en lumière comment les médias alimentent la désinformation en ligne.
― 6 min lire
Un nouveau système simplifie le montage vidéo avec des descriptions automatiques.
― 8 min lire
ExoDeepFinder détecte efficacement les événements rares d'exocytose dans des vidéos grâce à l'apprentissage profond.
― 5 min lire
Cette étude examine les méthodes audio pour suivre les mouvements des piétons dans les zones urbaines.
― 9 min lire
GenMM améliore l'insertion réaliste d'objets 3D dans des vidéos et des scans LiDAR.
― 8 min lire
Comment TikTok influence les habitudes des utilisateurs autour du vapotage et de l'alcool.
― 6 min lire
Cet article présente une méthode pour générer un son précis à partir de vidéos et de texte.
― 9 min lire
Cette étude propose une approche vidéo pour évaluer la gravité de l'autisme chez les enfants.
― 8 min lire
Un gros jeu de données pour améliorer la technologie et la recherche sur la langue des signes.
― 6 min lire
Une nouvelle approche génère des vidéos d'actions humaines de haute qualité avec des infos de profondeur.
― 11 min lire
Des chercheurs développent un PAV pour créer des avatars numériques réalistes à partir de clips vidéo.
― 6 min lire
Un nouveau repère améliore la compréhension des modèles sur les longues vidéos et le langage.
― 7 min lire
Un nouveau jeu de données avec des paires d'images de trois types de caméras pour la recherche en vision par ordinateur.
― 7 min lire
Une nouvelle approche combine des données audio, vidéo et texte pour un diagnostic efficace de la dépression.
― 10 min lire
Nouveau jeu de données offre des infos sur les discours de haine dans différentes langues et formats.
― 8 min lire
Ce cadre combine des vidéos et des données cérébrales pour une meilleure évaluation de la douleur.
― 8 min lire
SAM-2 améliore l'analyse vidéo chirurgicale, gérant des défis comme la fumée et un éclairage faible.
― 7 min lire
VidGen-1M améliore la génération de vidéos à partir de texte avec des données de haute qualité.
― 6 min lire
Une nouvelle approche se concentre sur des incohérences subtiles dans la détection de deepfake.
― 8 min lire
Un outil logiciel pour suivre et analyser le mouvement et l'utilisation de l'espace des vaches.
― 8 min lire
RoboMNIST aide les robots à reconnaître différentes activités en utilisant le WiFi, la vidéo et le son.
― 7 min lire
Kangaroo améliore l'analyse vidéo en intégrant efficacement visuels, sons et textes.
― 7 min lire
Une nouvelle méthode améliore la précision du suivi des mouvements humains à partir de vidéos.
― 6 min lire
Une étude révèle une nouvelle méthode pour identifier les émotions en utilisant des vidéos, des sons et du texte.
― 6 min lire
Nouveau modèle améliore la détection des intervenants en temps réel et l'efficacité de la communication.
― 7 min lire
De nouvelles méthodes améliorent la synchronisation audio avec les scènes vidéo qui changent.
― 5 min lire
Cet article parle de comment les robots apprennent à cuisiner en utilisant des infos sur internet.
― 9 min lire
Un nouveau modèle crée de l'audio qui correspond à la vidéo, améliorant les expériences médiales.
― 6 min lire
Le dataset MultiClimate montre les positions du public sur le changement climatique à travers des vidéos.
― 8 min lire
Une nouvelle méthode aide les robots à apprendre des tâches en regardant des démonstrations humaines.
― 5 min lire
Une étude montre que les nudges marchent pour les titres mais pas pour les vidéos deepfake mignonnes.
― 6 min lire
Cette étude analyse comment l'audio, la vidéo et le texte fonctionnent ensemble dans la reconnaissance vocale.
― 9 min lire
Change ta façon de voir les vidéos avec la techno innovante de changement d'angle de ReCapture.
― 7 min lire