Cet article parle de comment les robots apprennent à cuisiner en utilisant des infos sur internet.
― 9 min lire
La science de pointe expliquée simplement
Cet article parle de comment les robots apprennent à cuisiner en utilisant des infos sur internet.
― 9 min lire
Un nouveau modèle crée de l'audio qui correspond à la vidéo, améliorant les expériences médiales.
― 6 min lire
Le dataset MultiClimate montre les positions du public sur le changement climatique à travers des vidéos.
― 8 min lire
Une nouvelle méthode aide les robots à apprendre des tâches en regardant des démonstrations humaines.
― 5 min lire
Une étude montre que les nudges marchent pour les titres mais pas pour les vidéos deepfake mignonnes.
― 6 min lire
Cette étude analyse comment l'audio, la vidéo et le texte fonctionnent ensemble dans la reconnaissance vocale.
― 9 min lire
Change ta façon de voir les vidéos avec la techno innovante de changement d'angle de ReCapture.
― 7 min lire
Un nouveau système améliore la communication en se concentrant sur les besoins du récepteur.
― 6 min lire
SPECTRUM améliore les sous-titres vidéo en intégrant des émotions et du contexte pour une meilleure expérience de visionnage.
― 7 min lire
De nouvelles méthodes améliorent la façon dont les machines comprennent les images et le texte.
― 7 min lire
Des méthodes innovantes améliorent la qualité vidéo pour la formation des véhicules autonomes.
― 6 min lire
OphCLIP aide les machines à apprendre la chirurgie des yeux grâce à des vidéos et du texte.
― 7 min lire
Un nouveau jeu de données qui améliore la compréhension vidéo et le raisonnement de l'IA.
― 7 min lire
ReWind aide les spectateurs à comprendre les longues vidéos grâce à un système de mémoire intelligent.
― 6 min lire
Un nouveau système pour comprendre et interpréter la langue des signes via des vidéos.
― 6 min lire
Découvre les défis et les avancées dans la création d'avatars réalistes à partir de séquences floues.
― 9 min lire
Crée des vidéos personnalisées qui reflètent les identités de chacun grâce à une technologie avancée.
― 8 min lire
Nouveau cadre améliore les transitions dans les vidéos en langue des signes pour une meilleure compréhension.
― 7 min lire
InTraGen crée des interactions vidéo réalistes avec des parcours définis pour les objets.
― 8 min lire
Un nouveau modèle permet d'interagir en temps réel avec des vidéos, améliorant la compréhension et l'engagement.
― 6 min lire
Transforme tes photos statiques en animations vivantes grâce à la dernière technologie PhysMotion.
― 8 min lire
Crée des vidéos avec des gens réels qui ont des actions contrôlées et des identités cohérentes.
― 7 min lire
Transformer des prompts textuels en vidéos réalistes en intégrant des lois physiques.
― 7 min lire
La Matrix transforme le gaming et le réalisme avec une interaction vidéo inégalée.
― 10 min lire
Crée des scènes 4D incroyables à partir de simples invites de texte avec PaintScene4D.
― 9 min lire
SyncFlow fusionne la génération audio et vidéo pour une création de contenu sans accroc.
― 5 min lire
Apprends comment des vidéos du quotidien peuvent créer des modèles 3D incroyables.
― 7 min lire
Un nouveau système améliore les recherches vidéo en combinant les images et le son.
― 7 min lire
Les robots IA apprennent la navigation grâce à des vidéos d'intérieur dans le monde réel pour améliorer leurs déplacements.
― 8 min lire
Un nouveau système révolutionne la façon dont la musique s'associe au contenu vidéo.
― 8 min lire
Un nouveau cadre pour créer des vidéos et des images rapidement.
― 7 min lire
Les machines apprennent à prédire les actions futures dans des vidéos, ce qui change notre façon d'interagir avec la technologie.
― 7 min lire
MVTamperBench évalue les VLMs par rapport aux techniques de falsification vidéo pour une meilleure fiabilité.
― 7 min lire