DiffI2I améliore la translation d'image à image avec une précision et une efficacité accrues.
― 8 min lire
La science de pointe expliquée simplement
DiffI2I améliore la translation d'image à image avec une précision et une efficacité accrues.
― 8 min lire
DAVIS propose une nouvelle façon de gérer la séparation des sons audio et visuels.
― 7 min lire
Spica améliore l'accès vidéo pour les utilisateurs aveugles et malvoyants grâce à l'interactivité.
― 6 min lire
Mimosa simplifie la création de son spatial pour les vidéastes amateurs.
― 9 min lire
AV-DiT propose une nouvelle façon de générer de l'audio et de la vidéo synchronisés de manière efficace.
― 10 min lire
Un nouveau système de réalité augmentée pour améliorer la sécurité en cuisine pour les personnes malvoyantes.
― 7 min lire
SaSR-Net relie les sons et les visuels pour répondre précisément aux questions sur les vidéos.
― 8 min lire
L'étude améliore la compréhension des vidéos grâce à des questions axées sur le mouvement et des réponses visuelles.
― 7 min lire