Cette étude examine comment le recadrage peut améliorer le rappel vidéo en se concentrant sur la saillance visuelle.
― 6 min lire
La science de pointe expliquée simplement
Cette étude examine comment le recadrage peut améliorer le rappel vidéo en se concentrant sur la saillance visuelle.
― 6 min lire
Derniers articles
Derniers articles
Un système pour rendre le contrôle à distance des UAV plus sûr et plus fiable en utilisant des jumeaux numériques.
― 8 min lire
Un nouveau cadre identifie et mesure les biais dans les systèmes de génération d'images.
― 11 min lire
Explore comment les modèles de diffusion améliorent la super-résolution dans différents domaines.
― 7 min lire
Un nouveau modèle améliore les vidéos de mauvaise qualité tout en réduisant les besoins en traitement.
― 9 min lire
SAMA améliore l'évaluation de la qualité des images et des vidéos grâce à des techniques d'échantillonnage efficaces.
― 6 min lire
Cette étude examine les difficultés d'utilisation de l'apprentissage contrastif pour comprendre les clips musicaux.
― 7 min lire
Une nouvelle méthode simplifie la conception des yeux de personnages animés.
― 7 min lire
Une nouvelle méthode améliore la compression d'images en se concentrant sur les bandes de fréquence.
― 7 min lire
Le vlogger simplifie le vidéo blogging, rendant ça plus rapide et plus facile pour les créateurs.
― 8 min lire
Examiner l'utilisation de l'énergie et l'impact du streaming vidéo sur l'environnement.
― 8 min lire
Une approche unifiée pour évaluer l'alimentation des poissons en utilisant des données audio et vidéo.
― 6 min lire
Découvre comment l'IA change la création et le streaming de vidéos.
― 7 min lire
Un ensemble de données conçu pour tester la qualité vidéo dans des situations de visioconférence.
― 7 min lire
Des chercheurs ont développé un cadre pour mieux comprendre les vidéos et les textes.
― 7 min lire
Une nouvelle méthode améliore la segmentation audio-visuelle sans étiquettes détaillées.
― 7 min lire
PIAVE aide les machines à extraire les voix clairement, même quand les intervenants tournent la tête.
― 7 min lire
Un nouveau système qui relie la musique et la langue pour mieux comprendre.
― 7 min lire
Apprends à créer des affiches qui transmettent des messages de manière claire et attrayante.
― 6 min lire
Un nouveau jeu de données améliore la capacité de l'IA à interpréter le comportement humain dans les vidéos.
― 9 min lire
Spica améliore l'accès vidéo pour les utilisateurs aveugles et malvoyants grâce à l'interactivité.
― 6 min lire
Explorer des méthodes pour améliorer les performances des robots dans des environnements imprévisibles.
― 6 min lire
Une nouvelle méthode transforme les voix en utilisant les traits du visage pour diverses applications.
― 11 min lire
AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.
― 7 min lire
Une nouvelle méthode simplifie la recherche de vidéos en combinant différents types d'infos.
― 8 min lire
Développer des machines qui réagissent en fonction des émotions pour améliorer l'interaction humain-ordinateur.
― 7 min lire
Une nouvelle méthode améliore la vitesse et l'efficacité de la génération de texte en audio.
― 5 min lire
Améliorer la façon dont on identifie les sources sonores en utilisant des données audio-visuelles.
― 8 min lire
Une méthode pour visualiser et prédire des sons dans différents environnements en utilisant une technologie avancée.
― 6 min lire
Une nouvelle approche pour améliorer la qualité et l'efficacité énergétique du streaming vidéo en direct sur mobile.
― 11 min lire
ChatDiet combine des données personnelles et des connaissances de la population pour des conseils alimentaires améliorés.
― 10 min lire
Une analyse des biais et de l'incivilité dans les débats télévisés indiens.
― 7 min lire
Un nouveau cadre améliore l'efficacité et la qualité de la compression vidéo.
― 7 min lire
Cet article examine comment les images ont influencé l'opinion publique pendant le conflit Russie-Ukrainien.
― 5 min lire
Une nouvelle méthode améliore la qualité des images lors de la transmission sans fil sur des canaux bruyants.
― 6 min lire
MemeCraft crée des memes engageants pour promouvoir des causes sociales en toute sécurité.
― 14 min lire
Une nouvelle méthode améliore l'apprentissage machine des données audio-visuelles.
― 7 min lire
Des recherches montrent des façons plus larges de donner des directions en utilisant la connaissance spatiale.
― 9 min lire
Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.
― 7 min lire
Un nouveau cadre améliore la synchronisation labiale et la qualité visuelle dans les vidéos de visages qui parlent.
― 7 min lire
Une nouvelle méthode génère des faux échantillons défectueux pour améliorer la détection des anomalies dans la fabrication.
― 8 min lire