Une nouvelle méthode améliore le traitement vidéo avec les Transformers en réduisant les coûts de calcul.
― 6 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore le traitement vidéo avec les Transformers en réduisant les coûts de calcul.
― 6 min lire
Une méthode pour améliorer la soustraction de fond grâce à la découverte automatisée de formules LBP.
― 7 min lire
Une nouvelle méthode améliore la qualité des vidéos en rendant l'image plus claire et en augmentant le nombre d'images par seconde.
― 6 min lire
Une nouvelle méthode réduit les coûts de calcul dans la traduction vidéo-à-vidéo tout en gardant la qualité.
― 8 min lire
Une nouvelle méthode améliore les tâches vidéo en se concentrant sur les différences entre les frames.
― 7 min lire
Une nouvelle méthode améliore VideoQA en s'attaquant aux réponses rares et jamais vues.
― 8 min lire
Une nouvelle méthode améliore la précision et l'efficacité pour capturer les formes 3D de plusieurs personnes.
― 5 min lire
Une nouvelle approche améliore les tâches de localisation vidéo en utilisant des modèles préentraînés.
― 8 min lire
Une nouvelle technique de masquage améliore l'apprentissage vidéo en utilisant le mouvement pour un meilleur entraînement des modèles.
― 8 min lire
LOCATE identifie des objets dans des images et des vidéos sans intervention humaine.
― 7 min lire
AccFlow utilise l'accumulation en arrière pour améliorer l'estimation du flux optique à long terme.
― 6 min lire
JointFormer améliore le VOS en intégrant l'extraction de caractéristiques, la correspondance et la gestion de la mémoire.
― 7 min lire
Une nouvelle méthode réduit le biais de scène pour une meilleure reconnaissance des actions dans les vidéos.
― 7 min lire
Une nouvelle approche réduit les besoins en données pour des tâches de segmentation vidéo efficaces.
― 8 min lire
Un outil logiciel améliore le marquage de la ligne d'horizon dans les images et vidéos marines.
― 6 min lire
Présentation de RRGNet, une méthode efficace pour enlever la pluie des vidéos en utilisant la distillation de connaissances.
― 7 min lire
Une nouvelle approche améliore la compréhension des longues vidéos sans avoir besoin de clips uniformes.
― 7 min lire
Un système qui traduit la parole tout en synchronisant les mouvements des lèvres pour mieux communiquer.
― 8 min lire
ViWS-Net enlève efficacement différentes conditions météo des vidéos, améliorant la clarté et la qualité.
― 8 min lire
De nouvelles méthodes améliorent l'efficacité mémoire et la précision dans la segmentation d'objets vidéo.
― 9 min lire
STRPCA améliore la soustraction de fond pour une meilleure détection d'objets dans les vidéos.
― 7 min lire
Apprends à entraîner des modèles vidéo efficacement avec peu de ressources.
― 10 min lire
STint propose une nouvelle façon de compléter les images manquantes dans les vidéos géospatiales.
― 9 min lire
Un nouveau modèle améliore les vidéos de mauvaise qualité tout en réduisant les besoins en traitement.
― 9 min lire
RePGARS améliore la reconnaissance d'activité en utilisant des poses rendues sans dépendre d'un suivi précis.
― 8 min lire
Cet article traite des techniques améliorées pour suivre des objets transparents dans des séquences vidéo.
― 12 min lire
FMA-Net améliore la qualité des vidéos en combinant la super-résolution et les techniques de défloutage.
― 7 min lire
Une nouvelle approche utilisant des modèles de diffusion pour une meilleure représentation des scènes vidéo.
― 8 min lire
Une nouvelle méthode améliore le sous-titrage vidéo en utilisant des modèles image-langue.
― 9 min lire
Une nouvelle approche améliore la précision et l'efficacité de la segmentation d'objets vidéo.
― 9 min lire
Des chercheurs ont développé un cadre pour mieux comprendre les vidéos et les textes.
― 7 min lire
Cet article présente une méthode efficace pour traiter de longues vidéos en utilisant la consolidation de la mémoire.
― 10 min lire
DiffSal améliore la façon dont les ordinateurs prédisent l'intérêt des spectateurs pour les vidéos.
― 9 min lire
Une nouvelle approche pour mieux interpréter les vidéos et répondre à des questions complexes.
― 8 min lire
Un nouveau cadre améliore les recherches vidéo en combinant des visuels et des descriptions détaillées en langage.
― 8 min lire
Un nouveau cadre améliore la précision des sous-titres vidéo même avec des entrées manquantes.
― 8 min lire
Un nouveau modèle améliore la reconnaissance d'actions dans des vidéos non montées tout en minimisant l'utilisation de la mémoire.
― 9 min lire
De nouvelles méthodes améliorent la synthèse vidéo en utilisant de grands ensembles de données et des modèles avancés.
― 9 min lire
Une nouvelle méthode pour suivre des objets dans des vidéos sans avoir besoin de données étiquetées coûteuses.
― 11 min lire
Une nouvelle méthode révèle des vulnérabilités dans les évaluations de la qualité d'images et de vidéos sans référence.
― 9 min lire