Une nouvelle méthode améliore la précision du suivi des mouvements humains à partir de vidéos.
― 6 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la précision du suivi des mouvements humains à partir de vidéos.
― 6 min lire
Les défis de SoccerNet 2024 poussent à innover dans la compréhension vidéo du foot.
― 6 min lire
Une nouvelle approche pour comprendre les relations variables dans des environnements changeants.
― 8 min lire
La recherche se concentre sur l'amélioration de la capacité de l'IA à reconnaître des actions dans les vidéos.
― 7 min lire
Un nouveau cadre améliore la détection des relations entre objets dans les vidéos, rendant ça plus précis et adaptable.
― 8 min lire
Une nouvelle méthode améliore la réponse aux questions vidéo grâce à la reconnaissance de texte dans les scènes.
― 9 min lire
Walker propose un suivi d'objets efficace avec un minimum d'étiquetage de données.
― 7 min lire
Le cadre Temporal2Seq simplifie plusieurs tâches de compréhension vidéo en un seul modèle.
― 11 min lire
VideoLISA utilise le langage pour segmenter et suivre les objets dans les vidéos de manière efficace.
― 8 min lire
Un benchmark pour évaluer la capacité des LMMs à analyser la qualité vidéo.
― 9 min lire
Un nouveau cadre améliore la compréhension vidéo dans des conditions de faible luminosité en utilisant des caméras événementielles.
― 7 min lire
Un nouveau système identifie les erreurs en temps réel pendant les tâches grâce à l'analyse vidéo.
― 5 min lire
Une nouvelle méthode accélère la reconnaissance d'action dans les vidéos avec moins de données.
― 7 min lire
UniHOI fait avancer l'étude de l'interaction humain-objet dans les vidéos.
― 6 min lire
Un nouveau système améliore la détection d'action vidéo en utilisant des Modèles de Langage Multimodaux de Grande Taille.
― 8 min lire
Utiliser l'apprentissage automatique pour évaluer les mouvements des bébés pour des infos sur leur développement précoce.
― 7 min lire
Découvrez comment les résumés vidéos améliorent la supervision humaine des robots.
― 6 min lire
Un système qui détecte les actions de conduite distraite en utilisant une analyse vidéo avancée.
― 10 min lire
Un nouveau cadre traite le biais d'action dans la compréhension vidéo.
― 6 min lire
Un nouveau jeu de données qui améliore la compréhension vidéo et le raisonnement de l'IA.
― 7 min lire
LongVALE propose une nouvelle référence pour comprendre les longues vidéos à travers des données audio-visuelles.
― 8 min lire
SyncVIS améliore le suivi et la segmentation des objets dans les vidéos pour plein d'applis différentes.
― 6 min lire
Une nouvelle méthode trouve des objets dans de longues vidéos sans avoir besoin d'un entraînement intensif.
― 9 min lire
Une technologie de pointe identifie les moments clés dans un contenu vidéo sans fin.
― 6 min lire
Analyse vidéo en temps réel pour une reconnaissance rapide des activités dans différents domaines.
― 5 min lire
TCDSG améliore l'analyse vidéo en suivant les relations entre les objets au fil du temps.
― 12 min lire
VideoICL améliore la façon dont les ordinateurs comprennent le contenu vidéo grâce à l'apprentissage par exemple.
― 6 min lire
Un nouveau modèle combine la segmentation d'action et l'anticipation pour des interactions plus intelligentes.
― 8 min lire
Des chercheurs développent des références pour les modèles vision-langage afin de raisonner sur des événements inattendus dans les vidéos.
― 8 min lire
Apprends comment les techniques sensibles au mouvement améliorent la génération de graphes de scènes dans les vidéos.
― 7 min lire
Utiliser l'apprentissage machine pour améliorer l'analyse des matchs de judo et le coaching.
― 10 min lire
Le framework Manta améliore la reconnaissance d'actions en utilisant de longues séquences vidéo et la modélisation de caractéristiques locales.
― 9 min lire
Video Curious Agent simplifie la recherche des moments clés dans les vidéos longues.
― 7 min lire
Découvre comment de nouvelles méthodes améliorent la précision du timing dans l'analyse vidéo.
― 6 min lire
Les réseaux neuronaux déverrouillent des infos sur les processus dynamiques grâce à l'analyse vidéo.
― 7 min lire
Un nouveau cadre améliore comment on traite les longues vidéos de manière efficace.
― 8 min lire
Découvrez comment STDD améliore la reconnaissance d'actions dans les vidéos.
― 6 min lire
Apprends comment les machines interprètent les vidéos, des clips amusants aux applications essentielles.
― 8 min lire
De nouvelles techniques améliorent la façon dont les machines reconnaissent et interprètent les scènes vidéo.
― 9 min lire
Un nouveau modèle identifie les DeepFakes en analysant des vidéos entières, pas juste les visages.
― 7 min lire