Limin Wang

Vision par ordinateur et reconnaissance des formes Avancées dans la prédiction d'action avec l'IA

Un nouveau modèle combine la mémoire et l'anticipation pour une meilleure prédiction des actions.

2025-10-08T10:47:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes DEQDet : Une nouvelle ère dans la détection d'objets

DEQDet propose une nouvelle approche pour la détection d'objets en utilisant un modèle d'équilibre profond.

2025-10-07T03:35:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Apprentissage de Prompt Découplé : Une Nouvelle Approche pour les Modèles Vision-Langage

Une nouvelle méthode améliore la capacité des modèles Vision-Language à s'adapter à de nouvelles tâches.

2025-10-06T20:44:12+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Masquage Guidé par le Mouvement : Faire avancée l'apprentissage vidéo

Une nouvelle technique de masquage améliore l'apprentissage vidéo en utilisant le mouvement pour un meilleur entraînement des modèles.

2025-10-06T05:35:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation d'objets vidéo avec JointFormer

JointFormer améliore le VOS en intégrant l'extraction de caractéristiques, la correspondance et la gestion de la mémoire.

2025-10-04T14:21:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Mamba : Un nouveau joueur dans la compréhension vidéo

Mamba montre un fort potentiel dans l'analyse vidéo par rapport aux transformateurs.

2025-08-29T12:39:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les modèles de compréhension vidéo

Un nouveau modèle améliore la compréhension des vidéos grâce à des techniques d'entraînement innovantes.

2025-08-26T20:39:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données capture l'apprentissage par l'observation

Des chercheurs créent un ensemble de données pour étudier comment les gens apprennent en imitant les autres.

2025-08-26T05:31:06+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Approche innovante pour le suivi de plusieurs objets

MOTIP simplifie le suivi de plusieurs objets, améliorant l'efficacité et la précision.

2025-08-25T23:04:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données SportsHHI améliore l'analyse de l'interaction des sports d'équipe

SportsHHI se concentre sur les interactions humaines dans les vidéos de basket et de volley pour une analyse améliorée.

2025-08-21T20:58:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération d'images avec SLAM

SLAM améliore la vitesse et la qualité de la génération d'images grâce à des processus innovants.

2025-08-17T08:05:12+00:00 ― 7 min lire

Physique spatiale Analyse du bruit de fond dans les données martiennes

Cette étude améliore la précision des mesures du vaisseau spatial Tianwen-1.

2025-08-16T07:57:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Dataset OmniCorpus : Une nouvelle ressource pour l'apprentissage multimodal

Un ensemble de données complet fusionnant images et textes pour aider l'apprentissage automatique.

2025-07-29T22:44:24+00:00 ― 8 min lire

Optique Les couleurs des papillons : le design de la nature

Les écailles de papillon montrent des couleurs vives grâce à des nanostructures uniques.

2025-07-27T05:03:33+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec le cadre AWT

Un nouveau cadre améliore l'adaptabilité des modèles vision-langage grâce à un traitement de données intelligent.

2025-07-18T17:05:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes VideoEval : Une nouvelle norme pour l'évaluation des modèles vidéo

VideoEval établit une nouvelle référence pour évaluer efficacement les modèles de base vidéo.

2025-07-17T18:26:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Self-TPT : Un nouveau regard sur le réglage des invites

Self-TPT simplifie le réglage des prompts pour les modèles vision-langage, améliorant la vitesse et l'efficacité.

2025-06-29T10:40:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore les performances des modèles de vision

Une nouvelle technique améliore l'entraînement des modèles de traitement d'images, en s'attaquant à des problèmes courants.

2025-06-19T11:34:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Open-MAGVIT2 : Améliorer l'accessibilité à la génération d'images

Un projet axé sur l'amélioration de la génération d'images grâce à des techniques et des modèles avancés.

2025-06-16T02:43:24+00:00 ― 6 min lire

Génie logiciel S'attaquer à la menace des paquets malveillants dans les logiciels open-source

Améliorer les méthodes de détection des paquets nuisibles dans les dépôts de logiciels.

2025-06-07T10:57:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Temporal2Seq : Une Approche Unifiée pour Comprendre les Vidéos

Le cadre Temporal2Seq simplifie plusieurs tâches de compréhension vidéo en un seul modèle.

2025-06-04T00:31:48+00:00 ― 11 min lire

Biologie végétale L'arme secrète du blé contre la rouille des feuilles

Apprends comment le blé lutte contre la rouille des feuilles avec des gènes uniques et des signaux de calcium.

2025-04-15T06:30:57+00:00 ― 5 min lire

Apprentissage automatique Une nouvelle approche pour l'analyse des données EEG

Combiner le timing et les relations pour mieux comprendre l'EEG.

2025-04-13T20:42:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Révolutionner l'IA : Modèles multimodaux efficaces

De nouveaux designs améliorent l'efficacité des modèles de langage multimodaux en IA.

2025-04-12T03:55:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Le nouveau CG-Bench établit des normes pour la compréhension vidéo

CG-Bench aide les machines à analyser les longues vidéos avec des questions basées sur des indices.

2025-03-03T10:33:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Optimiser la compréhension visuelle dans les modèles d'IA

Une nouvelle méthode améliore les performances des modèles de langage multimodal sur les tâches visuelles.

2025-01-24T20:33:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Rencontre Vinci : Ton assistant de vie intelligent

Vinci rend les tâches quotidiennes plus simples avec de l'aide sans les mains et des conseils en temps réel.

2025-01-18T22:30:27+00:00 ― 8 min lire