Fahad Shahbaz Khan

Vision par ordinateur et reconnaissance des formes Avancées dans la détection de points de repère non supervisée

Une nouvelle méthode améliore la détection des repères sans étiquetage humain.

2025-09-24T14:04:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection d'objets semi-supervisée en monde ouvert

De nouvelles méthodes réduisent le marquage humain tout en améliorant la précision de la détection d'objets.

2025-09-04T08:36:42+00:00 ― 9 min lire

Calcul et langage MobiLlama : Un petit modèle de langue pour tout le monde

MobiLlama propose un traitement du langage efficace pour les appareils avec des ressources limitées.

2025-09-04T03:36:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Évaluer les modèles basés sur la vision face aux changements de fond

Comprendre la robustesse des modèles est super important pour les applis dans plein de domaines.

2025-08-31T13:53:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la recherche vidéo avec la méthode CoVR

Un nouveau cadre améliore les recherches vidéo en combinant des visuels et des descriptions détaillées en langage.

2025-08-26T00:23:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes MAVOS : Redéfinir la segmentation d'objets vidéo

MAVOS présente une méthode efficace pour suivre des objets dans de longues vidéos.

2025-08-25T14:38:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Les progrès dans la détection de changement par télédétection

ELGC-Net améliore la précision dans la détection des changements à l'aide d'images satellites.

2025-08-25T13:51:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Auto-formation Cross-Modal : Une Nouvelle Approche

Apprends à classer des objets en utilisant des images et des nuages de points 3D sans étiquettes.

2025-08-19T17:21:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'avenir des modèles multimodaux vidéo de grande taille

Évaluer les capacités et les défis des modèles avancés de compréhension vidéo.

2025-08-13T12:42:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Open-YOLO 3D : Une nouvelle méthode pour une segmentation d'objets rapide

Open-YOLO 3D améliore la segmentation d'instances 3D avec rapidité et précision.

2025-08-02T14:25:48+00:00 ― 8 min lire

Traitement de l'image et de la vidéo Évaluation des vulnérabilités dans les modèles de segmentation d'images médicales

Une étude examine la robustesse des modèles de segmentation face aux attaques adversariales dans le domaine de la santé.

2025-07-30T10:52:35+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluer la robustesse des modèles de l'espace d'état visuel

Cet article examine comment les modèles de l'espace d'état visuel gèrent les défis visuels.

2025-07-29T11:48:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à la montée des anomalies vidéo générées par l'IA

VANE-Bench améliore la détection des anomalies dans les vidéos malgré la montée du contenu AI.

2025-07-28T23:41:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'actions temporelles à vocabulaire ouvert

Une nouvelle méthode améliore la reconnaissance des actions dans les vidéos en utilisant le langage contextuel.

2025-07-25T21:50:00+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la vision par ordinateur avec GroupMamba

GroupMamba améliore l'efficacité et la précision du traitement d'images dans les tâches de vision par ordinateur.

2025-07-11T05:53:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Traiter les risques de sécurité dans les modèles d'IA médicale

De nouvelles méthodes révèlent des vulnérabilités dans les modèles médicaux grâce à des attaques par porte dérobée.

2025-06-27T20:37:18+00:00 ― 7 min lire

Interaction homme-machine Connecter les rêves et les signaux cérébraux : une nouvelle approche

Cette étude explore des façons innovantes d'influencer et d'interagir avec les rêves via les signaux cérébraux.

2025-06-27T18:38:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la segmentation d'image avec iSeg

iSeg améliore la précision de la segmentation d'images avec moins de données d'entraînement.

2025-06-17T11:30:30+00:00 ― 6 min lire

Apprentissage automatique Avancées dans les prévisions météo pour la MENA

Une étude sur l'amélioration des prévisions météo au Moyen-Orient et en Afrique du Nord.

2025-06-10T00:49:39+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Les avancées en télédétection changent la donne

De nouveaux outils améliorent notre façon de décrire les changements dans les images satellites au fil du temps.

2025-06-06T22:03:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes VideoGLaMM : Relier les mots et les images dans les vidéos

VideoGLaMM améliore la compréhension vidéo grâce à des liens visuels et textuels détaillés.

2025-05-28T12:29:15+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Comprendre GEOBench-VLM : Un benchmark pour les modèles vision-langage

GEOBench-VLM évalue des modèles pour interpréter des données et des images géospatiales.

2025-05-02T20:38:40+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes UniMed : Transformer l'imagerie médicale avec des données

Un nouveau jeu de données révolutionne l'analyse des images médicales et de leurs descriptions.

2025-03-12T12:50:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes EarthDial : Ton pote de discussion sur l'environnement

Simplifier les données environnementales grâce à des discussions captivantes.

2025-02-13T14:49:39+00:00 ― 7 min lire