Salman Khan

Apprentissage automatique Faire avancer l’apprentissage fédéré avec l’algorithme FedIns

FedIns s'attaque aux défis de données dans l'apprentissage fédéré pour améliorer les performances des modèles.

2025-10-09T16:16:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le réglage des prompts en temps de test avec DiffTPT

DiffTPT améliore l'adaptabilité et la précision des modèles grâce à des techniques d'augmentation de données innovantes.

2025-10-09T15:53:12+00:00 ― 9 min lire

Traitement de l'image et de la vidéo Renforcer l'imagerie médicale contre les attaques adverses

De nouvelles techniques améliorent la fiabilité des outils d'imagerie médicale face aux altérations de données nuisibles.

2025-10-09T00:48:55+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la classification zéro-shot réaliste

Un nouveau cadre pour classer des images sans étiquettes préalables en utilisant un large vocabulaire.

2025-10-04T22:23:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection de points de repère non supervisée

Une nouvelle méthode améliore la détection des repères sans étiquetage humain.

2025-09-24T14:04:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation d'instances 3D en monde ouvert

Une nouvelle méthode permet aux modèles de reconnaître à la fois des objets connus et inconnus.

2025-09-22T03:12:42+00:00 ― 9 min lire

Calcul et langage MobiLlama : Un petit modèle de langue pour tout le monde

MobiLlama propose un traitement du langage efficace pour les appareils avec des ressources limitées.

2025-09-04T03:36:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Évaluer les modèles basés sur la vision face aux changements de fond

Comprendre la robustesse des modèles est super important pour les applis dans plein de domaines.

2025-08-31T13:53:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la recherche vidéo avec la méthode CoVR

Un nouveau cadre améliore les recherches vidéo en combinant des visuels et des descriptions détaillées en langage.

2025-08-26T00:23:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes MAVOS : Redéfinir la segmentation d'objets vidéo

MAVOS présente une méthode efficace pour suivre des objets dans de longues vidéos.

2025-08-25T14:38:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Les progrès dans la détection de changement par télédétection

ELGC-Net améliore la précision dans la détection des changements à l'aide d'images satellites.

2025-08-25T13:51:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Auto-formation Cross-Modal : Une Nouvelle Approche

Apprends à classer des objets en utilisant des images et des nuages de points 3D sans étiquettes.

2025-08-19T17:21:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'avenir des modèles multimodaux vidéo de grande taille

Évaluer les capacités et les défis des modèles avancés de compréhension vidéo.

2025-08-13T12:42:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Open-YOLO 3D : Une nouvelle méthode pour une segmentation d'objets rapide

Open-YOLO 3D améliore la segmentation d'instances 3D avec rapidité et précision.

2025-08-02T14:25:48+00:00 ― 8 min lire

Traitement de l'image et de la vidéo Évaluation des vulnérabilités dans les modèles de segmentation d'images médicales

Une étude examine la robustesse des modèles de segmentation face aux attaques adversariales dans le domaine de la santé.

2025-07-30T10:52:35+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie de compréhension vidéo

Un nouveau modèle améliore la compréhension vidéo en fusionnant des encodeurs d'images et de vidéos.

2025-07-29T12:28:12+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Évaluer la robustesse des modèles de l'espace d'état visuel

Cet article examine comment les modèles de l'espace d'état visuel gèrent les défis visuels.

2025-07-29T11:48:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à la montée des anomalies vidéo générées par l'IA

VANE-Bench améliore la détection des anomalies dans les vidéos malgré la montée du contenu AI.

2025-07-28T23:41:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'actions temporelles à vocabulaire ouvert

Une nouvelle méthode améliore la reconnaissance des actions dans les vidéos en utilisant le langage contextuel.

2025-07-25T21:50:00+00:00 ― 10 min lire

Apprentissage automatique Ajustement Proxy Cohérent : Une Nouvelle Méthode pour les Modèles Black-box

CPT améliore la performance des modèles boîte noire sans accès direct aux paramètres internes.

2025-07-21T11:03:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation sémantique avec FANet

FANet améliore la segmentation sémantique, rendant l'accurate mieux dans des images complexes.

2025-07-14T13:56:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la vision par ordinateur avec GroupMamba

GroupMamba améliore l'efficacité et la précision du traitement d'images dans les tâches de vision par ordinateur.

2025-07-11T05:53:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les méthodes de détection des déchets sous-marins

Techniques efficaces pour détecter les déchets plastiques dans nos océans.

2025-07-03T05:55:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Traiter les risques de sécurité dans les modèles d'IA médicale

De nouvelles méthodes révèlent des vulnérabilités dans les modèles médicaux grâce à des attaques par porte dérobée.

2025-06-27T20:37:18+00:00 ― 7 min lire

Interaction homme-machine Connecter les rêves et les signaux cérébraux : une nouvelle approche

Cette étude explore des façons innovantes d'influencer et d'interagir avec les rêves via les signaux cérébraux.

2025-06-27T18:38:48+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les prévisions météo pour la MENA

Une étude sur l'amélioration des prévisions météo au Moyen-Orient et en Afrique du Nord.

2025-06-10T00:49:39+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Les avancées en télédétection changent la donne

De nouveaux outils améliorent notre façon de décrire les changements dans les images satellites au fil du temps.

2025-06-06T22:03:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes ROAD-Waymo : Un nouveau dataset pour les voitures autonomes

ROAD-Waymo améliore la compréhension des actions sur la route pour les véhicules autonomes.

2025-06-01T03:00:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes VideoGLaMM : Relier les mots et les images dans les vidéos

VideoGLaMM améliore la compréhension vidéo grâce à des liens visuels et textuels détaillés.

2025-05-28T12:29:15+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Comprendre GEOBench-VLM : Un benchmark pour les modèles vision-langage

GEOBench-VLM évalue des modèles pour interpréter des données et des images géospatiales.

2025-05-02T20:38:40+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Révolutionner la santé : Découvrez BiMediX2

Un modèle bilingue qui transforme la communication médicale pour les patients et les pros.

2025-03-26T00:14:51+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes RHFL+: Une nouvelle ère pour l'apprentissage fédéré

RHFL+ s'attaque au bruit des données et aux différences de modèles dans l'apprentissage fédéré.

2025-03-17T12:24:45+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes UniMed : Transformer l'imagerie médicale avec des données

Un nouveau jeu de données révolutionne l'analyse des images médicales et de leurs descriptions.

2025-03-12T12:50:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes EarthDial : Ton pote de discussion sur l'environnement

Simplifier les données environnementales grâce à des discussions captivantes.

2025-02-13T14:49:39+00:00 ― 7 min lire