Examiner comment les vision transformers comprennent les relations entre les objets dans les images.
― 9 min lire
La science de pointe expliquée simplement
Examiner comment les vision transformers comprennent les relations entre les objets dans les images.
― 9 min lire
Une étude révèle des différences clés dans la manière dont les humains et l'IA représentent les images.
― 8 min lire
Une étude sur la façon dont les VAE se comportent selon différents groupes démographiques sous attaque.
― 8 min lire
HEML améliore la classification d'images en se concentrant sur des segments importants pour de meilleures explications.
― 8 min lire
FALIP améliore la compréhension des images et du texte de CLIP sans modifier les originaux.
― 6 min lire
Ce projet vise à classifier les espèces de serpents en utilisant des techniques d'analyse d'image.
― 7 min lire
De nouvelles méthodes améliorent la détection des objets inclinés dans les images aériennes.
― 7 min lire
Une nouvelle mesure d'évaluation améliore la performance des modèles dans les tâches de classification multi-étiquette.
― 8 min lire
Un outil pour analyser et améliorer les erreurs de reconnaissance d'image par ordinateur.
― 8 min lire
SPIN propose des annotations détaillées pour les sous-parties afin d'améliorer la reconnaissance d'images.
― 11 min lire
NOVIC présente des capacités de vocabulaire ouvert pour identifier des objets inconnus dans les images.
― 10 min lire
De nouvelles méthodes d'attention améliorent l'efficacité et les performances des modèles de transformateurs.
― 6 min lire
Un programme améliore la détection d'objets par les robots dans des environnements qui changent.
― 6 min lire
Une nouvelle méthode améliore la clarté dans les tâches de reconnaissance d'images.
― 8 min lire
Un aperçu des forces et faiblesses des KAN et MLP en apprentissage automatique.
― 6 min lire
PEEKABOO aide les machines à localiser des objets sans données étiquetées grâce au masquage d'image.
― 7 min lire
De nouvelles méthodes rendent les modèles de reconnaissance d'images plus petits et plus efficaces.
― 7 min lire
MALT améliore l'efficacité et le succès des attaques adversariales dans les modèles de classification d'images.
― 7 min lire
Une nouvelle méthode améliore les performances d'adaptation de domaine en apprentissage automatique.
― 7 min lire
MoMa améliore l'efficacité dans le traitement d'images et de textes ensemble.
― 9 min lire
Une étude sur les défis et solutions pour les hallucinations dans les MLLMs.
― 5 min lire
Ce papier explore l'impact du bruit sur les sorties softmax et la précision de classification.
― 7 min lire
Cet article examine l'efficacité de YOLOv8 pour identifier la maturité des fraises.
― 8 min lire
Self-TPT simplifie le réglage des prompts pour les modèles vision-langage, améliorant la vitesse et l'efficacité.
― 10 min lire
Une nouvelle méthode améliore la reconnaissance de texte dans des scènes naturelles en utilisant des techniques innovantes.
― 7 min lire
Une nouvelle approche vise à améliorer la résistance de l'apprentissage actif aux attaques.
― 11 min lire
Une nouvelle méthode améliore la reconnaissance par le modèle des combinaisons attribut-objet jamais vues.
― 9 min lire
Des recherches montrent que l'exposition répétée améliore la reconnaissance d'images dans le cerveau.
― 8 min lire
Un nouveau cadre améliore l'adaptabilité de l'apprentissage automatique dans des environnements visuels variés.
― 8 min lire
Cet article examine l'impact des attaques sur les modèles de machine learning et les stratégies de défense.
― 9 min lire
Apprends comment les symétries de groupe peuvent améliorer les modèles de classification en apprentissage automatique.
― 8 min lire
Une nouvelle méthode vise à réduire les biais dans les modèles d'apprentissage machine pour plus d'équité.
― 6 min lire
Une nouvelle méthode améliore la clarté des dialogues grâce à des expressions référentielles efficaces.
― 8 min lire
Cette recherche vise à créer des CAPTCHAs qui embrouillent les machines mais qui sont clairs pour les humains.
― 7 min lire
Le dataset MIP-GAF aide à analyser les dynamiques sociales dans les images.
― 7 min lire
La recherche présente une méthode pour améliorer la reconnaissance d'images en utilisant moins d'exemples.
― 8 min lire
Une nouvelle méthode améliore le clustering pour les gros datasets en utilisant la Quantification Stochastique.
― 6 min lire
Cet article évalue le sentiment et le sens des légendes d'images.
― 5 min lire
Des recherches montrent des lacunes dans les modèles de classification d'images quand les objets sont partiellement cachés.
― 8 min lire
LPT++ améliore la reconnaissance d'objets dans des classes avec peu d'exemples grâce à des techniques avancées.
― 8 min lire