Une nouvelle méthode améliore la classification des plantes grâce à des techniques d'apprentissage profond multimodal.
― 11 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la classification des plantes grâce à des techniques d'apprentissage profond multimodal.
― 11 min lire
Améliorer l'accès aux artefacts de recherche renforce les efforts de qualité des exigences logicielles.
― 7 min lire
MultiEdits permet de modifier plusieurs images en même temps grâce à des invites textuelles, améliorant ainsi l'efficacité et la qualité.
― 7 min lire
Présentation de la planification ouverte ancrée pour améliorer l'exécution des tâches dans le monde réel.
― 12 min lire
De nouvelles méthodes visent à améliorer les capacités de raisonnement des modèles de langage.
― 8 min lire
Croissant-RAI améliore la qualité des données et leur utilité pour les applis d'IA.
― 8 min lire
Une étude sur le réglage des agents de contrôle informatique pour améliorer la performance des tâches.
― 9 min lire
Améliorer les méthodes pour évaluer la similarité de sens entre les phrases en langage naturel.
― 8 min lire
Un nouveau jeu de données évalue le raisonnement des grands modèles de langage avec des requêtes complexes.
― 11 min lire
Explorer la classification multi-label pour améliorer la reconnaissance des relations de discours.
― 10 min lire
Un nouveau jeu de données améliore l'étude de l'identification des Ragas dans la musique indienne.
― 7 min lire
Présentation d'un ensemble de données pour améliorer les efforts d'observation de la Terre en utilisant diverses données satellites.
― 8 min lire
Une nouvelle méthode pour évaluer le raisonnement de bon sens dans les modèles d'IA à travers des tâches ouvertes.
― 11 min lire
Cette étude examine comment les LLM gèrent les changements dans les tâches de résumé.
― 11 min lire
Les collections UltraMedical améliorent les modèles de langage médical et traitent les pénuries de données.
― 8 min lire
Un ensemble de données pour identifier la propagande dans les mèmes arabes pour une meilleure culture médiatique.
― 6 min lire
Un nouveau système évalue les risques de sécurité dans les images générées par des modèles d'IA.
― 10 min lire
Une nouvelle approche pour comprendre les métaphores dans les vidéos grâce aux sous-titres automatisés.
― 11 min lire
Une étude récente reproduit des résultats clés sur l'interprétation des données en utilisant le son et les visuels.
― 8 min lire
Une étude présente un nouveau critère pour évaluer la performance des prompts dans la création et la récupération d'images.
― 15 min lire
Le défi ULS23 vise à améliorer la segmentation des tumeurs dans les scans CT pour un meilleur soin du cancer.
― 7 min lire
Une étude sur l'efficacité de différents modèles légers dans la classification d'images.
― 9 min lire
Un nouveau jeu de données aide à repérer le contenu subjectif dans les articles de news en arabe.
― 10 min lire
Cette étude évalue la capacité de GPT-4 à extraire des données de la littérature sur les matériaux.
― 8 min lire
Un cadre conçu pour standardiser le benchmarking dans la recherche en deep learning topologique.
― 10 min lire
Une nouvelle approche améliore la détection des vulnérabilités de sécurité logicielle en utilisant des modèles avancés.
― 10 min lire
MedExQA fixe un nouveau standard pour évaluer les modèles de langage médical en mettant l’accent sur les explications.
― 9 min lire
Une nouvelle approche pour prédire les changements d'UI des applis mobiles en fonction des actions des utilisateurs.
― 6 min lire
Une nouvelle méthode améliore les LLMs pour générer du code UI de haute qualité.
― 10 min lire
Cette étude présente une méthode pour analyser efficacement des ensembles de données biologiques complexes.
― 9 min lire
OphNet améliore l'analyse du flux de travail chirurgical avec un riche jeu de données vidéo.
― 8 min lire
Analyser des mèmes nuisibles et leurs effets sur la société.
― 7 min lire
Une étude examine la robustesse des modèles de segmentation face aux attaques adversariales dans le domaine de la santé.
― 9 min lire
Une étude révèle des différences de biais dans les modèles linguistiques à travers différentes langues.
― 7 min lire
Une nouvelle méthode améliore la détection de petites cibles en mouvement dans les images infrarouges.
― 8 min lire
mOSCAR fournit un ensemble de données multilingues pour améliorer la compréhension des textes et des images par l'IA.
― 8 min lire
Un ensemble de données complet fusionnant images et textes pour aider l'apprentissage automatique.
― 8 min lire
De nouvelles méthodes améliorent les ensembles de données d'images tout en garantissant la vie privée et la performance.
― 7 min lire
Un nouveau benchmark teste le raisonnement compositionnel dans les modèles avancés.
― 9 min lire
Cette étude examine les méthodes audio pour suivre les mouvements des piétons dans les zones urbaines.
― 9 min lire