RepoExec évalue les performances de génération de code au niveau du dépôt.
― 9 min lire
La science de pointe expliquée simplement
RepoExec évalue les performances de génération de code au niveau du dépôt.
― 9 min lire
Un cadre améliore la génération de code pour des langages spécialisés en utilisant la documentation.
― 9 min lire
Job-SDF offre des infos sur l'évolution des compétences demandées sur le marché du travail d'aujourd'hui.
― 13 min lire
Une nouvelle approche améliore la prise de décision dans des environnements maritimes incertains.
― 8 min lire
Un nouveau jeu de données améliore le raisonnement multi-documents pour les questions d'éligibilité.
― 10 min lire
Une nouvelle approche pour améliorer les évaluations de sécurité des systèmes d'IA en utilisant des perspectives diverses.
― 6 min lire
SCEPTR propose une nouvelle façon de prédire la spécificité des TCR en utilisant efficacement des données limitées.
― 11 min lire
Cet article examine des modèles génératifs qui peuvent surpasser des experts humains aux échecs.
― 9 min lire
Un nouveau cadre aide les modèles de langage à apprendre le langage symbolique sans input humain.
― 9 min lire
La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.
― 10 min lire
Un kit d'outils pour évaluer la performance des modèles augmentés par récupération dans des domaines spécifiques.
― 13 min lire
Examiner comment le biais culturel influence la compréhension des images par l'IA.
― 11 min lire
De nouvelles méthodes révèlent des défis pour désapprendre des connaissances des modèles de langage.
― 8 min lire
Un aperçu de l'IA intersymbolique qui combine des méthodes symboliques et subsymboliques pour des systèmes plus intelligents.
― 7 min lire
Les agents linguistiques deviennent de plus en plus flexibles, améliorant leurs compétences en communication et en résolution de problèmes.
― 5 min lire
Des chercheurs ont développé le dataset GECO et GECOBench pour s'attaquer au biais de genre dans l'IA.
― 8 min lire
Une nouvelle méthode améliore la génération augmentée par récupération pour des questions complexes.
― 9 min lire
Un nouveau modèle à double transformateur améliore les prévisions de temps d'exécution à partir de l'analyse du code source.
― 8 min lire
Explore les défis de la supervision des modèles d'IA avancés avec des homologues plus faibles.
― 8 min lire
Ce papier présente des méthodes pour détecter des sites web peu fiables en utilisant des mots pièges.
― 9 min lire
Une étude sur la performance de petits modèles de langage ouverts sur différentes tâches.
― 8 min lire
Refiner améliore les réponses du modèle de langage en restructurant les infos récupérées.
― 9 min lire
Une étude sur la capacité de Copilot à générer du code dans différents langages de programmation.
― 8 min lire
De nouvelles approches améliorent la résilience des contrôleurs RL dans des environnements incertains.
― 8 min lire
GUICourse vise à améliorer l'interaction avec les interfaces numériques grâce à des ensembles de données ciblés pour les agents GUI.
― 6 min lire
VideoVista propose une évaluation complète pour les modèles de question-réponse vidéo.
― 8 min lire
Cette étude montre comment les modèles de langue changent de comportement pendant l'entraînement.
― 9 min lire
Combiner des CubeSats et des drones pour améliorer l'accès à la communication mondiale.
― 5 min lire
Cet article examine comment les modèles pré-entraînés apprennent des relations à travers des hypergraphes.
― 7 min lire
Aborder la distribution d'énergie pour des systèmes coopératifs robustes.
― 7 min lire
Analyser le lien entre la pollution et la hausse des températures pour des actions politiques efficaces.
― 9 min lire
Une nouvelle méthode pour comprendre comment les modèles audio font des prédictions.
― 6 min lire
Une étude sur les processus de prise de décision des grands modèles de langage.
― 6 min lire
MMNeedle teste des modèles multimodaux sur leurs capacités à gérer de longs contextes.
― 6 min lire
Un nouveau jeu de données améliore l'efficacité de recherche de code pour les développeurs qui utilisent des requêtes en langage naturel.
― 9 min lire
De nouvelles méthodes améliorent les prévisions en se concentrant sur la fonctionnalité du code plutôt que sur les noms de variables.
― 7 min lire
DrugWatch aide les utilisateurs à trouver facilement des infos sur la sécurité des médicaments.
― 8 min lire
Une méthode pour identifier les émotions et leurs causes dans des données non étiquetées.
― 6 min lire
SHiRA améliore l'efficacité du changement de modèle en IA sans perdre les concepts clés.
― 6 min lire
APPL simplifie le développement avec des modèles de langage de grande taille en utilisant une syntaxe intuitive, semblable à Python.
― 3 min lire