Explore comment les LLMs peuvent améliorer la détection des bots tout en abordant les risques associés.
― 7 min lire
La science de pointe expliquée simplement
Explore comment les LLMs peuvent améliorer la détection des bots tout en abordant les risques associés.
― 7 min lire
Un aperçu des pièges de l'ajustement des instructions pour les modèles de langage IA.
― 10 min lire
La sélection efficace des données améliore la performance des modèles de langage pendant le réglage des instructions.
― 9 min lire
Présentation d'un outil pour créer des modèles de rapports de bugs personnalisés pour les développeurs de logiciels.
― 8 min lire
SafeCoder améliore la sécurité du code généré par les modèles de langage.
― 9 min lire
Une nouvelle méthode pour adapter les LLM sans avoir besoin de beaucoup d'étiquetage.
― 12 min lire
Examiner les tailles d'échantillon nécessaires pour que les modèles spécialisés surpassent les modèles généraux.
― 8 min lire
Une nouvelle méthode pour évaluer la précision des résultats des LLM en utilisant les dimensions intrinsèques locales.
― 6 min lire
Cette étude révèle le potentiel des petits modèles linguistiques dans les tâches de radiologie.
― 6 min lire
Utiliser des modèles de langue pour simplifier l'extraction d'infos en virologie.
― 9 min lire
Un nouveau benchmark évalue l'apprentissage continu dans les modèles de langage multimodaux.
― 8 min lire
Améliorer les capacités d'apprentissage des modèles d'IA grâce à de meilleures méthodes de formation.
― 8 min lire
Une évaluation de la façon dont les LLM se souviennent des informations factuelles et des facteurs impliqués.
― 7 min lire
Une nouvelle méthode, InsTa, améliore la sélection des tâches dans le réglage des instructions.
― 10 min lire
Un aperçu des menaces à la sécurité posées par les LLMs de code ajustés aux instructions.
― 7 min lire
Cet article explore les biais dans les modèles de génération de code à travers différentes langues.
― 10 min lire
Des recherches montrent que des instructions variées améliorent la performance des modèles de langage sur des tâches inédites.
― 9 min lire
Méthodes pour améliorer la qualité de la traduction dans les grands modèles de langage.
― 6 min lire
Un nouveau modèle améliore la compréhension vidéo en fusionnant des encodeurs d'images et de vidéos.
― 10 min lire
Une méthode pour améliorer les modèles de langue en créant des dialogues captivants sur plusieurs tours.
― 8 min lire
Cet article décrit une nouvelle méthode pour améliorer la génération de code Verilog en utilisant l'ajustement des instructions.
― 7 min lire
Un nouveau jeu de données vise à améliorer la compréhension des instructions persanes par l'IA.
― 9 min lire
Les modèles de code Granite améliorent l'efficacité du codage avec des capacités avancées de long contexte.
― 7 min lire
Mettre en avant les améliorations clés dans les techniques de génération d'arguments basées sur l'IA et les défis rencontrés.
― 7 min lire
TAGCOS optimise le réglage des instructions en choisissant des sous-ensembles de données efficaces pour les modèles de langage.
― 8 min lire
Une nouvelle approche améliore la façon dont les LLMs suivent des instructions complexes en utilisant le raisonnement symbolique.
― 8 min lire
La sélection efficace des données est essentielle pour améliorer la performance des modèles de langue.
― 7 min lire
Utiliser des LLMs pour améliorer les tâches e-commerce grâce au réglage des instructions et à la quantification.
― 7 min lire
CROME rend les modèles multimodaux plus faciles à utiliser avec moins de formation nécessaire.
― 7 min lire
Une méthode pour réduire les modèles de langage sans perdre en efficacité grâce à l'élagage et à la distillation.
― 6 min lire
Une nouvelle approche pour évaluer les modèles de langage avec des instructions et des tâches variées.
― 8 min lire
Améliorer les LLM pour une meilleure précision et cohérence dans la traduction médicale.
― 6 min lire
CRAFT simplifie la génération de jeux de données synthétiques pour différentes tâches avec un minimum d'interaction de l'utilisateur.
― 13 min lire
Une étude sur la performance des LLM en utilisant le réglage par instructions et l'apprentissage en contexte.
― 7 min lire
Une nouvelle méthode améliore les systèmes de récupération en utilisant des requêtes synthétiques sans données étiquetées.
― 7 min lire
Présentation de FMDLlama, un modèle linguistique pour détecter les fausses infos financières.
― 8 min lire
Une nouvelle méthode améliore les connaissances des modèles linguistiques à partir de données limitées.
― 9 min lire
Utiliser plusieurs perspectives d'annotateurs peut améliorer les modèles de classification de texte.
― 6 min lire
Le modèle et le dataset EAGLE améliorent la compréhension des vidéos égocentriques.
― 6 min lire
Une nouvelle méthode pour une sélection de données efficace dans le fine-tuning de l'IA.
― 6 min lire