Analyser les histoires des réseaux sociaux et leurs effets sur les tendances économiques.
― 13 min lire
La science de pointe expliquée simplement
Analyser les histoires des réseaux sociaux et leurs effets sur les tendances économiques.
― 13 min lire
Les traits des utilisateurs influencent les réponses des modèles de langage et leur sécurité.
― 8 min lire
Cet article explore l'impact du poisoning des données sur l'alignement des modèles de langage.
― 8 min lire
Un nouveau modèle augmente la précision dans la compréhension du langage naturel en utilisant des prédictions d'experts.
― 8 min lire
Introduction d'une augmentation réfléchie pour améliorer les compétences en résolution de problèmes mathématiques des modèles linguistiques.
― 8 min lire
Cet article parle du soft prompting comme méthode pour désapprendre dans les LLMs.
― 9 min lire
Self-MoE crée des experts spécialisés pour améliorer la performance des modèles de langage.
― 8 min lire
Examiner les biais dans les modèles de langage utilisés pour l'analyse et les solutions en santé mentale.
― 11 min lire
Utiliser des modèles de langage améliore les prédictions pour les données tabulaires dans différents domaines.
― 9 min lire
Une nouvelle méthode améliore l'efficacité des conversations dans les modèles de langage grâce à des techniques de planification.
― 9 min lire
Les enfants apprennent la langue en fusionnant le sens et la grammaire à travers des input visuels et textuels.
― 8 min lire
Apprends comment les transcoder aident à clarifier des modèles de langage complexes.
― 6 min lire
Une nouvelle méthode améliore les tests pour les modèles de langage en utilisant des données réelles des utilisateurs.
― 7 min lire
Examiner les limites des grands modèles de langage dans la compréhension des relations de code.
― 9 min lire
Un cadre améliore la génération de code pour des langages spécialisés en utilisant la documentation.
― 9 min lire
Une analyse de comment les LLMs apprennent et retiennent des informations factuelles.
― 6 min lire
Un nouveau jeu de données améliore le raisonnement multi-documents pour les questions d'éligibilité.
― 10 min lire
Une nouvelle approche pour améliorer les évaluations de sécurité des systèmes d'IA en utilisant des perspectives diverses.
― 6 min lire
Un nouveau cadre aide les modèles de langage à apprendre le langage symbolique sans input humain.
― 9 min lire
Examiner la mémorisation dans les modèles de complétion de code et ses implications pour la vie privée.
― 10 min lire
TreeInstruct guide les étudiants dans le débogage grâce à des méthodes de questionnement efficaces.
― 7 min lire
La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.
― 10 min lire
Un kit d'outils pour évaluer la performance des modèles augmentés par récupération dans des domaines spécifiques.
― 13 min lire
TourRank améliore le classement des documents en utilisant une approche basée sur des tournois.
― 6 min lire
Examiner comment le biais culturel influence la compréhension des images par l'IA.
― 11 min lire
Une étude qui évalue les biais culturels dans les modèles de langage populaires.
― 8 min lire
Cette étude propose une méthode pour mesurer les différences culturelles en utilisant les réseaux sociaux.
― 9 min lire
De nouvelles méthodes révèlent des défis pour désapprendre des connaissances des modèles de langage.
― 8 min lire
L'annotation de l'erreur Span propose une approche rapide et fiable pour évaluer la qualité de la traduction.
― 7 min lire
Évaluer comment les modèles de langue gèrent les indices culturels dans des tâches réelles.
― 10 min lire
STimage-1K4M combine des images détaillées et des données génétiques pour améliorer la recherche sur les maladies.
― 8 min lire
Les agents linguistiques deviennent de plus en plus flexibles, améliorant leurs compétences en communication et en résolution de problèmes.
― 5 min lire
Des chercheurs ont développé le dataset GECO et GECOBench pour s'attaquer au biais de genre dans l'IA.
― 8 min lire
Une nouvelle méthode améliore la génération augmentée par récupération pour des questions complexes.
― 9 min lire
Explore les défis de la supervision des modèles d'IA avancés avec des homologues plus faibles.
― 8 min lire
Ce papier présente des méthodes pour détecter des sites web peu fiables en utilisant des mots pièges.
― 9 min lire
Une étude sur la performance de petits modèles de langage ouverts sur différentes tâches.
― 8 min lire
Refiner améliore les réponses du modèle de langage en restructurant les infos récupérées.
― 9 min lire
Cet article examine comment les LLMs se débrouillent dans les tâches de raisonnement syllogistique.
― 7 min lire
Une nouvelle méthode réécrit le texte pour une meilleure compréhension à différents niveaux de lecture.
― 7 min lire