Un nouvel étalon pour évaluer la performance des agents IA dans la littérature biomédicale et les graphes de connaissances.
― 6 min lire
La science de pointe expliquée simplement
Un nouvel étalon pour évaluer la performance des agents IA dans la littérature biomédicale et les graphes de connaissances.
― 6 min lire
Une analyse de comment le langage reflète les croyances sur l'avortement parmi les utilisateurs de Reddit.
― 6 min lire
Une nouvelle méthode utilise la traduction pour améliorer l'entraînement des modèles de langue.
― 8 min lire
Une nouvelle façon d'évaluer les résumeurs personnalisés au-delà de la simple précision.
― 9 min lire
Des recherches montrent des stratégies efficaces pour utiliser des corpus parallèles dans des modèles multilingues.
― 7 min lire
Améliore l'entraînement des modèles pour les tâches de codage grâce à des techniques de taille de données efficaces.
― 6 min lire
De nouveaux modèles améliorent le balisage automatique des textes en latin médiéval pour une meilleure analyse.
― 8 min lire
Cet article met en avant le besoin d'une classification claire dans les tâches de langage à long contexte.
― 6 min lire
GraphArena évalue la performance des LLM sur des problèmes de graphes en utilisant des données du monde réel.
― 8 min lire
Cette étude explore le compromis entre la diversité et l'exactitude factuelle dans les images générées par l'IA.
― 16 min lire
Utiliser la tech pour améliorer la vérification des faits et combattre la désinfo efficacement.
― 7 min lire
Cet article présente une méthode qui simplifie la recherche et la génération de texte en PNL.
― 10 min lire
Une nouvelle méthode améliore la performance des LLM dans les tâches mathématiques complexes.
― 7 min lire
Une nouvelle méthode combine le raisonnement basé sur le texte et le SQL pour améliorer les réponses aux questions sur les tables.
― 7 min lire
Le dataset MalAlgoQA évalue le raisonnement des grands modèles de langage dans des scénarios contrefactuels.
― 7 min lire
Des recherches montrent que l'ajustement avec des données en anglais peut améliorer la récupération d'informations multilingues.
― 7 min lire
Un système qui génère des recettes de cuisine à partir d'images de nourriture.
― 7 min lire
HIGHT améliore les modèles de langage en utilisant des infos hiérarchiques provenant de données graphiques.
― 9 min lire
Cette étude examine comment les données visuelles et textuelles influencent la performance des modèles.
― 9 min lire
MathCAMPS propose une nouvelle façon d'évaluer le raisonnement mathématique dans les modèles linguistiques.
― 13 min lire
Ce boulot se concentre sur une meilleure représentation des chiffres en utilisant des embeddings pour des prédictions plus précises.
― 10 min lire
CD-T améliore la compréhension des modèles de transformateur, renforçant l'interprétation et la confiance.
― 5 min lire
Des recherches montrent que les modèles de langage ont du mal avec le raisonnement faux, ce qui soulève des préoccupations en matière de sécurité.
― 7 min lire
Une nouvelle approche améliore le raisonnement dans les modèles de langage en générant des erreurs contrôlées.
― 9 min lire
Examiner la relation entre les techniques de confidentialité et les biais dans les modèles de langage.
― 7 min lire
Cet article examine des méthodes pour évaluer des résumés de texte en utilisant de grands modèles de langage.
― 11 min lire
Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.
― 6 min lire
BAPO améliore les modèles de langage tout en gardant les connaissances essentielles et les préférences des utilisateurs.
― 7 min lire
De nouvelles méthodes améliorent la précision et l'efficacité des systèmes de reconnaissance vocale.
― 8 min lire
Améliorations du modèle BERT pour mieux gérer les documents juridiques turcs.
― 8 min lire
De nouvelles méthodes améliorent la confidentialité et la cohérence en utilisant des collocations dans les données linguistiques.
― 8 min lire
Une nouvelle méthode pour réécrire du texte qui garantit la vie privée tout en gardant le sens.
― 7 min lire
Un ensemble de données pour améliorer la notation automatisée et les retours dans l'éducation en ingénierie.
― 8 min lire
Cette étude explique comment les transformateurs utilisent le contexte dans la prédiction de langage.
― 12 min lire
Un nouvel outil améliore la précision de l'analyse de la théorie de la représentation du discours.
― 7 min lire
Voici GRASP, un benchmark pour évaluer le raisonnement spatial dans les modèles de langage.
― 9 min lire
Explorer l'efficacité des LLMs dans la prise de décision à travers des scénarios de Dueling Bandits.
― 10 min lire
Des modèles open-source plus petits offrent des solutions efficaces pour la notation automatisée des essais et des réponses courtes.
― 11 min lire
Les noms de différents pays influencent la façon dont les classificateurs interprètent le contenu des réseaux sociaux.
― 5 min lire
Explorer comment l'empathie améliore la communication avec les robots et les assistants virtuels.
― 8 min lire