Des recherches montrent que l'ajustement avec des données en anglais peut améliorer la récupération d'informations multilingues.
― 7 min lire
La science de pointe expliquée simplement
Des recherches montrent que l'ajustement avec des données en anglais peut améliorer la récupération d'informations multilingues.
― 7 min lire
Un système qui génère des recettes de cuisine à partir d'images de nourriture.
― 7 min lire
HIGHT améliore les modèles de langage en utilisant des infos hiérarchiques provenant de données graphiques.
― 9 min lire
Cette étude examine comment les données visuelles et textuelles influencent la performance des modèles.
― 9 min lire
MathCAMPS propose une nouvelle façon d'évaluer le raisonnement mathématique dans les modèles linguistiques.
― 13 min lire
Ce boulot se concentre sur une meilleure représentation des chiffres en utilisant des embeddings pour des prédictions plus précises.
― 10 min lire
CD-T améliore la compréhension des modèles de transformateur, renforçant l'interprétation et la confiance.
― 5 min lire
Des recherches montrent que les modèles de langage ont du mal avec le raisonnement faux, ce qui soulève des préoccupations en matière de sécurité.
― 7 min lire
Une nouvelle approche améliore le raisonnement dans les modèles de langage en générant des erreurs contrôlées.
― 9 min lire
Examiner la relation entre les techniques de confidentialité et les biais dans les modèles de langage.
― 7 min lire
Cet article examine des méthodes pour évaluer des résumés de texte en utilisant de grands modèles de langage.
― 11 min lire
Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.
― 6 min lire
BAPO améliore les modèles de langage tout en gardant les connaissances essentielles et les préférences des utilisateurs.
― 7 min lire
De nouvelles méthodes améliorent la précision et l'efficacité des systèmes de reconnaissance vocale.
― 8 min lire
Améliorations du modèle BERT pour mieux gérer les documents juridiques turcs.
― 8 min lire
De nouvelles méthodes améliorent la confidentialité et la cohérence en utilisant des collocations dans les données linguistiques.
― 8 min lire
Une nouvelle méthode pour réécrire du texte qui garantit la vie privée tout en gardant le sens.
― 7 min lire
Un ensemble de données pour améliorer la notation automatisée et les retours dans l'éducation en ingénierie.
― 8 min lire
Cette étude explique comment les transformateurs utilisent le contexte dans la prédiction de langage.
― 12 min lire
Un nouvel outil améliore la précision de l'analyse de la théorie de la représentation du discours.
― 7 min lire
Voici GRASP, un benchmark pour évaluer le raisonnement spatial dans les modèles de langage.
― 9 min lire
Explorer l'efficacité des LLMs dans la prise de décision à travers des scénarios de Dueling Bandits.
― 10 min lire
Des modèles open-source plus petits offrent des solutions efficaces pour la notation automatisée des essais et des réponses courtes.
― 11 min lire
Les noms de différents pays influencent la façon dont les classificateurs interprètent le contenu des réseaux sociaux.
― 5 min lire
Explorer comment l'empathie améliore la communication avec les robots et les assistants virtuels.
― 8 min lire
Une étude révèle des risques pour la vie privée et des biais raciaux dans les diffusions de la police de Chicago.
― 7 min lire
Analyser comment les mèmes façonnent les opinions grâce à des techniques persuasives.
― 6 min lire
Un nouveau repère pour évaluer les grands modèles de langage dans les tests d'hypothèses.
― 9 min lire
Un cadre pour réduire les biais dans les modèles de langage IA tout en gardant l'exactitude.
― 8 min lire
Évaluer des méthodes pour améliorer la performance des modèles de langue sur de longs contextes.
― 9 min lire
ReGround3D améliore la compréhension des instructions humaines dans des environnements 3D.
― 6 min lire
Une nouvelle méthode améliore la sélection des mélanges de données pour l'entraînement des modèles de langue.
― 6 min lire
Une nouvelle méthode améliore l'efficacité et l'efficacité de LoRA en apprentissage automatique.
― 7 min lire
Explorer comment les données synthétiques façonnent les modèles d'apprentissage machine et leur comportement.
― 8 min lire
Les méthodes simplifiées surpassent les agents complexes dans la résolution de problèmes logiciels.
― 10 min lire
DogeRM combine des modèles généraux et spécifiques au domaine pour améliorer efficacement la performance des modèles de langue.
― 7 min lire
Une nouvelle méthode améliore les demandes des utilisateurs pour des résultats de modèles linguistiques plus sûrs et plus efficaces.
― 6 min lire
Un aperçu de la nouvelle approche de Larimar sur la mémoire dans les modèles de langage.
― 7 min lire
HyperLoader améliore l'entraînement de modèles multi-tâches avec des techniques innovantes et des hyperréseaux.
― 8 min lire
Une nouvelle méthode améliore la réponse aux questions dans les graphes de connaissances en utilisant des exemples.
― 8 min lire