Une étude évalue la capacité des LLM à créer des données de questions-réponses culturellement pertinentes.
― 7 min lire
La science de pointe expliquée simplement
Une étude évalue la capacité des LLM à créer des données de questions-réponses culturellement pertinentes.
― 7 min lire
Cet article examine la fiabilité des opinions politiques dans les grands modèles de langage.
― 7 min lire
Un nouveau standard pour évaluer les capacités de conversation coréenne des modèles de langage.
― 8 min lire
Découvre pourquoi la tokenisation est essentielle pour que les ordinateurs comprennent le langage humain.
― 9 min lire
Cette étude examine le biais de genre dans les grands modèles de langage dans plusieurs langues.
― 9 min lire
De nouvelles méthodes visent à mieux évaluer les compétences en raisonnement des modèles de langage IA.
― 8 min lire
Un nouveau standard pour améliorer la précision de la reconnaissance vocale avec des modèles de langue.
― 8 min lire
La modification de modèles peut amplifier les biais et la désinformation dans les modèles de langage.
― 8 min lire
MediSwift révolutionne le traitement du langage biomédical avec des modèles efficaces axés sur les tâches médicales.
― 8 min lire
Une nouvelle méthode pour améliorer les modèles de langage malgré les retours humains bruyants.
― 8 min lire
Cette étude examine comment améliorer les traductions anglais-irlandais en utilisant des modèles de traduction automatique avancés.
― 7 min lire
Cette étude présente une méthode pour trouver des significations qui ne sont pas listées dans les dictionnaires.
― 11 min lire
Examinant la capacité des LLMs à résoudre des problèmes mathématiques, surtout l'arithmétique modulaire.
― 10 min lire
NusaBERT améliore la compréhension des langues et dialectes variés d'Indonésie.
― 8 min lire
NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.
― 10 min lire
Une nouvelle méthode réduit le temps de localisation linguistique dans les études sur le cerveau.
― 9 min lire
Intégrer des données visuelles booste la technologie de traduction pour de meilleurs résultats.
― 10 min lire
Une méthode pour transformer les pensées négatives en pensées positives.
― 8 min lire
Un nouveau dataset pour évaluer les compétences de planification des modèles linguistiques dans des tâches de la vie réelle.
― 9 min lire
Une approche structurée pour améliorer la recherche de documents basée sur des thèmes spécifiques.
― 6 min lire
Combiner des modèles de langue améliore les performances dans différentes tâches grâce à la collaboration.
― 8 min lire
Une étude sur l'efficacité de GPT-4 pour simplifier des phrases.
― 7 min lire
Une nouvelle métrique offre des aperçus sur comment on combine les significations dans la langue.
― 9 min lire
Présentation d'une méthode pour évaluer la fiabilité des résultats des modèles de langage.
― 8 min lire
Une nouvelle approche pour récompenser la sur-optimisation dans les modèles de langage en utilisant l'estimation d'incertitude.
― 9 min lire
APRICOT renforce la confiance dans les modèles de langage en mesurant avec précision la confiance des réponses.
― 9 min lire
Une analyse de la compréhension des règles de reconnaissance d'entités par les modèles de langage.
― 8 min lire
Un système intelligent pour reconnaître plusieurs langues sans entraînement préalable.
― 9 min lire
Des recherches ont montré comment les structures de phrase influencent notre traitement du langage.
― 8 min lire
Des recherches montrent que les modèles de langage galèrent avec les constructions de cause et mouvement.
― 6 min lire
Cette étude révèle le potentiel des petits modèles linguistiques dans les tâches de radiologie.
― 6 min lire
Cet article parle de comment les modèles linguistiques aident à identifier les discours de haine.
― 7 min lire
Cette étude aborde les défis liés à l'édition des modèles linguistiques et à la diminution des effets indésirables.
― 7 min lire
Examiner comment les modèles de langue se rappellent des infos : accès séquentiel vs accès aléatoire.
― 9 min lire
SHROOM vise à identifier et améliorer la précision des systèmes de génération de langage.
― 7 min lire
Un nouveau benchmark évalue l'apprentissage continu dans les modèles de langage multimodaux.
― 8 min lire
Évaluer comment les biais dans les modèles de langage affectent les applications dans le monde réel.
― 7 min lire
Une nouvelle méthode améliore la façon dont les LLMs apprennent des exemples.
― 10 min lire
SelfIE aide les LLM à expliquer leurs processus de pensée de manière claire et fiable.
― 6 min lire
Nouveau jeu de données qui se concentre sur l'amélioration de la performance des modèles de langue bengali.
― 8 min lire