Un aperçu de la façon de contrôler le comportement des modèles de langage avec la technique KL-then-steer.
― 7 min lire
La science de pointe expliquée simplement
Un aperçu de la façon de contrôler le comportement des modèles de langage avec la technique KL-then-steer.
― 7 min lire
Examiner comment les modèles de langage gèrent les mots espagnols ambigus à travers un nouveau dataset.
― 7 min lire
Cet article parle des risques de sécurité et des stratégies de défense pour les grands modèles de langage.
― 11 min lire
Cet article parle de l'adaptation des modèles de langue pour un meilleur soutien dans différentes langues.
― 6 min lire
Une étude sur comment les modèles de langage peuvent ignorer les instructions et leurs implications.
― 9 min lire
Cette recherche améliore la planification des modèles de langage grâce à des cartes cognitives.
― 7 min lire
Une étude évalue comment les machines créent de la poésie variée et créative comparée à celle des humains.
― 8 min lire
Une étude sur comment les machines s'adaptent aux changements phonologiques dans la parole.
― 8 min lire
Une nouvelle méthode améliore notre façon d'évaluer les contre-narrations à la haine.
― 8 min lire
Des recherches montrent que les modèles non entraînés se connectent aux réponses du cerveau humain dans le traitement du langage.
― 11 min lire
Les recherches mettent en lumière les capacités d'apprentissage en contexte des grands modèles de langage.
― 8 min lire
Un nouveau cadre améliore la représentation des valeurs humaines diverses par les modèles linguistiques.
― 9 min lire
La recherche évalue les capacités de vérification des affirmations des modèles de langage en utilisant un nouveau dataset.
― 7 min lire
Cet article examine comment certains neurones influencent l'incertitude dans les prédictions des modèles de langage.
― 7 min lire
Cette étude présente un ensemble de données et une méthode pour améliorer la précision de la reconnaissance vocale chinoise en utilisant le Pinyin.
― 9 min lire
De nouvelles méthodes améliorent les compétences de raisonnement des modèles de langage pour de meilleures performances sur les tâches.
― 9 min lire
Une nouvelle méthode améliore la façon dont les modèles linguistiques s'alignent avec les valeurs humaines.
― 8 min lire
Une analyse des modèles de langage et leur rôle dans le secteur de la santé.
― 8 min lire
Un nouveau modèle fusionne Mamba et Transformer pour une meilleure traitement du langage.
― 6 min lire
Une nouvelle méthode combine la vision et le langage pour estimer la position d'objets invisibles.
― 7 min lire
Explorer des méthodes pour améliorer les LLM pour des applications pratiques.
― 12 min lire
Une étude évalue comment les MLLM comprennent les données visuelles et leur performance par rapport aux humains.
― 7 min lire
Évaluer comment les LLM créent des textes persuasifs sur différents sujets.
― 7 min lire
Une nouvelle méthode aborde la contamination des données dans les tests des modèles linguistiques.
― 7 min lire
FineWeb propose 15 trillions de jetons pour améliorer l'entraînement des modèles linguistiques.
― 10 min lire
Cette étude évalue la performance des modèles linguistiques en utilisant les tests INVALSI italiens.
― 10 min lire
Une étude sur la traduction de l'anglais nigérian pour une meilleure accessibilité dans les films de Nollywood.
― 7 min lire
L'auto-jeu peut-il améliorer les performances des modèles linguistiques dans des contextes coopératifs ?
― 8 min lire
Évaluation des stratégies pour gérer les problèmes de droit d'auteur dans les modèles de langue.
― 9 min lire
NeBuLa améliore la prédiction des actions à partir des conversations dans les jeux vidéo collaboratifs.
― 8 min lire
Cet article examine si les grands modèles de langage ont des croyances et des intentions.
― 7 min lire
Un aperçu des automates, de leurs types et de leurs utilisations pratiques en informatique.
― 7 min lire
Une nouvelle méthode améliore la performance des réseaux neuronaux à décharge dans les tâches linguistiques.
― 8 min lire
Nouveau modèle améliore la traduction de la parole en texte en utilisant des grands modèles de langage.
― 8 min lire
Une nouvelle approche pour améliorer la précision dans la vérification des informations générées par les modèles linguistiques.
― 7 min lire
Cet article examine comment le choix des mots affecte la performance des modèles de langage.
― 8 min lire
Une nouvelle méthode mesure comment les modèles linguistiques adaptent leurs croyances avec de nouvelles preuves.
― 11 min lire
Un nouveau référentiel évalue l'efficacité des modèles de langage dans les applications robotiques.
― 8 min lire
Des recherches montrent des stratégies efficaces pour utiliser des corpus parallèles dans des modèles multilingues.
― 7 min lire
Des recherches montrent que les modèles de langage ont du mal avec le raisonnement faux, ce qui soulève des préoccupations en matière de sécurité.
― 7 min lire