De nouvelles méthodes améliorent l'adaptabilité des modèles linguistiques tout en gardant les connaissances passées.
― 7 min lire
La science de pointe expliquée simplement
De nouvelles méthodes améliorent l'adaptabilité des modèles linguistiques tout en gardant les connaissances passées.
― 7 min lire
Améliorer la précision des modèles de langue dans les questions médicales grâce à des techniques d'édition de modèle.
― 6 min lire
Un aperçu de comment les machines traitent le texte, les images et l'audio.
― 8 min lire
Examiner la fiabilité des retours humains pour évaluer les résultats des modèles de langue.
― 8 min lire
Un nouveau cadre améliore la détection des langages nuisibles en ligne grâce à un apprentissage continu.
― 9 min lire
De nouvelles méthodes améliorent la traduction automatique pour les langues à faible ressources.
― 5 min lire
Examiner comment les biais influencent la qualité des évaluations des modèles de langage.
― 7 min lire
Une nouvelle méthode combine des modèles de langage avec l'apprentissage par renforcement pour former des IA.
― 7 min lire
De nouvelles méthodes améliorent le traitement et la génération de la parole dans les modèles linguistiques.
― 6 min lire
SelfExtend propose une nouvelle approche pour améliorer le traitement de longs textes par les LLMs.
― 7 min lire
Ce papier examine des techniques pour réduire les hallucinations dans les modèles de langage pour une meilleure précision.
― 8 min lire
Un nouveau cadre améliore le raisonnement visuel en utilisant des modèles de langage comme contrôleurs.
― 7 min lire
Explorer comment les modèles de langue se remettent et s'adaptent après des changements.
― 10 min lire
Une nouvelle méthode améliore l'apprentissage de nouvelles classes avec moins de données.
― 5 min lire
Une nouvelle méthode pour diacritiser correctement le texte arabe est introduite.
― 10 min lire
Une nouvelle méthode améliore l'efficacité de la récupération à travers les langues sans avoir besoin de traduire lourdement.
― 9 min lire
Un nouveau jeu de données pour améliorer la reconnaissance d'images et de textes dans le e-commerce.
― 9 min lire
Examiner la nature et les capacités des modèles de langage pour générer du texte significatif.
― 9 min lire
Un ensemble de données teste les modèles de langue sur des tâches de langage autoréférentiel.
― 8 min lire
La fusion QE améliore la qualité de la traduction en combinant plusieurs résultats candidats.
― 7 min lire
Évaluer les modèles de langage sur leur capacité à comprendre le contexte dans la communication.
― 8 min lire
Une nouvelle approche utilisant des systèmes multi-agents pour améliorer les petits modèles de langage.
― 8 min lire
Une étude montre que les petits modèles de langage galèrent avec les questions à choix multiples.
― 8 min lire
Cette étude se concentre sur l'amélioration des méthodes de génération augmentée par récupération pour le portugais brésilien.
― 8 min lire
Un nouveau jeu de données renforce le lien entre la langue et les environnements 3D.
― 9 min lire
Une nouvelle méthode pour améliorer les temps de réponse dans les modèles de langage en séparant les phases de traitement.
― 8 min lire
Cette étude évalue la performance des modèles de langage sur des problèmes de maths modifiés.
― 6 min lire
Une nouvelle méthode améliore la façon dont on identifie les synonymes et les antonymes.
― 6 min lire
Enquête sur les risques des attaques de jailbreak sur les grands modèles de langage.
― 7 min lire
Le MuLanTTS de Microsoft propose des capacités de synthèse vocale en français naturelles et expressives.
― 6 min lire
MuMo accélère les performances des modèles de langage pour les scripts non-romains.
― 9 min lire
L'étude examine les neurones universels dans les modèles GPT-2 et leurs rôles.
― 5 min lire
Une étude sur les MLLMs et leurs performances dans des tâches de raisonnement non verbal.
― 9 min lire
Cet article explore l'utilisation de la théorie des jeux pour améliorer la communication via des modèles de langage.
― 10 min lire
Le modèle CLAP fait le lien entre le traitement audio et le traitement de texte pour plein d'applications.
― 5 min lire
Cette étude examine comment la structure du langage améliore les prédictions de mise en page dans les machines.
― 6 min lire
Un nouveau cadre accélère la récupération d'informations pour les modèles de langage.
― 8 min lire
Explorer des moyens d'améliorer l'étiquetage de séquence dans les modèles de langue.
― 8 min lire
Cet article examine comment les modèles de transformateurs gèrent les expressions multi-mots et les défis qui y sont associés.
― 9 min lire
Le Red Teaming basé sur les gradients améliore la sécurité des modèles de langage.
― 6 min lire