Un nouveau modèle reproduit une compréhension humaine dans les systèmes d'IA.
― 9 min lire
La science de pointe expliquée simplement
Un nouveau modèle reproduit une compréhension humaine dans les systèmes d'IA.
― 9 min lire
De nouvelles méthodes comme PromptFix aident à sécuriser les modèles de langue contre les menaces cachées.
― 6 min lire
Explorer la classification multi-label pour améliorer la reconnaissance des relations de discours.
― 10 min lire
Évaluer des méthodes pour un contrôle précis des caractéristiques du texte dans les sorties des LLM.
― 19 min lire
Une nouvelle approche améliore l'alignement des modèles de langage en utilisant peu de données annotées par des humains.
― 6 min lire
Une nouvelle méthode améliore l'alignement et la sécurité des grands modèles de langage.
― 8 min lire
Une nouvelle méthode éclaire comment les modèles de langage se souviennent des données d'entraînement.
― 11 min lire
Une nouvelle méthode améliore l'estimation de l'incertitude dans les modèles de langue, renforçant la confiance des utilisateurs.
― 7 min lire
Explore les capacités d'apprentissage des modèles de langage et leurs applications.
― 10 min lire
ABEX utilise Abstract-and-Expand pour améliorer les données d'entraînement pour les tâches de compréhension du langage naturel.
― 10 min lire
Ce document explore comment les MLLMs stockent et transfèrent des informations pour répondre à des questions visuelles.
― 8 min lire
Apprends à entraîner des modèles pour les embeddings de texte de manière intelligente et efficace.
― 6 min lire
De nouveaux systèmes améliorent la classification des valeurs morales dans les textes.
― 7 min lire
Cette étude examine comment les LLM gèrent les changements dans les tâches de résumé.
― 11 min lire
Un aperçu de l'importance de la culture dans les avancées du Traitement Automatique des Langues.
― 8 min lire
Cet outil simplifie la création et l'analyse de prompts pour des entrées de contenu mixte.
― 9 min lire
ETRASK améliore l'extraction de relations grâce à une sélection d'instances innovante et des modèles préentraînés.
― 7 min lire
Une nouvelle méthode améliore la performance des grands modèles de langage dans des domaines spécialisés.
― 10 min lire
FastGAS améliore l'efficacité dans la sélection d'exemples pour l'apprentissage en contexte en utilisant une approche basée sur des graphes.
― 9 min lire
Une méthode pour prévoir les réponses non-factuelles des modèles de langage avant qu'ils ne génèrent des réponses.
― 8 min lire
La méthode VTrans réduit significativement la taille des modèles de transformeurs sans sacrifier la performance.
― 6 min lire
Méthodes pour créer des timelines précises à partir des annotations d'événements dans les textes.
― 8 min lire
Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.
― 9 min lire
De nouvelles stratégies améliorent la capacité des modèles de langage à récupérer les connaissances de manière précise.
― 9 min lire
Une étude examine comment les modèles de langage ancrés comprennent des structures linguistiques complexes.
― 10 min lire
Cette recherche améliore les plans de transport rares pour une meilleure gestion et interprétation des données.
― 8 min lire
Analyse des facteurs qui affectent l'alignement dans les grands modèles de langage.
― 9 min lire
Un ensemble de données conçu pour améliorer la capacité des machines à répondre aux questions basées sur le temps.
― 9 min lire
Cette étude explore comment créer des phrases qui gardent des significations spécifiques en utilisant FrameNet.
― 12 min lire
EDEN connecte la reconnaissance des émotions avec l'analyse des causes pour mieux comprendre les dialogues.
― 6 min lire
Explorer les forces et les faiblesses des LLM pour différentes tâches business.
― 9 min lire
QCQA améliore les modèles de langage en optimisant l'utilisation de la mémoire tout en gardant la précision.
― 7 min lire
Un aperçu de l'intersection entre les systèmes de vidéo et de compréhension du langage.
― 9 min lire
De nouveaux repères garantissent que les systèmes d'IA restent pertinents avec les infos qui évoluent.
― 11 min lire
Un nouveau jeu de données aide à repérer le contenu subjectif dans les articles de news en arabe.
― 10 min lire
Cet article examine comment la négation affecte les grands modèles de langage et leur précision.
― 8 min lire
Un nouveau cadre améliore l'efficacité et la performance de la reconnaissance des entités nommées.
― 6 min lire
Découvre comment la morphologie computationnelle aide à mieux comprendre la langue.
― 8 min lire
Voici MoeSumm : un modèle de résumé flexible et efficace.
― 8 min lire
PairCFR améliore les modèles d'entraînement en utilisant des données contrefactuelles pour de meilleures performances.
― 10 min lire