Un aperçu complet des grands modèles de langage, de leurs utilisations et des défis.
― 10 min lire
La science de pointe expliquée simplement
Un aperçu complet des grands modèles de langage, de leurs utilisations et des défis.
― 10 min lire
VCSum fournit un ensemble de données complet pour une bonne résumé de réunions en chinois.
― 8 min lire
Cette recherche améliore la traduction automatique de texte à partir d'images en utilisant plusieurs modèles enseignants.
― 6 min lire
De nouvelles méthodes améliorent le contrôle de la longueur des résumés pour une meilleure qualité.
― 7 min lire
Un aperçu des récentes améliorations dans la reconnaissance des noms dans le texte coréen.
― 9 min lire
Le dataset WikiSQE met en avant les problèmes de qualité dans les phrases de Wikipédia.
― 7 min lire
Un nouveau cadre d'IA relie les images et le langage pour mieux gérer les tâches.
― 6 min lire
Ce travail explore comment les robots peuvent mieux planifier des tâches en utilisant le langage et des infos visuelles.
― 10 min lire
Cette étude évalue les modèles BERT pour le traitement du langage naturel sur des appareils à faibles ressources.
― 14 min lire
Une nouvelle approche combine des éléments visuels et des connaissances externes pour améliorer les réponses aux questions.
― 8 min lire
Une nouvelle méthode améliore le raisonnement des modèles de langage et gère les éléments distracteurs de manière efficace.
― 10 min lire
Cet article examine comment les LLM gèrent les connaissances négatives et les défis qui vont avec.
― 7 min lire
Examiner comment les modèles de langage perdent des connaissances pendant l'entraînement continu.
― 7 min lire
De nouvelles méthodes améliorent les modèles de langue pour mieux comprendre les langues à faibles ressources.
― 6 min lire
Decker combine des sources de connaissance pour améliorer la vérification du bon sens.
― 7 min lire
Une étude sur l'impact des biais dans les grands modèles de langage pendant le questionnement.
― 15 min lire
De nouvelles méthodes améliorent la synthèse des conversations entre médecins et patients pour un meilleur soins de santé.
― 8 min lire
PT-* améliore le traitement du langage pour les locuteurs portugais, renforçant les capacités de l'IA.
― 6 min lire
Un nouveau modèle combine des données audio et texte pour améliorer la précision de la reconnaissance vocale.
― 7 min lire
Méthodes pour améliorer la classification des intentions des chatbots avec un minimum de données d'entraînement.
― 7 min lire
Ce document présente un nouveau modèle multilingue pour améliorer le traitement des langues.
― 8 min lire
Un ensemble de données vise à améliorer les réponses aux questions dans les langues africaines.
― 8 min lire
Une méthode pour améliorer l'efficacité dans l'entraînement des modèles de langue grâce à la sélection de données.
― 8 min lire
Une nouvelle méthode aide les machines à garder des connaissances dans les tâches d'extraction de relations.
― 9 min lire
Le modèle SCKD améliore l'apprentissage continu pour l'extraction de relations tout en résolvant les problèmes d'oubli.
― 6 min lire
Une étude sur l'amélioration des recommandations basées sur le contenu en utilisant des LLMs.
― 7 min lire
Une nouvelle méthode pour sélectionner des travailleurs de foule améliore la qualité de l'étiquetage des données et réduit les coûts.
― 7 min lire
Un nouvel outil qui relie le texte et les images pour différentes tâches.
― 8 min lire
Une nouvelle méthode utilise la fréquence des mots pour mieux sélectionner les dimensions dans les embeddings de mots.
― 7 min lire
RepAL améliore les représentations de phrases en filtrant efficacement les infos inutiles.
― 6 min lire
Améliorer les petits modèles pour les questions médicales grâce à des techniques innovantes et des méthodes de données.
― 8 min lire
Une nouvelle façon d'évaluer la qualité de traduction sans données étiquetées.
― 7 min lire
Une nouvelle approche améliore les représentations de phrases en utilisant plusieurs instances similaires.
― 6 min lire
Examiner les risques et effets du détournement de modèles en traitement du langage naturel.
― 11 min lire
Une nouvelle méthode met en lumière les biais dans les réponses des modèles de langage.
― 8 min lire
Un aperçu de la capacité de ChatGPT à raisonner de manière causale.
― 7 min lire
Open-WikiTable propose un dataset pour répondre à des questions complexes en utilisant des données de tableau.
― 8 min lire
SCENE automatise la création d'exemples négatifs pour améliorer l'entraînement des modèles de langue.
― 8 min lire
Une étude révèle les forces et les faiblesses des gros modèles pour traiter le texte dans les images.
― 6 min lire
Une nouvelle méthode améliore la réponse aux questions vidéo en analysant les connexions d'événements.
― 7 min lire