Derniers articles pour Traitement du langage naturel

Calcul et langage Améliorer l'entraînement des grands modèles de langage

Une nouvelle approche améliore le processus d'entraînement des grands modèles de langage.

2025-08-09T15:21:30+00:00 ― 8 min lire

Apprentissage automatique Améliorer les conversations en temps réel avec des modèles de langue

Une nouvelle méthode améliore les interactions de chat en simulant un dialogue en temps réel.

2025-08-09T15:13:36+00:00 ― 7 min lire

Apprentissage automatique Améliorer l'efficacité des modèles de langue avec une attention inter-couches

L'attention croisée réduit les besoins en mémoire tout en maintenant la performance du modèle dans le traitement du langage.

2025-08-09T13:23:00+00:00 ― 9 min lire

Calcul et langage Comparer les modèles de langage causals et masqués dans la génération de texte

Cette étude examine la performance des CLM et MLM dans la génération de texte.

2025-08-09T10:05:30+00:00 ― 10 min lire

Calcul et langage Mesurer l'émergence dans les grands modèles de langage

Explorer une nouvelle méthode pour comprendre l'émergence dans les modèles de langage.

2025-08-09T09:57:36+00:00 ― 9 min lire

Calcul et langage Améliorer la vérification des faits avec auto-instruction et ajustement fin

Une nouvelle méthode améliore la précision et la clarté de la vérification des faits.

2025-08-09T09:49:42+00:00 ― 7 min lire

Calcul et langage Améliorer la découverte de circuits dans les modèles de langage

Une nouvelle méthode améliore l'identification des circuits dans les grands modèles de langage.

2025-08-09T09:18:06+00:00 ― 8 min lire

Calcul et langage Nouvelles méthodes pour aligner les modèles de langage en toute sécurité

Des techniques innovantes d'édition de modèles offrent des résultats de modèles linguistiques plus sûrs sans avoir besoin de réentraînement intensif.

2025-08-09T03:14:42+00:00 ― 7 min lire

Intelligence artificielle Reévaluer ReAct : Un regard de plus près sur l'ingénierie des invites

Cette étude remet en question l'efficacité de ReAct pour améliorer la performance des LLM.

2025-08-09T03:06:48+00:00 ― 8 min lire

Apprentissage automatique Présentation d'Aaren : Une nouvelle approche de l'attention dans les réseaux neuronaux

Aaren améliore l'efficacité des modèles basés sur l'attention pour l'analyse de données séquentielles.

2025-08-09T02:51:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Méthode innovante pour la compréhension vidéo avec représentation textuelle

Une nouvelle approche aligne les modèles de langage avec le contenu vidéo en utilisant des simulations textuelles.

2025-08-09T01:39:54+00:00 ― 8 min lire

Intelligence artificielle Améliorer le raisonnement des LLM avec des graphes de connaissances

Une nouvelle méthode combine des LLM et des KG pour améliorer la précision du raisonnement.

2025-08-09T01:24:06+00:00 ― 8 min lire

Apprentissage automatique Analyser les circuits dans les modèles de transformateurs pour de meilleures performances

Cet article explore des techniques d'analyse de circuits dans les modèles de transformateurs pour améliorer le traitement du langage.

2025-08-09T01:16:12+00:00 ― 7 min lire

Calcul et langage Évaluer des histoires avec des modèles de langage

Examiner comment les modèles de langage évaluent et génèrent des récits captivants.

2025-08-08T23:25:36+00:00 ― 9 min lire

Calcul et langage S'attaquer à la taxe d'alignement dans les modèles de langue

Un nouveau cadre réduit les biais de données, améliorant les performances de suivi des instructions dans les modèles de langage.

2025-08-08T19:20:42+00:00 ― 10 min lire

Apprentissage automatique Utiliser des grands modèles de langage pour façonner les récompenses dans l'apprentissage par renforcement

Ce travail explore le rôle des LLM dans l'amélioration de l'apprentissage par renforcement avec le façonnement des récompenses.

2025-08-08T16:19:00+00:00 ― 9 min lire

Génie logiciel OptLLM : Simplifier le choix de LLM pour des performances rentables

OptLLM aide les utilisateurs à choisir les meilleurs LLMs en fonction des budgets et des tâches.

2025-08-08T15:07:54+00:00 ― 8 min lire

Calcul et langage Amélioration des systèmes de dialogue grâce à la prise en compte de l'historique des conversations

Cette recherche souligne le besoin d'une meilleure évaluation de l'utilisation de l'historique des conversations par les systèmes de dialogue.

2025-08-08T14:28:24+00:00 ― 7 min lire

Génomique LangCell : Une nouvelle façon d'analyser les cellules

LangCell combine des données de cellule et du langage naturel pour une meilleure analyse des cellules.

2025-08-08T14:23:45+00:00 ― 9 min lire

Calcul et langage Faire progresser la compréhension du langage parlé avec le CCL

Une nouvelle méthode améliore la façon dont les systèmes gèrent les erreurs dans la compréhension du langage parlé.

2025-08-08T14:20:30+00:00 ― 8 min lire

Calcul et langage Classement à Granularité Variable : Une Nouvelle Approche de la Recherche d'Informations

Cet article parle d'une méthode de classement flexible utilisant des embeddings multi-vecteurs pour de meilleurs résultats de recherche.

2025-08-08T13:25:12+00:00 ― 8 min lire

Calcul et langage Défis et stratégies dans l'évaluation des modèles de langage

Cet article parle des problèmes et des meilleures pratiques pour évaluer les modèles linguistiques.

2025-08-08T10:07:42+00:00 ― 9 min lire

Apprentissage automatique Présentation d'AGILE : un nouveau cadre pour les agents LLM

AGILE renforce les agents LLM avec de la mémoire, des conseils d'experts, et des outils en temps réel.

2025-08-08T09:20:18+00:00 ― 9 min lire

Calcul et langage Codage de position adaptatif au contexte pour les Transformers

Une nouvelle façon d'améliorer les modèles de transformateur en utilisant des techniques d'encodage positionnel adaptables.

2025-08-08T08:48:42+00:00 ― 7 min lire

Apprentissage automatique Apprentissage implicite en contexte : Une nouvelle approche des modèles de langue

I2CL améliore l'efficacité et la performance dans les tâches des modèles linguistiques.

2025-08-08T07:45:30+00:00 ― 7 min lire

Calcul et langage Évaluation de la NLG avec le cadre AdvEval

AdvEval met en lumière les faiblesses des métriques d'évaluation de la génération de langage naturel.

2025-08-08T07:29:42+00:00 ― 8 min lire

Recherche d'informations Améliorer le classement des documents avec la partition descendante

Une nouvelle méthode améliore l'efficacité dans les tâches de classement de documents.

2025-08-08T06:26:30+00:00 ― 7 min lire

Calcul et langage Nouveau cadre pour s'attaquer aux hallucinations dans les modèles de langage

Un cadre pour mieux détecter les fausses affirmations dans les modèles de langage.

2025-08-08T04:43:48+00:00 ― 5 min lire

Calcul et langage Améliorer la réécriture de requêtes avec des retours de classement

Une nouvelle méthode pour améliorer la réécriture des requêtes sans données étiquetées.

2025-08-08T03:40:36+00:00 ― 7 min lire

Calcul et langage S'attaquer aux pics d'activation dans la quantification des LLM

De nouvelles méthodes améliorent la performance des modèles pendant la quantification dans les modèles de langage.

2025-08-08T03:32:42+00:00 ― 8 min lire

Calcul et langage Comprendre les limites des modèles de langage

Les chercheurs examinent les défis rencontrés par les LLM avec des questions ambiguës.

2025-08-08T02:37:24+00:00 ― 7 min lire

Calcul et langage MiniCache : Améliorer le caching KV dans les modèles de langue

Une nouvelle méthode pour améliorer l'utilisation de la mémoire dans les modèles de langage.

2025-08-08T02:13:42+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale : Une nouvelle approche d'apprentissage

Une méthode d'apprentissage actif en deux étapes améliore la précision de la reconnaissance vocale avec moins de données.

2025-08-08T02:09:55+00:00 ― 6 min lire

Calcul et langage EHR-SeqSQL : Transformer l'accès aux données médicales

Un ensemble de données qui facilite la recherche des dossiers médicaux électroniques via le langage naturel.

2025-08-07T22:56:12+00:00 ― 8 min lire

Apprentissage automatique Avancées dans les Transformateurs Universels : MoEUT

MoEUT améliore l'efficacité et les performances des Transformers Universels dans les tâches linguistiques.

2025-08-07T20:49:48+00:00 ― 7 min lire

Calcul et langage S'attaquer aux vulnérabilités des grands modèles de langage

Une étude sur l'amélioration de la robustesse contre les attaques dans les modèles de langage.

2025-08-07T20:26:06+00:00 ― 8 min lire

Apprentissage automatique Le Rôle de la Complexité Géométrique dans l'Apprentissage par Transfert

Examiner comment la complexité géométrique influence la performance des modèles en apprentissage par transfert.

2025-08-07T18:11:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Traiter les hallucinations dans les modèles vision-langage

Cet article parle des hallucinations dans les LVLMs et propose des méthodes pour les gérer.

2025-08-07T17:48:06+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation des expressions référentielles généralisées

Le cadre HDC améliore la reconnaissance d'objets en utilisant des descriptions en langage dans les images.

2025-08-07T17:24:24+00:00 ― 8 min lire

Apprentissage automatique Une nouvelle approche pour aligner les modèles de langue

Présentation de l'Alignement par Démonstrations pour des modèles de langage sûrs et efficaces.

2025-08-07T16:44:54+00:00 ― 13 min lire