Derniers articles pour Tokenisation

Calcul et langage Évaluer le rôle de l'IA dans le codage médical

Cet article évalue les grands modèles de langage dans la prédiction des codes médicaux.

2025-08-28T18:36:42+00:00 ― 9 min lire

Calcul et langage Examen de la fidélité dans les explications des modèles de langage

Une étude comparant les explications des modèles multilingues et monolingues et leur fidélité.

2025-08-27T21:16:54+00:00 ― 9 min lire

Apprentissage automatique Amélioration de la résumation avec des retours humains

Ce travail explore comment les retours humains peuvent améliorer les modèles de résumé.

2025-08-26T13:40:54+00:00 ― 6 min lire

Calcul et langage L'impact des presque doublons sur les modèles de langue

Examiner comment des sous-mots similaires affectent l'apprentissage et la performance des modèles de langue.

2025-08-21T02:56:12+00:00 ― 10 min lire

Calcul et langage Comprendre la tokenisation dans les modèles linguistiques

Un aperçu du rôle de la tokenisation dans le traitement du langage.

2025-08-20T03:37:54+00:00 ― 8 min lire

Calcul et langage Présentation de SpaceByte : Une nouvelle ère dans les modèles de langage

SpaceByte propose une approche au niveau des octets pour améliorer la performance des modèles de langage.

2025-08-17T14:08:36+00:00 ― 8 min lire

Traitement de l'image et de la vidéo Transformateurs de vision : Un changement dans la vision par ordinateur

Explore l'essor et l'efficacité des Vision Transformers dans le traitement d'images.

2025-08-14T15:15:05+00:00 ― 9 min lire

Calcul et langage Défis et opportunités en matière d'explicabilité de la génération de texte par IA

Ce papier parle du besoin d'explicabilité dans les modèles de génération de texte par IA.

2025-08-11T02:54:30+00:00 ― 8 min lire

Instrumentation et méthodes pour l'astrophysique L'impact de l'IA sur notre compréhension de l'univers

Les chercheurs évaluent le rôle de l'IA dans l'analyse des données astronomiques et ses implications.

2025-08-09T13:04:39+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Setokim : Faire avancer les modèles de langage multimodaux

Setokim améliore la fusion de la compréhension visuelle et textuelle grâce à une tokenisation innovante.

2025-08-01T00:06:54+00:00 ― 10 min lire

Calcul et langage Avancées dans la traduction automatique avec des modèles de langues parallèles

Cette étude explore de nouveaux modèles pour améliorer la traduction linguistique en utilisant des données appariées.

2025-07-29T07:04:18+00:00 ― 11 min lire

Calcul et langage Faire avancer la génération de poésie en tchèque

Un nouveau modèle génère de la poésie tchèque avec une meilleure rime et un meilleur rythme.

2025-07-26T22:43:06+00:00 ― 9 min lire

Calcul et langage K-Tokeniseur : Un nouvel outil pour le traitement de texte clinique

K-Tokeniser améliore le traitement des textes cliniques par les modèles de langue.

2025-07-26T05:51:54+00:00 ― 10 min lire

Calcul et langage Les modèles linguistiques reflètent les schémas du cerveau humain

Des recherches montrent que les modèles non entraînés se connectent aux réponses du cerveau humain dans le traitement du langage.

2025-07-25T18:48:18+00:00 ― 11 min lire

Calcul et langage Évaluer l'apprentissage en contexte dans les modèles de langage

Les recherches mettent en lumière les capacités d'apprentissage en contexte des grands modèles de langage.

2025-07-25T16:18:12+00:00 ― 8 min lire

Calcul et langage S'attaquer au biais dans la tokenisation des modèles de langage

Cet article passe en revue les problèmes de tokenisation et propose des solutions pour réduire les biais.

2025-07-24T23:50:42+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les techniques de génération d'images par IA

Un aperçu du codage par ondelettes et des modèles de transformeurs pour la création d'images.

2025-07-22T21:25:00+00:00 ― 7 min lire

Calcul et langage Analyse des classificateurs dans l'écriture égyptienne ancienne

La recherche se concentre sur l'identification des classificateurs en égyptien ancien en utilisant des techniques modernes.

2025-07-22T12:27:48+00:00 ― 5 min lire

Calcul et langage HIGHT : Une nouvelle méthode pour les données graphiques et les LLMs

HIGHT améliore les modèles de langage en utilisant des infos hiérarchiques provenant de données graphiques.

2025-07-22T07:04:33+00:00 ― 9 min lire

Calcul et langage Petits modèles de langage et gestion du bruit

Cet article examine comment les petits modèles de langage apprennent à gérer le bruit dans les données.

2025-07-21T07:53:30+00:00 ― 6 min lire

Apprentissage automatique Avancées dans les techniques de prévision de séries temporelles

Une nouvelle approche améliore la précision des prévisions de séries chronologiques avec plusieurs résolutions.

2025-07-20T08:11:30+00:00 ― 8 min lire

Recherche d'informations BM25S : Un outil de notation de documents rapide

BM25S offre un score rapide des documents pour une récupération d'infos efficace.

2025-07-19T00:43:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Présentation de la Quantification Sphérique Binaire pour les Images et les Vidéos

Une nouvelle méthode améliore l'efficacité du traitement d'images et de vidéos.

2025-07-18T06:58:45+00:00 ― 6 min lire

Calcul et langage Avancées dans les modèles de langue hébraïque : DictaLM 2.0

Présentation de DictaLM 2.0 et DictaLM 2.0-Instruct pour une meilleure traitement de la langue hébraïque.

2025-07-16T18:44:24+00:00 ― 8 min lire

Bioinformatique FragLlama : Faire avancer la conception moléculaire avec l'IA

FragLlama adapte des modèles de langage pour un design moléculaire innovant et la découverte de médicaments.

2025-07-16T06:12:24+00:00 ― 14 min lire

Calcul et langage Utiliser la théorie des automates pour améliorer les modèles de langage

Découvre comment la théorie des automates améliore les performances des modèles de langage.

2025-07-16T03:51:42+00:00 ― 7 min lire

Génie logiciel Modélisation du comportement des logiciels à l'aide de données d'entrée-sortie

Apprends à reproduire les fonctions d'un logiciel grâce à la modélisation du comportement.

2025-07-15T04:41:18+00:00 ― 9 min lire

Apprentissage automatique Avancées dans le modèle d'image masquée et la tokenisation

Explorer de nouvelles techniques dans le modélisation d'images masquées pour améliorer l'apprentissage auto-supervisé.

2025-07-14T07:45:12+00:00 ― 6 min lire

Calcul et langage Tokenisation : un élément clé en PNL

Examiner le rôle et les défis de la tokenisation dans le traitement du langage naturel.

2025-07-12T08:44:54+00:00 ― 9 min lire

Calcul et langage Faire avancer les modèles de langue pour les langues indiennes

Une nouvelle approche pour améliorer les modèles linguistiques pour les diverses langues indiennes.

2025-07-11T15:45:48+00:00 ― 5 min lire

Génie logiciel Présentation de Tipping : un parseur de logs avancé

Le pourboire améliore l'efficacité et la précision de l'analyse des logs pour une meilleure analyse logicielle.

2025-07-03T20:08:18+00:00 ― 10 min lire

Calcul et langage Améliorer le traitement de texte avec BatchBPE

BatchBPE propose une approche plus rapide pour la tokenisation dans le traitement du langage naturel.

2025-07-02T08:19:30+00:00 ― 8 min lire

Apprentissage automatique Améliorer l'efficacité des modèles de langage avec la compression de prompts

Apprends comment la compression des invites peut améliorer la performance des modèles de langue et réduire l'utilisation des ressources.

2025-07-02T01:13:29+00:00 ― 7 min lire

Génie logiciel Améliorer la détection des vulnérabilités de logiciels avec des LLMs

Utiliser des grands modèles de langage pour améliorer la détection des vulnérabilités dans le code logiciel.

2025-07-01T16:15:42+00:00 ― 7 min lire

Calcul et langage La Sensibilité des Embeddings de Mots Contextuels

Une étude révèle comment de petits changements affectent les embeddings contextuels des mots.

2025-07-01T05:27:54+00:00 ― 6 min lire

Calcul et langage FUSE : Connecter les modèles linguistiques pour une meilleure communication

Une nouvelle méthode améliore l'interaction entre les modèles de langue, rendant les tâches plus efficaces.

2025-06-30T16:41:36+00:00 ― 6 min lire

Apprentissage automatique Avancées dans la recherche de pistes en physique des particules

De nouvelles méthodes utilisant des algorithmes améliorent la recherche de pistes à partir de points spatiaux lors des collisions de particules.

2025-06-30T13:56:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la tokenisation d'images avec des superpixels

Une nouvelle méthode améliore le traitement d'image en utilisant des tokens superpixels adaptables.

2025-06-28T01:37:30+00:00 ― 8 min lire

Calcul et langage L'impact des méthodes de tokenisation sur les modèles de langage

Explorer comment différentes stratégies de tokenisation peuvent améliorer la performance des modèles de langage.

2025-06-26T18:01:30+00:00 ― 6 min lire

Calcul et langage Avancées dans les systèmes de traduction automatique multilingues

Examine le rôle d'IKUN et IKUN-C dans la traduction de plusieurs langues de manière efficace.

2025-06-24T06:30:42+00:00 ― 6 min lire