Derniers articles pour Jetons

Calcul et langage Présentation de Zyda : un nouveau jeu de données pour les modèles de langue

Zyda, un jeu de données avec 1,3 trillion de tokens, améliore l'entraînement des modèles de langue.

2025-08-02T07:50:48+00:00 ― 8 min lire

Calcul et langage Présentation de FineWeb : un nouveau jeu de données pour les modèles de langage

FineWeb propose 15 trillions de jetons pour améliorer l'entraînement des modèles linguistiques.

2025-07-24T10:01:12+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'apprentissage visuel avec Fibottention

La fibottention améliore l'efficacité de la compréhension visuelle par machine.

2025-07-23T12:49:18+00:00 ― 5 min lire

Calcul et langage Protéger les données perso dans la classification de texte

Des chercheurs étudient des méthodes pour sécuriser des infos sensibles dans les modèles de classification de texte.

2025-07-21T14:36:24+00:00 ― 9 min lire

Intelligence artificielle Le cadre TOKEN améliore la performance des voitures autonomes

Une nouvelle approche TOKEN améliore la gestion des événements de conduite rares dans les véhicules autonomes.

2025-07-21T07:14:00+00:00 ― 10 min lire

Cryptographie et sécurité STRIDE : Une nouvelle méthode de décompilation

STRIDE prédit efficacement les noms de variables et les types perdus dans les logiciels décompilés.

2025-07-21T04:20:12+00:00 ― 8 min lire

Apprentissage automatique Vulnérabilités dans les modèles de langage : Un regard de plus près

Des recherches montrent que des changements simples dans les entrées peuvent entraîner des résultats nuisibles dans les LLMs.

2025-07-20T08:58:54+00:00 ― 8 min lire

Calcul et langage MaskMoE : Faire progresser l'apprentissage dans les modèles de mélange d'experts

MaskMoE améliore l'apprentissage des tokens dans les modèles MoE en renforçant la performance des tokens peu fréquents.

2025-07-14T01:02:18+00:00 ― 7 min lire

Calcul et langage TokenSHAP : un nouvel outil pour l'interprétabilité des modèles de langage

TokenSHAP révèle comment les mots impactent les réponses des modèles de langage.

2025-07-13T17:55:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de LookupViT : Une nouvelle méthode pour le traitement visuel

LookupViT améliore les tâches de reconnaissance visuelle grâce à un traitement efficace des tokens.

2025-07-11T20:53:54+00:00 ― 7 min lire

Calcul et langage Avancées des grands modèles de langage pour les longs textes

ChatQA 2 améliore la performance dans le traitement des longs textes et des tâches de recherche.

2025-07-10T10:32:00+00:00 ― 8 min lire

Calcul et langage Avancées dans les modèles de traitement du langage

Un nouveau modèle améliore la compréhension du langage grâce à une représentation de données structurées.

2025-07-06T18:19:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire progresser des modèles de vision-langage haute résolution

Une approche économique pour analyser des images haute résolution et du texte.

2025-07-05T16:14:48+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la classification des images hyperspectrales

MHSSMamba améliore la précision dans le traitement et la classification d'images hyperspectrales.

2025-07-03T04:20:18+00:00 ― 6 min lire

Calcul et langage Introduction à 500xCompressor : Faire avancer la compression de prompts

Découvre 500xCompressor, une nouvelle méthode pour compresser les prompts de manière efficace.

2025-07-01T10:04:24+00:00 ― 7 min lire

Structures de données et algorithmes Saut de jetons en théorie des graphes

Explorer les défis de la réorganisation des jetons dans les graphes.

2025-06-30T14:51:00+00:00 ― 6 min lire

Apprentissage automatique Présentation de SAMSA : un modèle d'auto-attention efficace

SAMSA améliore l'efficacité de l'auto-attention pour différents types de données.

2025-06-30T04:34:48+00:00 ― 6 min lire

Finance statistique Analyse du comportement des tokens dans la finance Web3

Une étude des différents tokens et de leurs patterns dans l'espace Web3 en évolution.

2025-06-29T02:00:39+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'originalité dans les modèles texte-image

L'étude évalue l'originalité des images générées par l'IA en utilisant une mesure de tokens.

2025-06-27T10:36:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le comptage d'objets dans la génération d'images

Une nouvelle méthode améliore la précision du comptage des objets dans les images générées.

2025-06-24T10:59:18+00:00 ― 9 min lire

Recherche d'informations Optimiser les scores de documents avec les tokens ColBERT

Cet article examine comment la gestion des tokens dans ColBERT affecte le classement des documents.

2025-06-22T21:04:06+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées en Technologie Audio : Présentation de X-Codec

X-Codec améliore la génération audio en intégrant la compréhension sémantique dans le traitement.

2025-06-21T15:41:45+00:00 ― 7 min lire

Calcul et langage Comparer les méthodes de représentation de la parole dans les systèmes de reconnaissance

Cet article compare les représentations de la parole discrètes et continues pour un bon reconocimiento de la parole.

2025-06-19T00:14:36+00:00 ― 7 min lire

Finance computationnelle Faire progresser les Alpha Factors avec l'algorithme QFR

Un nouvel algorithme améliore la création de facteurs alpha pour de meilleures idées d'investissement.

2025-06-16T17:21:27+00:00 ― 7 min lire

Calcul et langage Réévaluer l'attention dans les modèles de langue

Examiner le rôle de l’attention à travers les différentes couches des modèles de langue.

2025-06-16T15:45:30+00:00 ― 6 min lire

Cryptographie et sécurité Nouvelles stratégies pour protéger les smart contracts des attaques

Cet article parle des avancées dans la protection des contrats intelligents contre les vulnérabilités et les pertes financières.

2025-06-14T02:16:12+00:00 ― 8 min lire

Calcul et langage Améliorer le suivi des instructions dans les LLM avec GUIDE

Une nouvelle méthode pour améliorer la réponse des grands modèles de langage aux instructions des utilisateurs.

2025-06-09T17:35:42+00:00 ― 2 min lire

Vision par ordinateur et reconnaissance des formes Nouveaux modèles qui transforment l'IA multimodale

Les modèles récents améliorent la capacité de l'IA à générer et comprendre différents médias.

2025-06-04T08:49:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les Vision Transformers avec une analyse spatiale

SATA renforce la robustesse et l'efficacité des Vision Transformers pour les tâches de classification d'images.

2025-06-03T14:47:12+00:00 ― 5 min lire

Cryptographie et sécurité Défis du marquage des textes générés par IA

Examiner les failles des méthodes de filigrane face aux attaques de paraphrase.

2025-05-28T23:21:45+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Tokenisation par longueur d'exécution : Accélérer l'apprentissage vidéo

RLT réduit le temps d'entraînement pour l'IA en traitement vidéo en supprimant les tokens inutiles.

2025-05-28T20:58:12+00:00 ― 6 min lire

Calcul et langage SuffixDécodage : Accélérer les Modèles de Langue

Un aperçu de SuffixDecoding et son impact sur l'efficacité des modèles linguistiques.

2025-05-28T14:13:39+00:00 ― 6 min lire

Calcul et langage IA vs Humain : Le Défi de l'Écriture

Examiner la frontière entre les articles scientifiques générés par IA et ceux écrits par des humains.

2025-05-26T01:45:45+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Comprendre l'encodage par paires de bytes multidimensionnelles

MDBPE optimise le traitement d'image en compressant les données visuelles de manière efficace.

2025-05-22T12:56:15+00:00 ― 7 min lire

Apprentissage automatique Améliorer le traitement des longs textes dans les modèles de langue

Une méthode pour améliorer la rétention des détails importants par les LLM dans les textes longs.

2025-05-19T01:05:20+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Masqueurs Automatiques de Longs Vidéos : Une Nouvelle Approche

Présentation des autoencodeurs masqués pour vidéos longues pour une meilleure compréhension des vidéos.

2025-05-16T19:28:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la tokenisation visuelle avec la quantification factorisée

La quantification factorisée améliore la génération d'images grâce à une gestion efficace des tokens.

2025-05-09T02:57:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer la recherche vocale avec la méthode BEST-STD

Des chercheurs améliorent la détection vocale pour des recherches vocales plus rapides et précises.

2025-05-03T22:26:26+00:00 ― 7 min lire

Informatique distribuée, parallèle et en grappes INTELLECT-1 : Une nouvelle ère dans la collaboration IA

Un effort mondial dans la formation d'IA aboutit à un modèle de langage de pointe INTELLECT-1.

2025-04-22T15:41:00+00:00 ― 6 min lire

Calcul et langage Améliorer l'efficacité des grands modèles de langage

Des chercheurs améliorent la performance des LLM tout en économisant des ressources.

2025-04-19T03:39:09+00:00 ― 8 min lire