Derniers articles pour Optimisation de modèle

Vision par ordinateur et reconnaissance des formes Améliorer la généralisation dans les modèles vision-langage avec OGEN

OGEN améliore la capacité des modèles vision-langage à reconnaître de nouvelles classes efficacement.

2025-09-13T12:21:48+00:00 ― 9 min lire

Apprentissage automatique Améliorer les grands modèles de langage pour une utilisation plus large

Cet article passe en revue des techniques pour améliorer l'efficacité et la performance des Grands Modèles de Langage.

2025-09-12T03:58:24+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'efficacité des modèles de langage avec le décodage spéculatif

Une méthode pour accélérer les grands modèles de langage sans sacrifier la qualité de la sortie.

2025-09-12T02:47:18+00:00 ― 8 min lire

Apprentissage automatique DE-BERT : Une nouvelle approche pour l'abandon précoce dans les modèles de langage

Voici DE-BERT, un cadre qui améliore l'efficacité des modèles de langue grâce à des stratégies de sortie anticipée.

2025-09-11T23:06:06+00:00 ― 9 min lire

Calcul et langage Identifier les tickets gagnants dans les modèles de langue multilingues

Une méthode pour ajuster les modèles de langage en utilisant moins de paramètres.

2025-09-10T23:08:18+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les techniques de quantification pour les modèles d'apprentissage automatique

Apprends comment les nouvelles techniques améliorent l'efficacité des gros modèles de machine learning.

2025-09-10T13:31:36+00:00 ― 5 min lire

Calcul et langage Une nouvelle méthode pour un réglage efficace des prompts

Présentation de BMTPT pour améliorer le tuning des prompts dans les modèles de langage.

2025-09-08T14:55:00+00:00 ― 6 min lire

Calcul et langage Nouvelle méthode SLEB améliore l'efficacité des grands modèles de langage

SLEB simplifie les LLM en retirant les blocs de transformateurs redondants, ce qui booste la vitesse et l'efficacité.

2025-09-07T23:54:24+00:00 ― 8 min lire

Calcul et langage LoRETTA : Une nouvelle méthode pour affiner les modèles de langage

LoRETTA améliore l'efficacité de l'ajustement fin pour les grands modèles de langage avec moins de paramètres.

2025-09-07T03:29:54+00:00 ― 7 min lire

Calcul et langage Réduire les besoins en mémoire dans les modèles de langue

Une nouvelle méthode pour rendre les modèles de langage plus petits et plus rapides en utilisant la quantification à 1 bit.

2025-09-07T02:26:42+00:00 ― 9 min lire

Calcul et langage Améliorer l'apprentissage en contexte avec l'analyse d'influence

Une nouvelle méthode pour choisir des démonstrations améliore la performance des modèles dans les tâches de langue.

2025-09-06T21:02:48+00:00 ― 10 min lire

Apprentissage automatique Simplifier l'alignement de l'IA avec REINFORCE et RLOO

De nouvelles méthodes promettent une meilleure performance des modèles d'IA grâce à un apprentissage par renforcement simplifié.

2025-09-05T04:29:36+00:00 ― 7 min lire

Apprentissage automatique Améliorer l'efficacité des grands modèles de langage

Une nouvelle méthode de quantification améliore la performance des grands modèles de langage tout en réduisant leur taille.

2025-09-04T18:21:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les méthodes de quantification pour les modèles de deep learning

De nouvelles techniques améliorent la quantification tout en gérant les valeurs aberrantes pour de meilleures performances du modèle.

2025-09-04T10:03:36+00:00 ― 6 min lire

Apprentissage automatique Ajustement de grands modèles avec une adaptation à faible rang

Une étude sur des méthodes efficaces pour le réglage fin de grands modèles grâce à l'Adaptation de Bas Rang.

2025-09-04T03:44:24+00:00 ― 6 min lire

Apprentissage automatique Améliorer la génération d'images à partir de descriptions textuelles

Une nouvelle méthode améliore la précision de la génération d'images en utilisant des modèles vision-langage.

2025-09-03T22:44:12+00:00 ― 6 min lire

Apprentissage automatique Avancées dans les techniques de méta-apprentissage par renforcement

Explorer de nouvelles méthodes pour améliorer la prise de décision chez les agents d'apprentissage.

2025-09-01T03:03:36+00:00 ― 10 min lire

Apprentissage automatique Connecter la platitude et la généralisation dans l'apprentissage automatique

La recherche montre comment les minima plats sont liés à de meilleures performances du modèle sur des données invisibles.

2025-08-31T11:56:24+00:00 ― 7 min lire

Calcul et langage PipeRAG : Améliorer la génération augmentée par la recherche

Une nouvelle méthode pour rendre RAG plus rapide et améliorer la qualité.

2025-08-31T07:26:30+00:00 ― 9 min lire

Apprentissage automatique Améliorer la généralisation de domaine avec UDIM

Une nouvelle approche améliore les performances du modèle sur différents types de données.

2025-08-29T23:58:24+00:00 ― 8 min lire

Apprentissage automatique Équilibrer l'efficacité et la robustesse dans les modèles d'apprentissage profond

Enquête sur les méthodes de compression de modèles pour améliorer l'efficacité et la défense contre les attaques.

2025-08-29T09:53:06+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'efficacité de l'apprentissage fédéré avec FedMef

FedMef améliore l'apprentissage fédéré pour les appareils à faibles ressources grâce à des techniques de taille innovantes.

2025-08-27T06:24:12+00:00 ― 8 min lire

Apprentissage automatique Améliorer le Machine Learning avec MetaOptimize

MetaOptimize améliore le performance des modèles en ajustant les paramètres d'apprentissage de manière dynamique.

2025-08-25T12:07:32+00:00 ― 8 min lire

Apprentissage automatique Avancées dans l'ajustement des modèles d'apprentissage automatique

Présentation d'une nouvelle méthode pour affiner les modèles de manière efficace.

2025-08-25T05:08:04+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Optimiser les Réseaux de Neurones Convolutionnels avec le Pruning RL

Une nouvelle méthode utilise l'apprentissage par renforcement pour élaguer les CNN pendant l'entraînement.

2025-08-24T16:15:24+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'efficacité des réseaux de neurones à faible précision

Ce papier parle des coûts et des améliorations pour les réseaux de neurones à faible précision.

2025-08-24T09:16:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancer les méthodes d'adaptation pour l'apprentissage automatique

L'adaptation par diffusion généralisée améliore la performance des modèles avec des échantillons hors distribution.

2025-08-24T09:08:48+00:00 ― 8 min lire

Apprentissage automatique S'attaquer aux données incomplètes avec des autoencodeurs variationnels

Stratégies pour améliorer les autoencodeurs variationnels dans la gestion des ensembles de données incomplets.

2025-08-23T21:11:48+00:00 ― 7 min lire

Calcul et langage Chirurgien Cérébral Multilingue : Une Nouvelle Approche pour la Compression de Modèles

Une méthode pour améliorer la performance des modèles de langue dans différentes langues pendant la compression.

2025-08-21T23:52:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour élaguer les modèles vision-langage

Présentation d'une méthode de pruning des modèles complexes, peu importe la tâche.

2025-08-21T10:34:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les MLLMs avec le prompting visuel transférable

Une nouvelle méthode améliore les modèles multimodaux en utilisant des invites visuelles partagées.

2025-08-18T16:04:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Présentation de la Distillation de Connaissances Contrastive

Une nouvelle méthode pour améliorer les performances des modèles en IA grâce au transfert de connaissances.

2025-08-17T10:27:24+00:00 ― 6 min lire

Calcul et langage Simplifier la sélection des tâches pour l'ajustement des instructions

Une nouvelle méthode, InsTa, améliore la sélection des tâches dans le réglage des instructions.

2025-08-16T09:10:36+00:00 ― 10 min lire

Apprentissage automatique Évaluer les grands modèles de langage : la taille et la précision comptent

Cette étude évalue comment la taille du modèle et la quantification impactent la performance du modèle de langue.

2025-08-13T18:22:18+00:00 ― 9 min lire

Apprentissage automatique Optimisation des grands modèles de langage avec le format Student Float

De nouvelles techniques améliorent l'efficacité et la précision des grands modèles de langage.

2025-08-13T15:36:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la génération d'images avec le conditionnement LoRA

Améliorer les modèles de diffusion en ajoutant LoRA aux couches d'attention pour de meilleures images.

2025-08-13T14:56:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Conception de modèle efficace avec mise à l'échelle différentiable du modèle

Une nouvelle méthode pour améliorer les structures de modèles de manière plus efficace et efficiente.

2025-08-11T15:56:36+00:00 ― 8 min lire

Cryptographie et sécurité S'attaquer aux risques de sécurité dans les modèles de deep learning quantifiés

Ce papier présente EFRAP, une défense contre les attaques par porte dérobée conditionnées par la quantification dans les modèles d'apprentissage profond.

2025-08-09T11:32:24+00:00 ― 10 min lire

Apprentissage automatique Améliorer le Fine-Tuning avec l'Adaptation Spectrale

Une nouvelle méthode améliore le fine-tuning des gros modèles en utilisant des infos spectrales.

2025-08-09T02:35:12+00:00 ― 6 min lire

Apprentissage automatique Adaptation Efficace des Grands Modèles d'IA

Une méthode combinant des adaptations à faible rang et orthogonales pour les modèles d'IA.

2025-08-07T20:57:42+00:00 ― 7 min lire