Derniers articles pour Ajustement fin

Physique des hautes énergies - Phénoménologie Étudier la masse des neutrinos avec un mélange trimaximal

Cet article explore la masse des neutrinos à travers des zéros mineurs dans la matrice de masse.

2025-09-18T15:52:48+00:00 ― 7 min lire

Apprentissage automatique Nouvelle méthode pour le fine-tuning privé des modèles de langue

DP-ZO équilibre la vie privée et la performance dans l'entraînement des modèles de langage.

2025-09-18T12:02:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'adaptation du modèle avec des augmentations ciblées

Un nouveau cadre améliore la performance des modèles sur des données non vues grâce à des changements ciblés.

2025-09-18T07:10:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Montage photo efficace avec le cadre EGAN

De nouvelles méthodes améliorent la vitesse et la qualité de l'édition d'images en utilisant des modèles plus petits.

2025-09-17T14:11:30+00:00 ― 7 min lire

Physique des hautes énergies - Phénoménologie Aborder le problème de hiérarchie avec des modèles de Higgs composites

De nouveaux modèles explorent la stabilité de l'échelle faible en physique des hautes énergies.

2025-09-17T08:13:06+00:00 ― 6 min lire

Génie logiciel S'attaquer à la duplication de code entre les ensembles de données dans l'évaluation des modèles

Examiner les effets de la duplication de code entre les datasets sur les métriques de performance des modèles.

2025-09-17T01:33:06+00:00 ― 10 min lire

Apprentissage automatique Affinage de Réseaux Neuronaux Élagués avec le Recuit Stochastique de Sous-Réseaux

Une nouvelle méthode qui améliore les réseaux neuronaux élagués pour de meilleures performances.

2025-09-16T19:13:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Le rôle de l'IA dans la cartographie des caractéristiques du pergélisol

Des outils d'IA comme SAM changent la donne sur la façon dont on cartographie le permafrost et comprend le changement climatique.

2025-09-16T18:58:06+00:00 ― 9 min lire

Physique biologique Comprendre la criticité dans les systèmes biologiques

Un aperçu de la criticité intrinsèque et extrinsèque dans les systèmes biologiques.

2025-09-16T15:45:00+00:00 ― 8 min lire

Calcul et langage Avancées dans le raisonnement mathématique pour les LLMs

Cette étude améliore la façon dont les modèles de langage gèrent les tâches de raisonnement mathématique.

2025-09-16T14:37:24+00:00 ― 6 min lire

Calcul et langage Améliorer le question-réponse avec des données limitées

Stratégies pour améliorer les modèles QA quand les données étiquetées sont rares.

2025-09-16T08:41:54+00:00 ― 9 min lire

Apprentissage automatique Une nouvelle méthode pour peaufiner les modèles de base

AutoFT améliore la performance des modèles sur des données inédites grâce à des techniques de fine-tuning innovantes.

2025-09-16T04:29:06+00:00 ― 8 min lire

Apprentissage automatique Accélérer les grands modèles de langage avec des têtes supplémentaires

Une nouvelle méthode accélère la génération de texte par LLM en utilisant des têtes de prédiction supplémentaires.

2025-09-15T18:05:00+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection des maladies oculaires grâce à l'IA

Un nouveau cadre IA améliore la détection des maladies oculaires grâce à des techniques d'imagerie avancées.

2025-09-15T09:23:36+00:00 ― 7 min lire

Calcul et langage Nouvelle méthode pour un entraînement efficace des modèles de langage

Une méthode améliore l'efficacité dans la formation et l'utilisation de grands modèles de langage.

2025-09-15T04:55:00+00:00 ― 9 min lire

Bioinformatique Améliorer le diagnostic des maladies rares grâce à un vocabulaire standardisé

Des recherches montrent que des modèles bien ajustés peuvent vraiment aider à mieux comprendre les maladies rares.

2025-09-14T15:04:42+00:00 ― 9 min lire

Cryptographie et sécurité Lutter contre les attaques de jailbreak multilingues sur les modèles de langage

Une étude révèle les risques des attaques de jailbreak multilingues sur les grands modèles de langage.

2025-09-13T03:56:12+00:00 ― 7 min lire

Génie logiciel Automatisation des Revues de Code avec GPT-3.5 : Une Étude

Cet article explore des méthodes pour utiliser GPT-3.5 afin d'automatiser efficacement les revues de code.

2025-09-12T19:30:36+00:00 ― 7 min lire

Apprentissage automatique Défis et stratégies pour les grands modèles de langage

Analyser le coût et l'efficacité des grands modèles de langage dans différentes tâches.

2025-09-12T16:52:36+00:00 ― 8 min lire

Calcul et langage Évaluation des modèles linguistiques : Performance dans le sujet vs Performance hors sujet

Cette étude analyse comment les modèles de langage gèrent les sujets familiers et non familiers.

2025-09-12T01:52:00+00:00 ― 8 min lire

Apprentissage automatique Grands Modèles de Langage dans l'Analyse de Séries Temporelles

Explorer l'utilisation des LLM pour analyser des données de séries temporelles dans différents domaines.

2025-09-11T05:03:48+00:00 ― 11 min lire

Apprentissage automatique Décodage-Temps Réalignement : Une Nouvelle Approche pour l'Entraînement des Modèles de Langue

DeRa propose une méthode pour ajuster l'alignement des modèles linguistiques sans avoir à les réentraîner.

2025-09-11T02:33:42+00:00 ― 8 min lire

Calcul et langage Identifier les tickets gagnants dans les modèles de langue multilingues

Une méthode pour ajuster les modèles de langage en utilisant moins de paramètres.

2025-09-10T23:08:18+00:00 ― 7 min lire

Apprentissage automatique Comment le bruit affecte l'entraînement des modèles de langage

Cet article examine l'impact du bruit sur la performance des modèles de langage.

2025-09-10T17:52:18+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les techniques de quantification pour les modèles d'apprentissage automatique

Apprends comment les nouvelles techniques améliorent l'efficacité des gros modèles de machine learning.

2025-09-10T13:31:36+00:00 ― 5 min lire

Apprentissage automatique Améliorer l'explicabilité dans les modèles d'apprentissage automatique

De nouvelles méthodes améliorent la clarté des prédictions en apprentissage automatique.

2025-09-10T10:35:28+00:00 ― 9 min lire

Apprentissage automatique Améliorer la confiance dans les modèles vision-langage

Une nouvelle méthode améliore la fiabilité des prévisions des modèles dans des applications réelles.

2025-09-10T01:09:00+00:00 ― 8 min lire

Calcul et langage S'attaquer au biais culturel dans les modèles de langage

Une nouvelle approche pour intégrer des perspectives culturelles variées dans les modèles de langage.

2025-09-10T00:45:18+00:00 ― 10 min lire

Interaction homme-machine Génération d'idées innovantes avec l'aide de l'IA

Une nouvelle méthode pour stimuler la créativité dans la résolution de problèmes grâce au soutien de l'IA.

2025-09-09T22:23:06+00:00 ― 12 min lire

Intelligence artificielle Défis dans le développement d'agents IA efficaces

Explorer les problèmes dans la création de modèles et de solutions d'IA pour la prise de décision.

2025-09-09T21:19:54+00:00 ― 7 min lire

Traitement de l'audio et de la parole Présentation d'AV-SUPERB : Une nouvelle référence pour les modèles audio-visuels

AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.

2025-09-08T22:32:35+00:00 ― 7 min lire

Recherche d'informations Avancées dans les modèles de récupération de longs documents

De nouveaux outils améliorent la façon dont les systèmes récupèrent des informations à partir de longs documents.

2025-09-08T20:26:48+00:00 ― 6 min lire

Calcul et langage Le rôle des modèles de langage dans les décisions d'embauche

Explorer comment les modèles de langage reflètent les traits de personnalité dans le recrutement.

2025-09-08T12:17:00+00:00 ― 9 min lire

Apprentissage automatique Améliorer le fine-tuning des réseaux de neurones avec l'apprentissage actif

Cette étude améliore l'efficacité du fine-tuning dans les réseaux de neurones en utilisant l'apprentissage actif transductif.

2025-09-08T10:42:12+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer Whisper pour les langues à faibles ressources

Améliorer la reconnaissance vocale de Whisper pour le vietnamien et d'autres langues à faibles ressources.

2025-09-08T03:55:10+00:00 ― 5 min lire

Calcul et langage Adapter des modèles de langage sans données coûteuses

Une nouvelle méthode pour adapter les LLM sans avoir besoin de beaucoup d'étiquetage.

2025-09-07T13:22:24+00:00 ― 12 min lire

Apprentissage automatique Adapter les modèles de langage aux retours des utilisateurs

Cet article parle d'une méthode pour améliorer les LLMs en utilisant des retours verbaux sans sur-généralisation.

2025-09-07T11:16:00+00:00 ― 13 min lire

Calcul et langage LoRETTA : Une nouvelle méthode pour affiner les modèles de langage

LoRETTA améliore l'efficacité de l'ajustement fin pour les grands modèles de langage avec moins de paramètres.

2025-09-07T03:29:54+00:00 ― 7 min lire

Apprentissage automatique Comprendre les attaques de pollution de données indiscriminées dans l'apprentissage automatique

Explorer les menaces posées par le empoisonnement de données indiscriminé dans l'apprentissage auto-supervisé.

2025-09-06T18:01:06+00:00 ― 10 min lire

Calcul et langage Risques d'exposition des données dans les modèles de langage

Examiner comment le fine-tuning augmente le risque de révéler des données d'entraînement sensibles.

2025-09-06T12:37:12+00:00 ― 8 min lire