Derniers articles pour Qualité des données

Informatique de santé Analyse des données initiales : une étape cruciale dans la recherche

Étapes essentielles pour une analyse de données efficace avant un examen détaillé.

2025-09-23T05:30:30+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la fiabilité de l'IA grâce au nettoyage des données

Un nouveau cadre identifie et retire les échantillons de données défectueux dans les systèmes d'IA.

2025-09-20T21:19:24+00:00 ― 12 min lire

Génie logiciel Exploiter le savoir-faire des experts pour une meilleure annotation des données

Utiliser des experts pour améliorer la qualité des données dans les tâches de machine learning.

2025-09-20T17:14:30+00:00 ― 6 min lire

Apprentissage automatique Correction des erreurs d'étiquetage dans l'entraînement du modèle

Cet article examine les défis et les solutions liés aux étiquettes bruyantes dans les données d'entraînement.

2025-09-20T07:53:36+00:00 ― 8 min lire

Bases de données Préparer les journaux d'événements pour une meilleure analyse

Un aperçu des tâches clés pour le prétraitement des journaux d'événements.

2025-09-20T01:58:06+00:00 ― 7 min lire

Méthodologie Test de données automatisé pour les infos sur les œuvres de charité au Canada

Cet article examine les tests automatisés qui garantissent la qualité des données pour les œuvres de charité et les dons au Canada.

2025-09-19T14:03:00+00:00 ― 14 min lire

Calcul et langage Exploiter les LLM pour une meilleure résolution d'entités

Découvre comment les LLM peuvent améliorer le processus de résolution d'entités et relever des défis.

2025-09-18T13:29:48+00:00 ― 9 min lire

Apprentissage automatique Traiter les étiquettes bruyantes en apprentissage profond

Une nouvelle méthode améliore l'entraînement des modèles avec des étiquettes bruyantes en utilisant la Dimension Intrinsèque Locale.

2025-09-17T23:56:06+00:00 ― 9 min lire

Physique chimique Le Rôle des Erreurs en Apprentissage Automatique pour la Chimie

Examiner comment la qualité des données influence les modèles d'apprentissage automatique dans la prédiction du comportement moléculaire.

2025-09-17T19:43:54+00:00 ― 10 min lire

Apprentissage automatique Avancées dans la détection d'anomalies pour les données de séries temporelles

Une nouvelle méthode détecte des anomalies dans les données de séries temporelles malgré les valeurs manquantes.

2025-09-17T15:46:18+00:00 ― 9 min lire

Ingénierie, finance et science computationnelles Dispositifs connectés pour la gestion des maladies chroniques

Examiner le rôle de la technologie portable dans le suivi des maladies chroniques.

2025-09-14T17:19:48+00:00 ― 8 min lire

Apprentissage automatique S'attaquer à l'intégrité des données dans les ensembles de données de cybersécurité

Cette étude souligne l'importance des ensembles de données fiables pour la détection des anomalies dans le trafic réseau.

2025-09-13T03:24:36+00:00 ― 9 min lire

Apprentissage automatique Comment le bruit affecte l'entraînement des modèles de langage

Cet article examine l'impact du bruit sur la performance des modèles de langage.

2025-09-10T17:52:18+00:00 ― 9 min lire

Calcul et langage Améliorer les LLM pour des infos fiables

Améliorer les modèles de langage pour des réponses précises et basées sur des preuves.

2025-09-08T09:54:48+00:00 ― 9 min lire

Apprentissage automatique Évaluer le RLAIF et le Fine-Tuning Supervisé : Une Perspective Critique

Une étude sur l'efficacité de RLAIF par rapport à l'affinage supervisé pour les modèles de langue.

2025-09-06T15:07:18+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Méthode innovante de reconnaissance d'avions pour la télédétection

Une nouvelle technique améliore l'identification des avions dans des images de basse qualité.

2025-09-04T00:50:36+00:00 ― 7 min lire

Apprentissage automatique Améliorer les modèles de diffusion conditionnelle avec TDSM

Une nouvelle approche s'attaque aux étiquettes bruyantes dans les modèles d'apprentissage automatique.

2025-09-03T16:01:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer aux étiquettes bruyantes en apprentissage automatique avec PLReMix

Une nouvelle méthode aide à mieux apprendre à partir d'étiquettes de données bruyantes en apprentissage automatique.

2025-09-03T11:48:30+00:00 ― 8 min lire

Calcul et langage Améliorer la qualité des données dans l'apprentissage automatique

Cette étude examine les erreurs et les variations dans les données étiquetées pour l'apprentissage automatique.

2025-09-01T12:08:42+00:00 ― 6 min lire

Apprentissage automatique Comprendre la dureté des échantillons en apprentissage automatique

Un aperçu des défis et des solutions pour identifier les échantillons difficiles.

2025-08-31T11:55:06+00:00 ― 7 min lire

Calcul et langage Améliorer la génération de messages de commit avec CommitBench

Un nouveau jeu de données vise à améliorer la qualité des messages de commit automatisés pour les développeurs.

2025-08-31T04:32:42+00:00 ― 12 min lire

Apprentissage automatique Les défis de l'apprentissage avec des modèles bruyants

Examiner comment le bruit dans les données de pré-entraînement influence la performance du modèle.

2025-08-30T14:35:18+00:00 ― 8 min lire

Traitement de l'image et de la vidéo S'attaquer aux étiquettes bruyantes dans la classification d'images médicales

La recherche évalue des techniques auto-supervisées pour améliorer la robustesse face aux labels bruyants dans l'imagerie médicale.

2025-08-29T22:51:55+00:00 ― 12 min lire

Vision par ordinateur et reconnaissance des formes Traitement de la correspondance bruyante dans le jumelage de données

Présentation de REPAIR pour améliorer la précision d'appariement des données dans des environnements bruyants.

2025-08-29T16:28:06+00:00 ― 7 min lire

Interaction homme-machine LabelAId : Améliorer la qualité des données crowdsourcées

Un nouvel outil d'IA améliore la précision de l'étiquetage et la compréhension des utilisateurs dans le crowdsourcing.

2025-08-29T13:10:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Affiner la détection d'objets : le dataset COCO-ReM

COCO-ReM améliore la détection d'objets en affinant les annotations du dataset original de COCO.

2025-08-25T03:58:30+00:00 ― 6 min lire

Calcul et langage Faire avancer les modèles de langue avec le dataset Conifer

Un nouveau jeu de données améliore la capacité des LLM à suivre des instructions complexes.

2025-08-22T21:59:30+00:00 ― 6 min lire

Calcul et langage Modèles de marins : faire avancer la technologie linguistique en Asie du Sud-Est

De nouveaux modèles linguistiques conçus pour des langues diverses en Asie du Sud-Est montrent des résultats prometteurs.

2025-08-22T13:26:00+00:00 ― 7 min lire

Apprentissage automatique Traitement de la corruption des étiquettes dans l'apprentissage automatique

Une nouvelle méthode améliore les performances du modèle malgré le bruit des étiquettes.

2025-08-21T04:56:40+00:00 ― 9 min lire

Apprentissage automatique Défis dans la robustesse aux attaques des classificateurs d'images

Explorer les facteurs clés qui influencent la robustesse contre les attaques adversariales en apprentissage automatique.

2025-08-19T21:34:30+00:00 ― 8 min lire

Calcul et langage Améliorer la qualité des données pour de meilleurs modèles de résumé

Des recherches montrent comment les LLM peuvent nettoyer des jeux de données pour des tâches de résumé.

2025-08-19T12:21:30+00:00 ― 9 min lire

Calcul et langage Construire un corpus web japonais de haute qualité

Un corpus japonais solide créé à partir de données de Common Crawl améliore la performance des LLM.

2025-08-16T05:53:06+00:00 ― 9 min lire

Apprentissage automatique Minimisation Sensible à la Netteté : Une Nouvelle Approche pour le Bruit de Label

Explorer comment SAM améliore les performances des modèles face au bruit d'étiquettes.

2025-08-13T12:18:54+00:00 ― 8 min lire

Apprentissage automatique Gérer les étiquettes bruyantes en apprentissage automatique

Une méthode pour améliorer l'apprentissage du modèle malgré des erreurs dans les étiquettes des données.

2025-08-12T23:10:52+00:00 ― 8 min lire

Apprentissage automatique Naviguer dans l'impact de l'apprentissage automatique dans la prise de décision

Examiner les effets des systèmes d'apprentissage automatique sur le comportement humain et l'équité.

2025-08-11T18:58:18+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles image-texte avec une meilleure qualité de données

Les chercheurs améliorent les modèles en corrigeant les problèmes de qualité des données dans les relations entre images et textes.

2025-08-10T15:58:48+00:00 ― 7 min lire

Calcul et langage Progrès dans les modèles de langue 360Zhinao

De nouveaux modèles linguistiques montrent des progrès dans la compréhension et la génération du langage humain.

2025-08-08T18:49:06+00:00 ― 7 min lire

Calcul et langage S'attaquer aux annotations bruyantes dans les modèles de langage

Améliorer la qualité de la génération de texte en choisissant des exemples plus clairs.

2025-08-06T08:53:06+00:00 ― 9 min lire

Apprentissage automatique S'attaquer aux hallucinations dans les modèles d'IA

Comprendre et atténuer les hallucinations dans l'IA pour une performance fiable.

2025-08-05T17:29:05+00:00 ― 10 min lire

Apprentissage automatique Améliorer la qualité des données avec la méthode DVGS

Présentation d'une nouvelle méthode pour évaluer la qualité des données dans l'apprentissage automatique.

2025-08-01T23:29:48+00:00 ― 12 min lire