Tian Lan

Une nouvelle méthode améliore l'évaluation des politiques en RL hors ligne.

2025-10-03T16:38:00+00:00 ― 7 min lire

Text2Data améliore la génération de données en utilisant efficacement des sources non étiquetées et étiquetées.

2025-09-10T12:12:36+00:00 ― 9 min lire

Présentation d'un cadre pour la collaboration avec des agents d'IA dont les objectifs ne sont pas clairs.

2025-08-26T19:52:12+00:00 ― 8 min lire

Explorer les propriétés et comportements uniques des ordres topologiques dans les matériaux.

2025-08-22T11:48:24+00:00 ― 9 min lire

Ce papier présente le Bayesian-CFR, qui améliore la prise de décision dans des jeux complexes avec des infos incomplètes.

2025-08-09T06:08:30+00:00 ― 7 min lire

Une nouvelle méthode appelée ADEPT améliore l'apprentissage par renforcement hors ligne grâce à des modèles adaptatifs.

2025-08-04T14:37:12+00:00 ― 9 min lire

APIGen génère des ensembles de données diversifiés et de haute qualité pour les agents d'appel de fonctions.

2025-07-24T00:24:30+00:00 ― 7 min lire

Un nouveau cadre améliore les simulations RL pour le traitement de données scientifiques complexes.

2025-07-04T00:29:00+00:00 ― 7 min lire

Un cadre pour améliorer le travail d'équipe entre des agents de génie logiciel divers.

2025-06-28T16:22:18+00:00 ― 7 min lire

Les cellules Y-Flash et la machine Tsetlin améliorent l'efficacité de l'apprentissage machine.

2025-06-26T07:29:30+00:00 ― 6 min lire

SpecTool apporte de la clarté sur les erreurs des LLM en utilisant des outils.

2025-05-16T16:30:40+00:00 ― 5 min lire