Nan Jiang

Ce papier examine des méthodes pour améliorer l'estimation de la valeur dans l'apprentissage par renforcement malgré les défis.

2025-10-08T16:09:36+00:00 ― 7 min lire

Nouvelle approche qui combine simulation et données hors ligne pour de meilleurs tests de robots.

2025-09-30T22:00:36+00:00 ― 9 min lire

Examen du compromis entre le fine-tuning et la préservation des compétences générales dans les modèles d'IA.

2025-09-28T00:29:24+00:00 ― 8 min lire

Racing-CVGP améliore l'efficacité de la régression symbolique pour découvrir des équations mathématiques.

2025-09-27T11:11:30+00:00 ― 8 min lire

Un nouvel algorithme améliore la prise de décision avec SMC dans des environnements incertains.

2025-09-26T00:25:54+00:00 ― 8 min lire

Une nouvelle méthode combine la régression symbolique verticale et l'apprentissage profond pour une meilleure découverte d'équations.

2025-09-13T01:34:00+00:00 ― 7 min lire

Cette recherche améliore l'apprentissage par renforcement en ligne en utilisant la modélisation du rapport de densité pour une meilleure exploration.

2025-09-12T09:19:12+00:00 ― 8 min lire

Une approche systématique pour améliorer les prédictions de POI en utilisant des données de télédétection.

2025-08-26T23:01:48+00:00 ― 9 min lire

Un nouveau modèle améliore l'intégration des batteries dans les systèmes énergétiques.

2025-08-24T14:16:42+00:00 ― 7 min lire

Un nouveau cadre améliore l'exactitude de la correction des bugs en utilisant une analyse au niveau des jetons et des infos contextuelles.

2025-08-18T20:41:24+00:00 ― 8 min lire

Améliorer la capacité des LLM à peaufiner leur code grâce à des techniques de débogage autonome.

2025-08-06T00:19:36+00:00 ― 8 min lire

Cette étude présente un nouveau modèle pour les fluides à contrainte de cisaillement, améliorant la compréhension et les applications.

2025-07-25T14:19:57+00:00 ― 6 min lire

Une nouvelle approche pour trouver des EDO en utilisant des techniques de collecte de données actives.

2025-06-18T14:06:18+00:00 ― 8 min lire

Explorer la Répétition d'Expérience Inversée pour un apprentissage plus efficace dans les algorithmes de renforcement.

2025-06-11T23:22:00+00:00 ― 10 min lire

Un nouvel algorithme améliore la détection d'événements sonores en utilisant l'apprentissage auto-supervisé.

2025-06-01T10:40:20+00:00 ― 7 min lire

Découvrez comment le GAS améliore l'efficacité et l'efficience de la pub en ligne.

2025-02-03T01:14:15+00:00 ― 8 min lire