Derniers articles pour Apprentissage par renforcement

Calcul et langage Améliorer l'apprentissage des agents grâce à des techniques basées sur l'exploration

Une nouvelle méthode améliore la capacité des agents à apprendre de leurs erreurs dans des environnements virtuels.

2025-06-16T08:38:54+00:00 ― 9 min lire

Apprentissage automatique Sécurité dans l'apprentissage par renforcement pour les robots

Une nouvelle méthode combine l'apprentissage par renforcement et la sécurité pour améliorer les tâches des robots.

2025-06-16T05:29:18+00:00 ― 8 min lire

Calcul et langage Améliorer la synthèse des données utilisateurs avec RLPF

RLPF améliore la synthèse des données des utilisateurs pour de meilleures prédictions.

2025-06-16T02:59:12+00:00 ― 7 min lire

Apprentissage automatique Utiliser l'apprentissage par renforcement pour explorer la conjecture d'Andrews-Curtis

Ce papier examine le rôle du RL dans la résolution de la conjecture d'Andrews-Curtis.

2025-06-16T01:35:15+00:00 ― 9 min lire

Calcul et langage Améliorer le profilage des auteurs avec RL-Profiler

Une nouvelle méthode pour prédire les traits de personnalité à partir des posts en ligne en utilisant des données filtrées.

2025-06-15T23:10:06+00:00 ― 9 min lire

Informatique distribuée, parallèle et en grappes L'apprentissage par renforcement améliore l'équilibrage de charge dans le cloud

L'équilibrage de charge piloté par l'IA améliore la performance et l'efficacité du cloud.

2025-06-15T19:13:06+00:00 ― 10 min lire

Calcul et langage Amélioration de la navigation des robots avec le modèle SAS

Une nouvelle approche améliore la compréhension des robots des instructions de navigation en utilisant la conscience spatiale.

2025-06-14T22:40:42+00:00 ― 9 min lire

Apprentissage automatique Améliorer les prévisions de séries temporelles avec AutoTSAug

Une nouvelle méthode améliore la précision des prévisions de séries temporelles.

2025-06-14T03:03:36+00:00 ― 7 min lire

Robotique Améliorer les agents intelligents dans des environnements fluides

L'étude améliore la performance des agents dans des environnements aquatiques grâce à un pré-entraînement non supervisé.

2025-06-14T02:10:03+00:00 ― 6 min lire

Mécanique statistique Le rôle de l'IA générative en chimie moderne

Explorer comment l'IA générative façonne l'avenir de la chimie.

2025-06-14T01:46:30+00:00 ― 6 min lire

Recherche d'informations Avancées dans les systèmes de recommandation avec mccHRL

Une nouvelle méthode améliore l'expérience utilisateur dans les systèmes de recommandation grâce à la collaboration mobile-cloud.

2025-06-13T19:25:24+00:00 ― 9 min lire

Robotique Progrès dans la manipulation robotique et l'évitement d'obstacles

La recherche se concentre sur l'apprentissage des robots à utiliser leurs pieds pour des tâches tout en évitant les obstacles.

2025-06-13T15:28:24+00:00 ― 6 min lire

Apprentissage automatique Avancées des modèles de diffusion grâce à l'apprentissage par renforcement

Un nouveau cadre cherche à améliorer la génération d'images en utilisant des retours humains.

2025-06-13T07:34:24+00:00 ― 7 min lire

Robotique Enseigner aux robots humanoïdes à faire du skate

Des chercheurs entraînent des robots à faire du skate en utilisant des méthodes d'apprentissage avancées.

2025-06-12T22:37:12+00:00 ― 6 min lire

Apprentissage automatique Optimisation des opérations de patrouille et de dispatch de la police

Une étude sur l'amélioration des temps de réponse de la police grâce à des stratégies combinées de patrouille et de dispatch.

2025-06-12T21:59:46+00:00 ― 11 min lire

Cryptographie et sécurité Former des agents de cybersécurité avec l'apprentissage par renforcement

Un aperçu de l'utilisation de l'apprentissage par renforcement pour former des agents en cybersécurité maritime.

2025-06-12T19:27:36+00:00 ― 6 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement distributionnel multivarié

De nouveaux algorithmes améliorent la prise de décision avec plusieurs récompenses dans l'apprentissage par renforcement.

2025-06-12T05:12:28+00:00 ― 6 min lire

Intelligence artificielle Nouvelle approche pour détecter les fuites de gaz grâce à l'IA

AGDC combine l'apprentissage par renforcement et le retour d'info pour mieux estimer les fuites de gaz.

2025-06-12T04:34:54+00:00 ― 6 min lire

Robotique Avancées dans la locomotion des robots quadrupèdes

Un nouveau cadre améliore le mouvement des robots quadrupèdes sur différents terrains.

2025-06-12T01:49:00+00:00 ― 7 min lire

Intelligence artificielle Avancées dans l'optimisation de la synthèse logique

Une nouvelle approche améliore la conception des circuits matériels en utilisant l'apprentissage automatique.

2025-06-11T11:59:30+00:00 ― 5 min lire

Intelligence artificielle Faire avancer la coopération grâce aux modèles d'IA

Un cadre pour améliorer le comportement cooperatif en utilisant la technologie AI avancée.

2025-06-11T09:05:42+00:00 ― 9 min lire

Calculs Optimisation de la sélection de température dans le MCMC à températures parallèles

Une nouvelle méthode améliore la sélection de la température pour un échantillonnage statistique efficace.

2025-06-11T08:20:48+00:00 ― 8 min lire

Apprentissage automatique Améliorer la sécurité dans l'apprentissage par renforcement avec des modèles de langage

Cet article parle des façons d'améliorer la sécurité en RL en utilisant des modèles de langage.

2025-06-11T05:24:30+00:00 ― 7 min lire

Apprentissage automatique Améliorer les performances du code avec le renforcement d'apprentissage

Un nouvel environnement RL vise à améliorer l'optimisation du code pour le compilateur MLIR.

2025-06-10T12:41:12+00:00 ― 8 min lire

Systèmes multi-agents Utiliser l'apprentissage par renforcement pour l'exploration de drones

Une nouvelle méthode pour déployer des drones dans des zones inconnues en utilisant RL et PPO.

2025-06-10T12:25:24+00:00 ― 12 min lire

Théorie de l'information Prochaines étapes dans le sans fil : avancées en 6G et formation de faisceaux

Un aperçu de l'avenir de la technologie sans fil et des avantages des nouvelles techniques de formation de faisceau.

2025-06-10T10:34:18+00:00 ― 6 min lire

Apprentissage automatique Apprentissage collaboratif en apprentissage par renforcement

Une nouvelle approche pour que les agents partagent des stratégies et améliorent leurs performances dans des contextes variés.

2025-06-10T04:53:29+00:00 ― 7 min lire

Systèmes et contrôle Avancées dans les méthodes de contrôle optimal sans modèle

De nouvelles approches en contrôle optimal s'attaquent à des systèmes complexes et des contraintes en utilisant des techniques innovantes.

2025-06-10T04:23:25+00:00 ― 7 min lire

Robotique Améliorer la sécurité des quadricoptères autonomes contre les menaces cybernétiques

Cette étude se concentre sur la protection des quadricoptères contre les cyberattaques.

2025-06-09T21:09:00+00:00 ― 8 min lire

Intelligence artificielle Avancées en IA grâce à la motivation intrinsèque et à la planification

Les systèmes d'IA apprennent en explorant et en étant motivés, ce qui améliore leur performance dans les tâches.

2025-06-09T18:38:54+00:00 ― 10 min lire

Robotique Le contrôleur adaptable transforme le contrôle du quadricoptère

Un nouveau contrôleur s'adapte facilement à différents quadricoptères et conditions.

2025-06-09T12:03:54+00:00 ― 9 min lire

Apprentissage automatique Comprendre la dynamique d'apprentissage des réseaux de neurones

Un aperçu de comment les réseaux de neurones apprennent et s'adaptent avec le temps.

2025-06-09T09:37:04+00:00 ― 6 min lire

Calcul et langage Amélioration des modèles avec le réglage des préférences

Apprends comment le réglage des préférences aligne les modèles avec les retours des humains.

2025-06-09T04:54:30+00:00 ― 6 min lire

Robotique Améliorer l'agilité des robots avec la méthode SoloParkour

Une nouvelle méthode d'entraînement améliore les capacités de parkour des robots de manière sûre et efficace.

2025-06-08T23:17:36+00:00 ― 7 min lire

Robotique Tri des déchets par des robots innovants utilisant l'IA

Avec l'IA, on améliore le tri des déchets par les robots dans les rivières.

2025-06-08T19:36:24+00:00 ― 10 min lire

Systèmes et contrôle Avancées dans les stratégies de contrôle des micro-réseaux

Une nouvelle méthode combine l'apprentissage par renforcement et la MPC pour une meilleure gestion des microgrids.

2025-06-08T18:22:55+00:00 ― 8 min lire

Apprentissage automatique Nouvelle méthode pour les données synthétiques en RL

Une méthode pour générer des données synthétiques pour l'apprentissage par renforcement en mode few-shot.

2025-06-08T10:39:12+00:00 ― 6 min lire

Systèmes et contrôle Une nouvelle approche pour stabiliser des systèmes complexes

Cet article présente une méthode pour stabiliser des systèmes non linéaires en utilisant l'apprentissage par renforcement.

2025-06-08T06:08:18+00:00 ― 9 min lire

Intelligence artificielle Contrôle flexible des personnages grâce à la peinture de mouvement

Un nouveau modèle simplifie l'animation des personnages en utilisant des données de mouvement incomplètes.

2025-06-08T00:15:06+00:00 ― 9 min lire

Topologie géométrique La théorie des nœuds rencontre l'apprentissage automatique

Un aperçu de comment l'apprentissage machine aide la recherche en théorie des nœuds.

2025-06-07T17:01:48+00:00 ― 7 min lire