Derniers articles pour Apprentissage par renforcement

Apprentissage automatique Utiliser des grands modèles de langage pour façonner les récompenses dans l'apprentissage par renforcement

Ce travail explore le rôle des LLM dans l'amélioration de l'apprentissage par renforcement avec le façonnement des récompenses.

2025-08-08T16:19:00+00:00 ― 9 min lire

Intelligence artificielle Rendre les décisions de l'IA plus claires avec des politiques d'arbre

De nouvelles structures d'arbre améliorent la visibilité de la prise de décision dans les systèmes d'IA.

2025-08-08T12:06:12+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'apprentissage des robots avec un soutien sensoriel

Utiliser des capteurs avancés pendant l'entraînement aide les robots à mieux réaliser leurs tâches.

2025-08-08T11:10:54+00:00 ― 8 min lire

Intelligence artificielle Améliorer les tests de pénétration automatisés avec l'apprentissage par renforcement

Un nouveau cadre améliore l'efficacité des tests de pénétration automatisés en utilisant l'apprentissage par renforcement.

2025-08-07T19:22:54+00:00 ― 10 min lire

Apprentissage automatique Une nouvelle approche pour aligner les modèles de langue

Présentation de l'Alignement par Démonstrations pour des modèles de langage sûrs et efficaces.

2025-08-07T16:44:54+00:00 ― 13 min lire

Finance computationnelle Avancées dans la gestion de portefeuille d'investissement

Un nouveau modèle améliore la gestion de portefeuille grâce à l'IA et des théories traditionnelles.

2025-08-07T05:24:47+00:00 ― 9 min lire

Calcul et langage Le rôle de l'IA dans la poursuite des brevets

Explorer comment l'IA améliore l'efficacité de la rédaction des revendications de brevets et les taux d'approbation.

2025-08-07T02:00:06+00:00 ― 6 min lire

Calcul et langage Présentation de l'optimisation des trois préférences pour les LLMs

TPO propose une nouvelle méthode pour aligner les modèles de langue avec les préférences humaines de manière efficace.

2025-08-06T22:11:00+00:00 ― 8 min lire

Robotique Avancées en Machine Learning avec Ego-Foresight

Une nouvelle méthode améliore l'apprentissage automatique en boostant la prédiction des mouvements.

2025-08-06T15:43:54+00:00 ― 7 min lire

Optimisation et contrôle Optimisation des stratégies dans l'apprentissage par renforcement

Un aperçu des méthodes de gradient de politique dans l'apprentissage par renforcement.

2025-08-06T14:34:38+00:00 ― 6 min lire

Optimisation et contrôle Avancées dans le Q-Learning à deux échelles de temps pour les systèmes multi-agents

Explorer l'algorithme Q-learning à deux échelles dans l'apprentissage par renforcement de champ moyen.

2025-08-06T10:38:41+00:00 ― 9 min lire

Apprentissage automatique Améliorer la sécurité dans l'apprentissage par renforcement avec SRCPO

Une nouvelle méthode renforce la sécurité dans l'apprentissage par renforcement grâce à la gestion des risques.

2025-08-06T01:14:54+00:00 ― 9 min lire

Calcul et langage Améliorer la génération de code avec des modèles auto-déboguants

Améliorer la capacité des LLM à peaufiner leur code grâce à des techniques de débogage autonome.

2025-08-06T00:19:36+00:00 ― 8 min lire

Robotique Avancées en micro-robotique : le rôle de SwarmRL

SwarmRL aide les scientifiques à contrôler des micro-robots pour différentes applications, surtout en médecine.

2025-08-05T23:30:45+00:00 ― 7 min lire

Intelligence artificielle L'intersection des jeux de société et de l'apprentissage de l'IA

Des chercheurs mélangent des jeux de société avec l'IA grâce à des techniques d'apprentissage par renforcement.

2025-08-05T17:05:06+00:00 ― 11 min lire

Traitement du signal Optimiser l'utilisation de l'énergie dans les stations de base mmWave

Cette étude propose une nouvelle méthode pour économiser de l'énergie dans les réseaux mmWave.

2025-08-05T16:40:30+00:00 ― 7 min lire

Apprentissage automatique L'impact des méthodes de gradient de politique dans l'apprentissage par renforcement

Explorer les méthodes de gradient de politique et leurs effets sur la prise de décision dans l'apprentissage par renforcement.

2025-08-05T12:36:30+00:00 ― 6 min lire

Intelligence artificielle Améliorer l'analyse d'images médicales avec des modèles d'IA

Les avancées dans les modèles d'IA améliorent la précision de l'interprétation des images médicales.

2025-08-05T08:39:30+00:00 ― 9 min lire

Apprentissage automatique Modèles verrouillés par mot de passe : révéler des capacités cachées de l'IA

Un nouveau concept de modèle montre comment tester efficacement les capacités de l'IA.

2025-08-05T08:15:48+00:00 ― 10 min lire

Architecture des réseaux et de l'Internet Gestion efficace des ressources dans les communications sans fil

Apprends à optimiser l'allocation des ressources dans les réseaux sans fil pour améliorer le service.

2025-08-05T03:07:42+00:00 ― 9 min lire

Apprentissage automatique Faire avancer l'apprentissage avec des contraintes dans l'apprentissage par renforcement

Un nouvel algorithme améliore l'apprentissage dans des environnements contraints en utilisant l'échantillonnage postérieur.

2025-08-05T02:28:12+00:00 ― 7 min lire

Apprentissage automatique Avancées dans la planification des jobs grâce à l'indice de Gittins

Exploiter l'apprentissage par renforcement pour optimiser la planification des tâches en utilisant les techniques de l'indice de Gittins.

2025-08-05T01:45:44+00:00 ― 7 min lire

Apprentissage automatique Impact des choix d'action sur l'apprentissage par renforcement dans les opérations spatiales

Examiner comment les choix d'action influencent les agents RL dans des tâches spatiales.

2025-08-05T01:17:25+00:00 ― 8 min lire

Intelligence artificielle Améliorer les tactiques de conversation dans ONUW

Étude sur l'amélioration des stratégies de discussion pour l'IA dans One Night Ultimate Werewolf.

2025-08-04T15:24:36+00:00 ― 7 min lire

Apprentissage automatique Agents LLM : Une nouvelle approche de la prise de décision par l'IA

Examiner le rôle des agents LLM dans la résolution de problèmes du monde réel.

2025-08-04T14:45:06+00:00 ― 9 min lire

Apprentissage automatique Intégrer les préférences humaines dans l'IA avec le PFM

Preference Flow Matching propose une nouvelle façon d'aligner les résultats de l'IA avec les préférences des utilisateurs.

2025-08-04T14:21:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Les robots peuvent-ils apprendre à danser comme des humains ?

Des recherches montrent que des agents non humanoïdes peuvent analyser la danse humaine et créer des mouvements en harmonie avec la musique.

2025-08-04T13:02:24+00:00 ― 6 min lire

Intelligence artificielle Améliorer l'apprentissage dans les systèmes de renforcement visuel

Une nouvelle méthode améliore l'apprentissage à partir des environnements dans les systèmes de renforcement visuel.

2025-08-04T12:54:30+00:00 ― 6 min lire

Intelligence artificielle Comment les autoencodeurs imitent les cellules de lieu dans la formation de la mémoire

Cette étude montre comment les autoencodeurs clairsemés créent des représentations de mémoire ressemblant à des cellules de lieu.

2025-08-04T12:20:03+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'apprentissage par renforcement dans des environnements bruyants

Un nouveau cadre utilise les Reward Machines pour améliorer les performances de l'RL en cas d'incertitude.

2025-08-04T02:54:06+00:00 ― 9 min lire

Apprentissage automatique Faire avancer les modèles de diffusion avec un équilibre de trajectoire relative

Améliorer la qualité des échantillons en apprentissage automatique grâce à des méthodes innovantes.

2025-08-04T00:16:06+00:00 ― 7 min lire

Apprentissage automatique Collaboration dans l'apprentissage par renforcement sans partage de données

Explorer le contrôle fédéré dans l'apprentissage par renforcement pour que les agents collaborent en toute sécurité.

2025-08-03T21:23:28+00:00 ― 8 min lire

Calcul et langage Avancées dans l'extraction de relations entre documents

Une nouvelle méthode améliore l'extraction de relations dans de longs documents.

2025-08-03T21:22:18+00:00 ― 9 min lire

Apprentissage automatique Équilibrer l'adaptabilité dans les modèles d'apprentissage machine

Cette étude propose une nouvelle approche pour maintenir l'apprentissage dans les systèmes d'IA.

2025-08-03T19:31:42+00:00 ― 8 min lire

Recherche d'informations Faire avancer les systèmes de recommandation avec un comportement utilisateur synthétique

Un nouveau cadre pour entraîner des systèmes de recommandation en utilisant des interactions utilisateur simulées.

2025-08-03T19:23:48+00:00 ― 10 min lire

Robotique Une nouvelle méthode pour réorganiser efficacement la maison

Cet article présente une approche innovante pour organiser des maisons en désordre.

2025-08-03T17:33:12+00:00 ― 8 min lire

Graphisme Faire avancer le mouvement réaliste en animation

Une nouvelle méthode améliore les mouvements humanoïdes dans l'animation et la robotique.

2025-08-03T14:47:18+00:00 ― 8 min lire

Apprentissage automatique Améliorer les systèmes de partage de vélos avec l'apprentissage par double politique

Une nouvelle méthode améliore l'efficacité du partage de vélos et la satisfaction des utilisateurs.

2025-08-03T13:20:24+00:00 ― 8 min lire

Apprentissage automatique Améliorer l'apprentissage par renforcement avec des modèles visuels-langage

Combiner des modèles de langage visuel avec l'apprentissage par renforcement améliore l'efficacité d'accomplissement des tâches.

2025-08-03T10:34:30+00:00 ― 7 min lire

Apprentissage automatique Faire avancer la prise de décision avec des processus non cumulatifs

Un nouveau cadre pour améliorer la prise de décision dans des situations dynamiques.

2025-08-03T08:42:32+00:00 ― 9 min lire