Derniers articles pour Fonctions de récompense

Apprentissage automatique Comprendre les processus de décision de Markov partiellement observables

Un aperçu des POMDP et de leur rôle dans la prise de décision avec des informations incomplètes.

2025-08-25T11:34:52+00:00 ― 6 min lire

Recherche d'informations Faire avancer la diversité des résultats de recherche avec MA4DIV

MA4DIV améliore les résultats de recherche en ligne en augmentant la diversité des documents grâce à une approche multi-agents.

2025-08-25T08:42:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Optimiser les Réseaux de Neurones Convolutionnels avec le Pruning RL

Une nouvelle méthode utilise l'apprentissage par renforcement pour élaguer les CNN pendant l'entraînement.

2025-08-24T16:15:24+00:00 ― 10 min lire

Robotique Conception de Fonctions de Récompense pour Véhicules Autonomes

Un aperçu de la création de fonctions de récompense efficaces dans les voitures autonomes.

2025-08-20T07:42:48+00:00 ― 7 min lire

Apprentissage automatique Améliorer l'apprentissage par renforcement avec des données sous-optimales

Une nouvelle méthode améliore l'efficacité des retours humains en RL en utilisant des données de mauvaise qualité.

2025-08-15T08:25:24+00:00 ― 14 min lire

Apprentissage automatique Concevoir des environnements d'apprentissage par renforcement efficaces pour un flux de puissance optimal

Apprends comment la conception de l'environnement influence l'apprentissage par renforcement dans les systèmes de distribution d'énergie.

2025-08-15T05:49:35+00:00 ― 7 min lire

Méthodologie Nouvelles perspectives sur la toxicologie grâce à l'analyse de la fonction de récompense

Cette approche améliore la compréhension des effets chimiques sur le comportement animal.

2025-08-13T13:22:00+00:00 ― 7 min lire

Apprentissage automatique Présentation de SINDy-RL : Une nouvelle approche en apprentissage par renforcement

SINDy-RL améliore l'efficacité et l'interprétabilité dans les systèmes de contrôle en utilisant l'apprentissage par dictionnaire sparse.

2025-08-12T20:00:44+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les systèmes de communication des véhicules autonomes

Améliorer la sécurité et l'efficacité des voitures autonomes grâce à une meilleure communication.

2025-08-10T05:34:42+00:00 ― 9 min lire

Intelligence artificielle L'intersection des jeux de société et de l'apprentissage de l'IA

Des chercheurs mélangent des jeux de société avec l'IA grâce à des techniques d'apprentissage par renforcement.

2025-08-05T17:05:06+00:00 ― 11 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement avec utilité inverse concave

Une nouvelle approche pour comprendre les fonctions de récompense complexes dans le comportement de l'IA.

2025-08-05T02:36:06+00:00 ― 7 min lire

Calculs Faire avancer le MCMC adaptatif avec des techniques d'apprentissage par renforcement

Cet article propose d'utiliser l'apprentissage par renforcement pour améliorer les algorithmes MCMC adaptatifs.

2025-07-29T07:02:44+00:00 ― 6 min lire

Apprentissage automatique Avancées en apprentissage par renforcement : relever les défis d'horizon infini

Explorer de nouvelles méthodes pour un apprentissage par renforcement efficace dans des environnements continus.

2025-07-28T15:11:28+00:00 ― 9 min lire

Robotique Avancées dans les stratégies de conduite sans voie pour les VTC

De nouvelles stratégies visent à améliorer la sécurité et l'efficacité des CAV dans des environnements sans voies.

2025-07-26T11:47:24+00:00 ― 8 min lire

Apprentissage automatique Utiliser des modèles de langage pour définir des récompenses pour les agents RL

Une nouvelle méthode pour définir des récompenses pour les agents d'apprentissage par renforcement en utilisant des modèles de langage.

2025-07-24T22:23:48+00:00 ― 9 min lire

Apprentissage automatique Connexion entre l'apprentissage par renforcement hors ligne et le retour d'information sur les préférences

Un nouvel algorithme combine l'apprentissage par renforcement hors ligne et les feedbacks de préférence pour une prise de décision améliorée.

2025-07-23T23:37:06+00:00 ― 13 min lire

Apprentissage automatique Optimiser les hyperparamètres et les récompenses ensemble dans l'apprentissage par renforcement (RL)

Une nouvelle méthode améliore l'apprentissage par renforcement profond en optimisant simultanément les hyperparamètres et les fonctions de récompense.

2025-07-23T22:33:54+00:00 ― 8 min lire

Apprentissage automatique Faire avancer la génération d'images avec les GFlowNets

De nouvelles méthodes améliorent la génération d'images en alignant les résultats avec des descriptions textuelles spécifiques.

2025-07-21T07:07:24+00:00 ― 9 min lire

Apprentissage automatique Réseaux de Flux Génératifs : Une Nouvelle Approche d'Apprentissage

Les GFlowNets permettent un échantillonnage efficace à partir de distributions complexes avec de fortes capacités de généralisation.

2025-07-20T07:00:24+00:00 ― 7 min lire

Apprentissage automatique Améliorer le contrôle dans les modèles de diffusion avec l'apprentissage par renforcement

Une nouvelle méthode améliore l'orientation dans les modèles de diffusion en utilisant l'apprentissage par renforcement.

2025-07-14T00:43:28+00:00 ― 8 min lire

Intelligence artificielle Optimisation de la gestion des commandes de semences en agriculture

Améliorer les processus de traitement des commandes de semences pour booster l'efficacité agricole.

2025-07-11T09:26:36+00:00 ― 10 min lire

Apprentissage automatique Défis dans l'apprentissage par récompense pour les systèmes d'IA

Examiner les difficultés de la création de fonctions de récompense efficaces en apprentissage par renforcement.

2025-07-11T06:48:12+00:00 ― 10 min lire

Apprentissage automatique Défis et solutions dans l'entraînement RLHF

Un aperçu des défis de l'apprentissage par renforcement liés aux erreurs de récompense.

2025-07-10T11:03:36+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Adaptation de l'apprentissage par récompense en robotique avec des données d'échec

Une méthode pour améliorer la performance des robots en utilisant des vidéos d'échecs.

2025-07-09T20:42:30+00:00 ― 8 min lire

Calcul et langage Défis de la sécurisation des grands modèles de langage

Un aperçu des risques et des méthodes liés à la sécurité des modèles de langage.

2025-07-02T04:14:36+00:00 ― 7 min lire

Robotique Avancées dans l'apprentissage à partir de démonstrations de robots de qualité mixte

De nouvelles méthodes aident les robots à apprendre efficacement à partir de démonstrations de tâches variées.

2025-06-29T16:28:00+00:00 ― 8 min lire

Apprentissage automatique Ajustement des modèles de diffusion avec l'apprentissage par renforcement

Explorer comment le RL améliore les modèles de diffusion pour des résultats ciblés.

2025-06-28T19:14:16+00:00 ― 8 min lire

Apprentissage automatique Machines à Récompense Neurales : Une Nouvelle Approche de l'Apprentissage AI

Les NRM améliorent l'apprentissage automatique en se souvenant des actions et des expériences passées.

2025-06-26T20:47:24+00:00 ― 8 min lire

Apprentissage automatique Faire avancer la prise de décision avec des bandits duels contextuels

Utiliser des réseaux de neurones pour améliorer la prise de décision dans des contextes basés sur les préférences.

2025-06-26T08:49:36+00:00 ― 10 min lire

Apprentissage automatique Nouvelle méthode pour des politiques de prise de décision variées

Une nouvelle méthode pour générer des politiques qui s'adaptent à différentes préférences.

2025-06-24T18:45:24+00:00 ― 10 min lire

Informatique et théorie des jeux Stratégies d'apprentissage dans les jeux de Stackelberg

Examiner des stratégies sans regret dans des jeux de Stackelberg à deux joueurs pour une meilleure prise de décision.

2025-06-21T19:55:12+00:00 ― 7 min lire

Apprentissage automatique Simplifier la conception de la fonction de récompense avec ERFSL

ERFSL simplifie la création de fonctions de récompense en utilisant de grands modèles de langage.

2025-06-18T15:37:50+00:00 ― 7 min lire

Apprentissage automatique Avancer la sécurité dans l'apprentissage par renforcement

De nouvelles méthodes améliorent l'exploration sécurisée dans les systèmes d'apprentissage par renforcement.

2025-06-18T11:36:12+00:00 ― 8 min lire

Calculs Optimisation de la sélection de température dans le MCMC à températures parallèles

Une nouvelle méthode améliore la sélection de la température pour un échantillonnage statistique efficace.

2025-06-11T08:20:48+00:00 ― 8 min lire

Robotique Améliorer la stabilité des véhicules sur terrain accidenté

Une étude sur le contrôle du mouvement vertical pour un meilleur confort et sécurité dans les véhicules.

2025-06-08T11:26:36+00:00 ― 6 min lire

Apprentissage automatique Apprendre les fonctions d'utilité dans la prise de décision

Une étude révèle des infos sur la prise de décision en cas d'incertitude grâce à l'apprentissage des utilités.

2025-06-06T03:29:06+00:00 ― 7 min lire

Robotique Créer de la confiance entre les humains et les robots

Découvre comment les robots peuvent mieux évaluer la confiance dans la collaboration humaine.

2025-05-31T03:07:39+00:00 ― 8 min lire

Systèmes multi-agents Approches innovantes à la collaboration des robots

Découvrez comment les robots améliorent le travail d'équipe et l'efficacité grâce à l'inspiration biologique.

2025-05-22T20:06:54+00:00 ― 7 min lire

Robotique Améliorer l'apprentissage des robots avec des fonctions de récompense

Une nouvelle méthode améliore la façon dont les robots apprennent des tâches en utilisant des fonctions de récompense basées sur les exposants de Lyapunov.

2025-05-19T04:02:40+00:00 ― 7 min lire

Intelligence artificielle Naviguer dans l'incertitude des décisions

Un aperçu de la prise de décisions basée sur des hypothèses dans la tech et les opérations.

2025-05-14T22:42:40+00:00 ― 9 min lire