Derniers articles pour Processus de Décision de Markov

Logique en informatique Nouvelle méthode pour analyser les systèmes incertains

Une nouvelle technique améliore les contrôles de sécurité dans des systèmes aléatoires comme les robots et les véhicules.

2025-09-28T12:20:24+00:00 ― 8 min lire

Apprentissage automatique Un nouveau regard sur l'apprentissage par renforcement inversé

Des chercheurs proposent une approche bayésienne pour améliorer la prise de décision chez les agents intelligents.

2025-09-26T14:23:18+00:00 ― 7 min lire

Robotique Former des robots pour jouer au ping-pong comme des humains

Des chercheurs développent des robots qui apprennent le tennis de table en se basant sur des démonstrations humaines.

2025-09-25T19:57:18+00:00 ― 8 min lire

Optimisation et contrôle Processus de décision markovien continu dans la prise de décision

Une plongée dans les MDP continus et leurs applications dans la prise de décision et l'apprentissage par renforcement.

2025-09-25T06:59:55+00:00 ― 7 min lire

Optimisation et contrôle Naviguer dans la prise de décision avec des processus de Markov robustes face à la distribution

Apprends comment les MDP robustes gèrent l'incertitude dans les cadres de prise de décision.

2025-09-22T23:30:24+00:00 ― 6 min lire

Apprentissage automatique Améliorer le flux de circulation avec des véhicules autonomes

Un nouveau système améliore la prise de décision des véhicules autonomes pendant les travaux routiers.

2025-09-22T03:52:12+00:00 ― 6 min lire

Robotique Amélioration de la gestion des objets par les robots grâce à une planification avancée

Une nouvelle méthode améliore la capacité des robots à saisir et déplacer des objets en toute sécurité.

2025-09-21T18:23:24+00:00 ― 10 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement avec des opérateurs Multi-Bellman

Explorer le multi-apprentissage et son impact sur la stabilité et la performance de l'apprentissage par renforcement.

2025-09-20T17:46:06+00:00 ― 9 min lire

Apprentissage automatique Examen de la complexité d'échantillonnage dans les algorithmes NPMD

Cette étude met en lumière la complexité d'échantillonnage des algorithmes de descente de miroir de politique neuronale en apprentissage profond.

2025-09-18T18:51:28+00:00 ― 6 min lire

Intelligence artificielle Assurer la sécurité des agents IA dans divers environnements

Un aperçu de comment les agents IA peuvent rester en sécurité dans différents contextes.

2025-09-18T14:25:06+00:00 ― 8 min lire

Logique en informatique Analyser des processus avec des observations imprécises

Une méthode pour calculer des probabilités dans des systèmes avec un timing d'observations incertain.

2025-09-17T10:22:24+00:00 ― 8 min lire

Probabilité Application des processus de décision de Markov dans la gestion forestière

Utiliser les MDP pour optimiser les stratégies d'éclaircissage pour une croissance forestière durable.

2025-09-14T19:19:07+00:00 ― 7 min lire

Calcul et langage L'intégration de l'apprentissage par renforcement et des grands modèles de langage

Explorer la synergie entre le RL et les LLMs pour des applis IA améliorées.

2025-09-12T05:17:24+00:00 ― 9 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement grâce aux processus de décision de Markov lisses

De nouveaux algorithmes s'attaquent aux défis des espaces d'état-action continus dans l'apprentissage par renforcement.

2025-09-10T14:42:42+00:00 ― 8 min lire

Apprentissage automatique Naviguer dans des processus de décision de Markov à états infinis

Un aperçu des MDP à états infinis et de leur rôle dans l'apprentissage par renforcement.

2025-09-10T09:50:24+00:00 ― 8 min lire

Intelligence artificielle Faire avancer l'inférence contrefactuelle dans la prise de décision

Ce travail affine l'inférence contrefactuelle pour améliorer la prise de décision dans le secteur de la santé.

2025-09-08T14:15:30+00:00 ― 10 min lire

Mathématiques discrètes Limites de performance des méthodes d'optimisation classiques

Examiner les pires scénarios dans l'algorithme du simplexe et l'itération de politique.

2025-09-06T02:27:33+00:00 ― 7 min lire

Intelligence artificielle Concevoir des contrôleurs efficaces pour des environnements complexes

Une méthode utilisant l'apprentissage par renforcement profond et la synthèse réactive pour la conception de contrôleurs.

2025-09-05T12:07:48+00:00 ― 6 min lire

Intelligence artificielle Rationaliser la planification des rovers pour les missions spatiales

Une nouvelle méthode améliore la planification des rovers dans les missions scientifiques, garantissant efficacité et fiabilité.

2025-09-03T23:31:36+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les algorithmes d'apprentissage sans échelle

De nouveaux algorithmes s'attaquent aux défis des MDP adversariaux sans avoir besoin de connaissances préalables sur les pertes.

2025-09-02T12:30:12+00:00 ― 9 min lire

Apprentissage automatique Évaluer des politiques avec des méthodes hors politique

Un aperçu des techniques d'évaluation hors politique et de leur pertinence dans la prise de décision.

2025-09-01T13:48:28+00:00 ― 7 min lire

Apprentissage automatique Améliorer la sécurité dans le contrôle des engins spatiaux autonomes

Une étude sur l'apprentissage par renforcement profond protégé pour l'autonomie sûre des engins spatiaux.

2025-08-31T07:50:12+00:00 ― 9 min lire

Apprentissage automatique Soft Q-Learning : Équilibrer l'exploration dans la prise de décision

Examen du soft Q-learning pour une prise de décision efficace dans des environnements incertains.

2025-08-30T19:19:42+00:00 ― 7 min lire

Apprentissage automatique Avancées dans la prise de décision des camions autonomes

Cet article traite du développement de systèmes intelligents pour les camions autonomes.

2025-08-30T10:30:24+00:00 ― 7 min lire

Systèmes et contrôle Améliorer la prise de décision dans les systèmes autonomes

Mélanger HMDP et MPC pour des opérations de véhicules autonomes plus sûres.

2025-08-30T06:57:45+00:00 ― 9 min lire

Apprentissage automatique Un aperçu des méthodes d'apprentissage par renforcement

Apprends comment les ordis prennent des décisions grâce aux techniques et processus d'apprentissage par renforcement.

2025-08-28T19:24:06+00:00 ― 8 min lire

Robotique Une nouvelle méthode pour une navigation sécurisée dans les véhicules autonomes

Ce travail présente un cadre pour améliorer la sécurité dans la navigation des véhicules autonomes.

2025-08-26T15:31:30+00:00 ― 9 min lire

Robotique Robots et préférences humaines : Une nouvelle approche

Cet article parle de comment les robots peuvent mieux comprendre les préférences humaines dans l'exécution des tâches.

2025-08-25T17:24:18+00:00 ― 8 min lire

Génie logiciel Améliorer le comportement des logiciels avec des exigences de fin obligatoire

Ce papier parle d'améliorer le comportement des logiciels grâce aux exigences de vivacité.

2025-08-23T05:45:36+00:00 ― 6 min lire

Optimisation et contrôle Évaluer la performance des politiques dans les MDPs approximatifs

Cet article examine à quel point les politiques fonctionnent à partir de modèles approximatifs dans des environnements complexes.

2025-08-22T04:09:53+00:00 ― 7 min lire

Apprentissage automatique Arbres de décision en temps réel avec des méthodes de Monte Carlo

Présentation d'un algorithme optimal pour les arbres de décision en streaming de données.

2025-08-20T21:00:42+00:00 ― 8 min lire

Intelligence artificielle Avancées dans la prise de décision avec BTS et DENTS

De nouveaux algorithmes améliorent la prise de décision dans les tâches de planification de l'IA.

2025-08-20T10:36:36+00:00 ― 9 min lire

Informatique et théorie des jeux Gérer l'énergie et les récompenses dans la prise de décision

Explorer des stratégies pour optimiser les niveaux d'énergie et les récompenses dans les processus de décision de Markov.

2025-08-17T14:40:12+00:00 ― 8 min lire

Robotique S'attaquer au problème de la main tremblante chez les robots

Cette étude se concentre sur la façon dont les robots peuvent planifier malgré le fait qu'ils fassent des erreurs.

2025-08-16T20:37:54+00:00 ― 8 min lire

Apprentissage automatique Simplifier l'analyse de convergence dans l'apprentissage par renforcement TD

Cette recherche simplifie la preuve de convergence pour l'apprentissage TD avec approximation linéaire des fonctions.

2025-08-16T02:13:31+00:00 ― 8 min lire

Apprentissage automatique Rendre le dosage de la warfarine plus compréhensible

Une nouvelle approche améliore la clarté du dosage de la warfarine et les soins aux patients.

2025-08-16T02:11:54+00:00 ― 9 min lire

Systèmes et contrôle Faire avancer la sécurité dans les systèmes radar

La technologie radar adaptatif renforce la sécurité contre les ennemis tout en gardant de bonnes performances.

2025-08-16T01:15:35+00:00 ― 8 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement multi-objectifs

Une nouvelle approche acteur-critique s'attaque aux défis multi-objectifs dans l'apprentissage par renforcement.

2025-08-13T17:27:00+00:00 ― 11 min lire

Intelligence artificielle Améliorer l'AMDE dans le secteur de la santé avec l'automatisation

Un nouveau cadre utilise la technologie pour simplifier l'analyse des pannes dans le secteur de la santé.

2025-08-13T09:09:18+00:00 ― 7 min lire

Cryptographie et sécurité Analyser le mining égoïste dans les systèmes blockchain

Un regard de plus près sur les attaques de mining égoïste et leur impact sur la sécurité de la blockchain.

2025-08-13T01:31:06+00:00 ― 9 min lire