Derniers articles pour Politique

Systèmes multi-agents Assurer la sécurité dans les voitures autonomes

Cet article examine les méthodes pour créer des véhicules autonomes sûrs.

2025-08-09T19:34:18+00:00 ― 10 min lire

Ordinateurs et société IA générative : Trouver le juste milieu entre innovation et sécurité

Explorer le paysage réglementaire de l'IA générative et ses implications.

2025-08-09T07:35:24+00:00 ― 9 min lire

Intelligence artificielle Rendre les décisions de l'IA plus claires avec des politiques d'arbre

De nouvelles structures d'arbre améliorent la visibilité de la prise de décision dans les systèmes d'IA.

2025-08-08T12:06:12+00:00 ― 10 min lire

Apprentissage automatique Attaques backdoor coopératives dans l'apprentissage par renforcement décentralisé

Recherche sur la façon dont des agents nuisibles peuvent corrompre de bons agents dans l'apprentissage par renforcement décentralisé.

2025-08-07T10:02:00+00:00 ― 9 min lire

Apprentissage automatique Stratégies Efficaces dans les Processus de Décision de Markov

Une méthode pour trouver des stratégies dans les MDP sans connaissance préalable.

2025-08-06T07:02:30+00:00 ― 6 min lire

Intelligence artificielle Présentation de VLN-GPT : Une nouvelle approche pour la navigation vision et langage

Un modèle simplifié pour une navigation efficace en utilisant des instructions en langage naturel.

2025-08-06T06:30:54+00:00 ― 15 min lire

Santé publique et mondiale Évaluer les perspectives des jeunes sur la politique de génération sans fumée

Les avis des jeunes sur la politique de génération sans fumée sont cruciaux pour son succès.

2025-08-03T19:12:30+00:00 ― 9 min lire

Apprentissage automatique Améliorer la vérification des politiques de réseaux de neurones dans les systèmes complexes

Cet article parle des méthodes pour vérifier les réseaux de neurones dans des tâches d'atteinte-évitation.

2025-08-02T06:53:35+00:00 ― 9 min lire

Apprentissage automatique Avancées dans l'apprentissage par renforcement hors ligne avec MOMBO

MOMBO améliore la prise de décision dans l'apprentissage par renforcement hors ligne avec une meilleure estimation de l'incertitude.

2025-08-01T09:12:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'apprentissage par renforcement hors ligne avec SeMOPO

SeMOPO améliore l'apprentissage à partir de données de mauvaise qualité en séparant les informations utiles du bruit.

2025-07-29T13:07:42+00:00 ― 6 min lire

Apprentissage automatique Un nouveau cadre pour l'apprentissage par renforcement hiérarchique

Ce cadre améliore l'efficacité d'apprentissage dans des tâches complexes grâce à des structures hiérarchiques.

2025-07-25T18:56:12+00:00 ― 7 min lire

Apprentissage automatique Avancer le DRC-RL pour une prise de décision AI robuste

Un nouveau cadre combine récompenses et contraintes dans l'apprentissage par renforcement.

2025-07-25T11:25:54+00:00 ― 5 min lire

Physique et société Disparités d'accès à Internet au Brésil

Explorer l'écart d'accès à Internet entre les villes brésiliennes et son impact.

2025-07-25T01:38:30+00:00 ― 6 min lire

Structures de données et algorithmes Améliorer la gestion des collatéraux dans les blockchains de couche deux

Cet article parle des stratégies pour une gestion efficace des collatéraux dans les systèmes blockchain de couche deux.

2025-07-25T01:17:36+00:00 ― 7 min lire

Apprentissage automatique Équilibre entre les récompenses et la sécurité dans l'IA avec les CMDPs

Les CMDPs fusionnent la maximisation des récompenses avec la sécurité dans les applications d'IA.

2025-07-24T01:04:00+00:00 ― 7 min lire

Apprentissage automatique Connexion entre l'apprentissage par renforcement hors ligne et le retour d'information sur les préférences

Un nouvel algorithme combine l'apprentissage par renforcement hors ligne et les feedbacks de préférence pour une prise de décision améliorée.

2025-07-23T23:37:06+00:00 ― 13 min lire

Intelligence artificielle Apprentissage sûr dans les systèmes de renforcement

Une approche innovante pour la collecte efficace de retours d'information dans l'apprentissage par renforcement pour la sécurité.

2025-07-23T16:06:48+00:00 ― 12 min lire

Apprentissage automatique Optimiser le processus de décision avec le gradient de politique naturel dans des systèmes complexes

Cet article examine le Gradient de Politique Naturelle pour une prise de décision efficace dans de grands espaces d'états.

2025-07-21T18:52:21+00:00 ― 8 min lire

Optimisation et contrôle Présentation de la méthode de gradient de politique robuste à boucle simple

Une nouvelle méthode améliore la prise de décision en cas d'incertitude en utilisant des processus de décision de Markov robustes.

2025-07-21T17:33:42+00:00 ― 8 min lire

Intelligence artificielle Apprentissage par renforcement et éthique des machines : un domaine en plein essor

Explorer le lien entre l'apprentissage par renforcement et la prise de décision éthique chez les machines.

2025-07-20T21:37:18+00:00 ― 7 min lire

Apprentissage automatique Optimisation de politique réflexive : Une nouvelle approche pour l'apprentissage par renforcement

RPO améliore la rapidité et la sécurité de la prise de décision dans l'apprentissage par renforcement grâce à l'apprentissage réfléchi.

2025-07-19T07:33:36+00:00 ― 8 min lire

Santé au travail et santé environnementale L'impact de l'apprentissage automatique sur le marché du travail au Canada

Examiner comment l'apprentissage automatique transforme les opportunités d'emploi au Canada.

2025-07-18T15:42:00+00:00 ― 6 min lire

Systèmes et contrôle Assurer la sécurité dans les systèmes de contrôle

Combiner la reachabilité Hamilton-Jacobi avec l'apprentissage par renforcement améliore la sécurité dans les systèmes de contrôle.

2025-07-17T12:45:10+00:00 ― 5 min lire

Robotique Repenser l'apprentissage des robots pour plus d'adaptabilité

Une nouvelle méthode propose une meilleure façon pour les robots d'apprendre des tâches efficacement.

2025-07-16T23:52:30+00:00 ― 7 min lire

Apprentissage automatique Faire avancer l'apprentissage des robots avec la distance temporelle

Une nouvelle méthode améliore l'exploration des robots et l'atteinte des objectifs en utilisant la distance temporelle.

2025-07-15T02:34:54+00:00 ― 7 min lire

Santé publique et mondiale Lutter contre le tabagisme chez les jeunes adultes au Royaume-Uni

Une nouvelle politique vise à réduire le taux de tabagisme chez les jeunes adultes.

2025-07-14T13:07:00+00:00 ― 6 min lire

Robotique Leçons tirées de l'expérimentation robotique

Partager des expériences pour améliorer le développement futur de la robotique.

2025-07-13T22:40:06+00:00 ― 9 min lire

Apprentissage automatique Avancées dans les algorithmes d'apprentissage par renforcement hors ligne

Cette étude se concentre sur l'apprentissage par renforcement hors ligne et le développement d'algorithmes pour améliorer la prise de décision.

2025-07-13T21:23:12+00:00 ― 7 min lire

Robotique Améliorer la marche des robots avec un apprentissage basé sur le contact

Des chercheurs proposent une nouvelle méthode pour la locomotion des robots en se concentrant sur le placement des pieds.

2025-07-12T23:29:42+00:00 ― 8 min lire

Santé publique et mondiale L'impact de la pub alimentaire en extérieur sur la santé au Guatemala

Examiner comment les pubs en extérieur influencent les régimes et la santé à Xela.

2025-07-12T20:10:00+00:00 ― 9 min lire

Logique en informatique Synthèse des politiques gagnantes dans les processus de décision de Markov

Cet article parle du développement de politiques gagnantes entre familles de MDP.

2025-07-11T17:44:18+00:00 ― 6 min lire

Informatique et théorie des jeux L'art de convaincre pour adopter un produit

Explorer des stratégies pour une communication efficace dans l'adoption de produits.

2025-07-11T09:10:48+00:00 ― 6 min lire

Politique de la santé Naviguer dans le paysage des maladies rares en Inde

Un aperçu des défis et des efforts de collaboration autour des maladies rares en Inde.

2025-07-11T02:27:30+00:00 ― 9 min lire

Robotique Améliorer la performance de l'apprentissage par renforcement avec des récompenses prédites

Une nouvelle méthode améliore l'adaptabilité des agents RL aux environnements changeants.

2025-07-08T12:19:06+00:00 ― 7 min lire

Robotique Une nouvelle méthode améliore l'apprentissage des robots à partir d'une seule démonstration

Présentation de PromptAdapt pour une meilleure adaptabilité des robots avec un entraînement minimal.

2025-07-08T11:31:42+00:00 ― 7 min lire

Systèmes multi-agents Modélisation basée sur les agents : Combler les lacunes d'expertise

Un nouveau cadre améliore la modélisation basée sur les agents en intégrant des idées d'experts variés.

2025-07-08T02:58:12+00:00 ― 7 min lire

Apprentissage automatique Une approche géométrique des processus de décision de Markov

Repenser les MDP à travers la géométrie pour une prise de décision efficace.

2025-07-07T23:13:54+00:00 ― 7 min lire

Méthodologie Nouvelle méthode pour analyser les interventions de groupe

aBCF permet une meilleure évaluation des interventions entre les individus et les groupes.

2025-07-03T06:52:52+00:00 ― 8 min lire

Apprentissage automatique Avancer la sécurité dans l'apprentissage par renforcement

La transfert conscient améliore la sécurité et la performance dans les applications d'apprentissage par renforcement.

2025-06-26T23:01:42+00:00 ― 8 min lire

Apprentissage automatique Nouvelle méthode pour des politiques de prise de décision variées

Une nouvelle méthode pour générer des politiques qui s'adaptent à différentes préférences.

2025-06-24T18:45:24+00:00 ― 10 min lire