Articoli più recenti per Processi Decisionali di Markov

Logica nell'informatica Nuovo metodo per analizzare sistemi incerti

Una nuova tecnica migliora i controlli di sicurezza in sistemi casuali come robot e veicoli.

2025-09-28T12:20:24+00:00 ― 6 leggere min

Apprendimento automatico Uno Sguardo Nuovo al Reinforcement Learning Inverso

I ricercatori propongono un approccio bayesiano per migliorare il processo decisionale negli agenti intelligenti.

2025-09-26T14:23:18+00:00 ― 6 leggere min

Robotica Addestrare i robot a giocare a ping pong come gli umani

I ricercatori sviluppano robot che imparano il ping pong attraverso dimostrazioni simili a quelle umane.

2025-09-25T19:57:18+00:00 ― 7 leggere min

Ottimizzazione e controllo Processi decisionali di Markov continui nella presa di decisione

Un tuffo nei MDP continui e le loro applicazioni nella presa di decisioni e nell'apprendimento per rinforzo.

2025-09-25T06:59:55+00:00 ― 6 leggere min

Ottimizzazione e controllo Navigare le Decisioni con Processi di Markov Robusti alla Distribuzione

Scopri come i MDP robusti gestiscono l'incertezza nei framework decisionali.

2025-09-22T23:30:24+00:00 ― 5 leggere min

Apprendimento automatico Migliorare il flusso del traffico con veicoli autonomi

Un nuovo sistema migliora le decisioni degli AV durante la costruzione stradale.

2025-09-22T03:52:12+00:00 ― 5 leggere min

Robotica Migliorare la gestione degli oggetti da parte dei robot tramite una pianificazione avanzata

Un nuovo metodo migliora la capacità dei robot di afferrare e muovere oggetti in modo sicuro.

2025-09-21T18:23:24+00:00 ― 9 leggere min

Apprendimento automatico Progressi nel Reinforcement Learning con Multi-Bellman Operators

Esplorare il multi-apprendimento e il suo impatto sulla stabilità e le performance del reinforcement learning.

2025-09-20T17:46:06+00:00 ― 7 leggere min

Apprendimento automatico Esaminando la complessità del campione negli algoritmi NPMD

Questo studio mette in evidenza la complessità del campione degli algoritmi Neural Policy Mirror Descent nel deep learning.

2025-09-18T18:51:28+00:00 ― 5 leggere min

Intelligenza artificiale Garantire la sicurezza degli agenti AI in vari ambienti

Uno sguardo a come gli agenti AI possono rimanere sicuri in diversi contesti.

2025-09-18T14:25:06+00:00 ― 7 leggere min

Logica nell'informatica Analizzare i processi con osservazioni imprecise

Un metodo per calcolare le probabilità in sistemi con tempistiche di osservazione incerte.

2025-09-17T10:22:24+00:00 ― 6 leggere min

Probabilità Applicare i Processi Decisionali di Markov nella Gestione Forestale

Usare gli MDP per ottimizzare le strategie di diradamento per una crescita forestale sostenibile.

2025-09-14T19:19:07+00:00 ― 6 leggere min

Calcolo e linguaggio L'integrazione del reinforcement learning e dei modelli di linguaggio di grandi dimensioni

Esplorando la sinergia tra RL e LLM per migliorare le applicazioni AI.

2025-09-12T05:17:24+00:00 ― 7 leggere min

Apprendimento automatico Progressi nel Reinforcement Learning grazie ai Processi Decisionali di Markov Lisci

Nuovi algoritmi affrontano sfide negli spazi continui di stato-azione dell'apprendimento per rinforzo.

2025-09-10T14:42:42+00:00 ― 7 leggere min

Apprendimento automatico Navigare nei Processi di Decisione di Markov a Stato Infinito

Uno sguardo agli MDP a stato infinito e al loro ruolo nell'apprendimento per rinforzo.

2025-09-10T09:50:24+00:00 ― 7 leggere min

Intelligenza artificiale Avanzare l'inferenza controfattuale nella decisione-making

Questo lavoro affina l'inferenza controfattuale per migliorare il processo decisionale nella sanità.

2025-09-08T14:15:30+00:00 ― 8 leggere min

Matematica discreta Limiti delle Performance dei Metodi di Ottimizzazione Classici

Esaminare i peggiori scenari nell'algoritmo simplex e nell'iterazione delle politiche.

2025-09-06T02:27:33+00:00 ― 6 leggere min

Intelligenza artificiale Progettare controller efficaci per ambienti complessi

Un metodo che utilizza l'apprendimento profondo per rinforzo e sintesi reattiva per la progettazione dei controllori.

2025-09-05T12:07:48+00:00 ― 5 leggere min

Intelligenza artificiale Semplificare la pianificazione dei rover per le missioni spaziali

Un nuovo metodo migliora la pianificazione dei rover nelle missioni scientifiche, garantendo efficienza e affidabilità.

2025-09-03T23:31:36+00:00 ― 6 leggere min

Apprendimento automatico Sviluppi negli algoritmi di apprendimento senza scala

Nuovi algoritmi affrontano le sfide negli MDP avversariali senza aver bisogno di conoscenze sui danni precedenti.

2025-09-02T12:30:12+00:00 ― 7 leggere min

Apprendimento automatico Valutare le politiche con metodi off-policy

Uno sguardo alle tecniche di valutazione off-policy e la loro rilevanza nel prendere decisioni.

2025-09-01T13:48:28+00:00 ― 6 leggere min

Apprendimento automatico Migliorare la sicurezza nel controllo delle navette spaziali autonome

Uno studio sul Deep Reinforcement Learning Protetto per l'autonomia sicura delle navicelle spaziali.

2025-08-31T07:50:12+00:00 ― 7 leggere min

Apprendimento automatico Soft Q-Learning: Bilanciare l'Esplorazione nel Processo Decisionale

Esaminando il soft Q-learning per prendere decisioni efficaci in ambienti incerti.

2025-08-30T19:19:42+00:00 ― 6 leggere min

Apprendimento automatico Sviluppi nella decisione dei camion autonomi

Questo articolo parla dello sviluppo di sistemi intelligenti per camion autonomi.

2025-08-30T10:30:24+00:00 ― 6 leggere min

Sistemi e controllo Migliorare il processo decisionale nei sistemi autonomi

Mescolare HMDP e MPC per operazioni di veicoli autonomi più sicure.

2025-08-30T06:57:45+00:00 ― 7 leggere min

Apprendimento automatico Una panoramica sui metodi di apprendimento per rinforzo

Scopri come i computer prendono decisioni attraverso tecniche e processi di Reinforcement Learning.

2025-08-28T19:24:06+00:00 ― 6 leggere min

Robotica Un nuovo metodo per la navigazione sicura nei veicoli autonomi

Questo lavoro presenta un framework per migliorare la sicurezza nella navigazione dei veicoli autonomi.

2025-08-26T15:31:30+00:00 ― 8 leggere min

Robotica Robot e Preferenze Umane: Un Nuovo Approccio

Questo articolo parla di come i robot possano capire meglio le preferenze umane nell'esecuzione dei compiti.

2025-08-25T17:24:18+00:00 ― 7 leggere min

Ingegneria del software Migliorare il Comportamento del Software con Requisiti di Percorso Finalizzato

Questo documento parla di come migliorare il comportamento del software attraverso i requisiti di vivacità.

2025-08-23T05:45:36+00:00 ― 5 leggere min

Ottimizzazione e controllo Valutare le prestazioni delle politiche negli MDP approssimativi

Questo articolo esamina quanto bene funzionano le politiche basate su modelli approssimativi in ambienti complessi.

2025-08-22T04:09:53+00:00 ― 5 leggere min

Apprendimento automatico Alberi Decisionali in Tempo Reale Utilizzando Metodi Monte Carlo

Presentiamo un algoritmo ottimale per i Decision Trees su dati in streaming.

2025-08-20T21:00:42+00:00 ― 7 leggere min

Intelligenza artificiale Avanzamenti nella presa di decisioni con BTS e DENTS

Nuovi algoritmi migliorano il processo decisionale nei compiti di pianificazione dell'IA.

2025-08-20T10:36:36+00:00 ― 7 leggere min

Informatica e teoria dei giochi Gestire energia e ricompense nelle decisioni

Esplorare strategie per ottimizzare i livelli di energia e le ricompense nei Processi di Decisione di Markov.

2025-08-17T14:40:12+00:00 ― 6 leggere min

Robotica Affrontare il Problema della Mano Tremolante nei Robot

Questo studio si concentra su come i robot possano pianificare nonostante facciano errori.

2025-08-16T20:37:54+00:00 ― 7 leggere min

Apprendimento automatico Semplificare l'analisi della convergenza nel TD Learning

Questa ricerca semplifica la dimostrazione della convergenza per l'apprendimento TD con approssimazione lineare della funzione.

2025-08-16T02:13:31+00:00 ― 7 leggere min

Apprendimento automatico Rendere il dosaggio di Warfarin più comprensibile

Un nuovo approccio migliora la chiarezza nel dosaggio del warfarin e la cura dei pazienti.

2025-08-16T02:11:54+00:00 ― 8 leggere min

Sistemi e controllo Avanzare la Sicurezza nei Sistemi Radar

La tecnologia radar adattiva migliora la sicurezza contro i nemici mantenendo le prestazioni.

2025-08-16T01:15:35+00:00 ― 7 leggere min

Apprendimento automatico Progressi nel Reinforcement Learning Multi-Obiettivo

Un nuovo approccio attore-critico affronta le sfide multi-obiettivo nel reinforcement learning.

2025-08-13T17:27:00+00:00 ― 9 leggere min

Intelligenza artificiale Migliorare l'FMEA nella sanità con l'automazione

Un nuovo framework usa la tecnologia per semplificare l'analisi dei fallimenti nella sanità.

2025-08-13T09:09:18+00:00 ― 6 leggere min

Crittografia e sicurezza Analizzando il Mining Egoista nei Sistemi Blockchain

Uno sguardo più da vicino agli attacchi di mining egoistico e il loro impatto sulla sicurezza della blockchain.

2025-08-13T01:31:06+00:00 ― 8 leggere min