Articoli più recenti per Funzioni di Ricompensa

Apprendimento automatico Capire i Processi Decisionali di Markov Parzialmente Osservabili

Una panoramica dei POMDP e del loro ruolo nel prendere decisioni con informazioni incomplete.

2025-08-25T11:34:52+00:00 ― 5 leggere min

Recupero delle informazioni Avanzare nella diversità dei risultati di ricerca con MA4DIV

MA4DIV migliora i risultati delle ricerche online aumentando la diversità dei documenti attraverso un approccio multi-agente.

2025-08-25T08:42:54+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Ottimizzare Reti Neurali Convoluzionali con Potatura RL

Un nuovo metodo usa il reinforcement learning per potare le CNN mentre vengono addestrate.

2025-08-24T16:15:24+00:00 ― 8 leggere min

Robotica Progettazione delle Funzioni di Ricompensa per Veicoli Autonomi

Una panoramica su come creare funzioni di ricompensa efficaci per le auto a guida autonoma.

2025-08-20T07:42:48+00:00 ― 6 leggere min

Apprendimento automatico Migliorare il Reinforcement Learning con dati subottimali

Un nuovo metodo migliora l'efficienza del feedback umano nell'RL usando dati di bassa qualità.

2025-08-15T08:25:24+00:00 ― 11 leggere min

Apprendimento automatico Progettazione di ambienti di apprendimento per rinforzo efficaci per un flusso di potenza ottimale

Scopri come il design dell'ambiente influisce sul reinforcement learning nei sistemi di distribuzione dell'energia.

2025-08-15T05:49:35+00:00 ― 6 leggere min

Metodologia Nuove intuizioni nella tossicologia attraverso l'analisi della funzione di ricompensa

Questo approccio migliora la comprensione degli effetti chimici sul comportamento degli animali.

2025-08-13T13:22:00+00:00 ― 6 leggere min

Apprendimento automatico Introducendo SINDy-RL: Un Nuovo Approccio nel Reinforcement Learning

SINDy-RL migliora l'efficienza e l'interpretabilità nei sistemi di controllo usando l'apprendimento di dizionari sparsi.

2025-08-12T20:00:44+00:00 ― 7 leggere min

Apprendimento automatico Sviluppi nei Sistemi di Comunicazione per Veicoli Autonomi

Migliorare la sicurezza e l'efficienza nelle auto a guida autonoma grazie a una comunicazione migliore.

2025-08-10T05:34:42+00:00 ― 8 leggere min

Intelligenza artificiale L'incrocio tra giochi da tavolo e apprendimento dell'IA

I ricercatori uniscono i giochi da tavolo con l'IA usando tecniche di Reinforcement Learning.

2025-08-05T17:05:06+00:00 ― 9 leggere min

Apprendimento automatico Progressi nell'apprendimento per rinforzo con utilità inversa concava

Un nuovo approccio per capire le funzioni di ricompensa complesse nel comportamento dell'IA.

2025-08-05T02:36:06+00:00 ― 6 leggere min

Calcolo Avanzare MCMC adattivo con tecniche di apprendimento per rinforzo

Questo documento propone di usare il reinforcement learning per migliorare gli algoritmi MCMC adattivi.

2025-07-29T07:02:44+00:00 ― 5 leggere min

Apprendimento automatico Sviluppi nel Reinforcement Learning: Affrontare le Sfide all'Infinito

Esplorando nuovi metodi per un rinforzo efficace nell'apprendimento continuo.

2025-07-28T15:11:28+00:00 ― 7 leggere min

Robotica Avanzamenti nelle strategie di guida senza corsia per i CAV

Nuove strategie puntano a migliorare la sicurezza e l'efficienza dei CAV in ambienti senza corsie.

2025-07-26T11:47:24+00:00 ― 6 leggere min

Apprendimento automatico Usare i modelli linguistici per definire ricompense per gli agenti RL

Un nuovo metodo per definire le ricompense per gli agenti di apprendimento per rinforzo usando modelli di linguaggio.

2025-07-24T22:23:48+00:00 ― 7 leggere min

Apprendimento automatico Collegare il Reinforcement Learning Offline e il Feedback di Preferenza

Un nuovo algoritmo combina l'apprendimento per rinforzo offline e il feedback delle preferenze per migliorare il processo decisionale.

2025-07-23T23:37:06+00:00 ― 10 leggere min

Apprendimento automatico Ottimizzazione degli iperparametri e delle ricompense insieme nell'apprendimento per rinforzo

Un nuovo metodo migliora l'apprendimento profondo per rinforzo ottimizzando simultaneamente gli iperparametri e le funzioni di ricompensa.

2025-07-23T22:33:54+00:00 ― 7 leggere min

Apprendimento automatico Avanzare nella generazione di immagini con GFlowNets

Nuovi metodi migliorano la generazione di immagini allineando i risultati con descrizioni testuali specifiche.

2025-07-21T07:07:24+00:00 ― 7 leggere min

Apprendimento automatico Reti di Flusso Generative: Un Nuovo Approccio all'Apprendimento

GFlowNets permettono un campionamento efficace da distribuzioni complesse con forti capacità di generalizzazione.

2025-07-20T07:00:24+00:00 ― 6 leggere min

Apprendimento automatico Migliorare il controllo nei modelli di diffusione con l'apprendimento per rinforzo

Un nuovo metodo migliora la guida nei modelli di diffusione usando l'apprendimento per rinforzo.

2025-07-14T00:43:28+00:00 ― 6 leggere min

Intelligenza artificiale Ottimizzare l'evadere gli ordini di semi in agricoltura

Migliorare i processi di evasione degli ordini di semi per rendere l'agricoltura più efficiente.

2025-07-11T09:26:36+00:00 ― 8 leggere min

Apprendimento automatico Sfide nell'Apprendimento dei Premi per i Sistemi AI

Esaminando le difficoltà di creare funzioni di ricompensa efficaci nell'apprendimento per rinforzo.

2025-07-11T06:48:12+00:00 ― 8 leggere min

Apprendimento automatico Sfide e Soluzioni nell'Addestramento RLHF

Una panoramica delle sfide del reinforcement learning legate agli errori di ricompensa.

2025-07-10T11:03:36+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Adattare l'apprendimento dei premi nella robotica con dati di fallimento

Un metodo per migliorare le prestazioni robotiche usando dati video di fallimenti.

2025-07-09T20:42:30+00:00 ― 6 leggere min

Calcolo e linguaggio Sfide nel mettere in sicurezza i modelli di linguaggio grandi

Una panoramica dei rischi e dei metodi legati alla sicurezza dei modelli linguistici.

2025-07-02T04:14:36+00:00 ― 5 leggere min

Robotica Progressi nell'apprendimento dai dimostrazioni robotiche di qualità mista

Nuovi metodi aiutano i robot a imparare in modo efficace da dimostrazioni di compiti diversi.

2025-06-29T16:28:00+00:00 ― 7 leggere min

Apprendimento automatico Affinamento dei modelli di diffusione con l'apprendimento per rinforzo

Esplorando come l'RL migliora i modelli di diffusione per risultati mirati.

2025-06-28T19:14:16+00:00 ― 6 leggere min

Apprendimento automatico Macchine di Ricompensa Neurale: Un Nuovo Approccio all'Apprendimento dell'IA

Le NRMs migliorano il machine learning ricordando azioni ed esperienze passate.

2025-06-26T20:47:24+00:00 ― 7 leggere min

Apprendimento automatico Avanzare nel prendere decisioni con i banditi duellanti contestuali

Usare reti neurali per migliorare le decisioni in contesti basati sulle preferenze.

2025-06-26T08:49:36+00:00 ― 8 leggere min

Apprendimento automatico Nuovo metodo per politiche decisionali diverse

Un nuovo approccio per generare politiche che soddisfano diverse preferenze.

2025-06-24T18:45:24+00:00 ― 7 leggere min

Informatica e teoria dei giochi Strategie di apprendimento nei giochi di Stackelberg

Esaminando strategie senza rimpianti nei giochi di Stackelberg a due giocatori per migliorare il processo decisionale.

2025-06-21T19:55:12+00:00 ― 6 leggere min

Apprendimento automatico Semplificare il design della funzione di ricompensa con ERFSL

ERFSL semplifica la creazione di funzioni di ricompensa usando grandi modelli di linguaggio.

2025-06-18T15:37:50+00:00 ― 6 leggere min

Apprendimento automatico Avanzare la sicurezza nel rinforzo dell'apprendimento

Nuovi metodi migliorano l'esplorazione sicura nei sistemi di apprendimento per rinforzo.

2025-06-18T11:36:12+00:00 ― 6 leggere min

Calcolo Ottimizzazione della Selezione della Temperatura nel MCMC di Temperatura Parallela

Un nuovo metodo migliora la selezione della temperatura per un campionamento statistico efficace.

2025-06-11T08:20:48+00:00 ― 7 leggere min

Robotica Migliorare la stabilità del veicolo su terreni irregolari

Uno studio su come controllare il movimento verticale per migliorare il comfort e la sicurezza nei veicoli.

2025-06-08T11:26:36+00:00 ― 5 leggere min

Apprendimento automatico Apprendere le Funzioni di Utilità nelle Decisioni

Uno studio rivela informazioni sulla presa di decisioni in condizioni di incertezza attraverso l'apprendimento dell'utilità.

2025-06-06T03:29:06+00:00 ― 6 leggere min

Robotica Costruire fiducia tra umani e robot

Scopri come i robot possono stimare meglio la fiducia nella collaborazione umana.

2025-05-31T03:07:39+00:00 ― 7 leggere min

Sistemi multiagente Approcci innovativi alla collaborazione tra robot

Scopri come i robot stanno migliorando il lavoro di squadra e l'efficienza grazie all'ispirazione biologica.

2025-05-22T20:06:54+00:00 ― 6 leggere min

Robotica Migliorare l'apprendimento dei robot con le funzioni di ricompensa

Un nuovo metodo migliora come i robot apprendono i compiti usando funzioni di ricompensa basate sugli esponenti di Lyapunov.

2025-05-19T04:02:40+00:00 ― 6 leggere min

Intelligenza artificiale Navigare nell'incertezza nelle decisioni

Uno sguardo al decision-making basato su ipotesi nella tecnologia e nelle operazioni.

2025-05-14T22:42:40+00:00 ― 8 leggere min