Articoli più recenti per Apprendimento per rinforzo

Robotica I robot bipedi fanno passi su terreni morbidi

La ricerca si concentra sul miglioramento delle capacità di camminata dei robot bipedi su terreni morbidi.

2025-10-31T20:28:42+00:00 ― 5 leggere min

Apprendimento automatico Avanzare nelle decisioni critiche in terapia intensiva con l'IA

Un nuovo metodo migliora il processo decisionale nella sanità usando il reinforcement learning.

2025-10-31T20:12:54+00:00 ― 7 leggere min

Robotica Nuovo Metodo per il Problema Stabilizza-Evita nella Robotica

Un nuovo approccio migliora stabilità e sicurezza nei sistemi di controllo robotico.

2025-10-31T14:42:10+00:00 ― 6 leggere min

Intelligenza artificiale Sviluppi nel Reinforcement Learning Multi-Agente per la Gestione dell'Inventario

Il tool MABIM migliora la ricerca in MARL per le sfide di inventario.

2025-10-31T12:58:24+00:00 ― 6 leggere min

Apprendimento automatico Progressi nella ricerca sull'AI di NetHack

Nuova libreria migliora l'addestramento e la valutazione dell'AI in NetHack.

2025-10-31T09:01:24+00:00 ― 8 leggere min

Apprendimento automatico Sviluppi nel Reinforcement Learning con SALE e TD7

Esplorare nuovi metodi per migliorare le performance dell'apprendimento per rinforzo.

2025-10-31T03:12:40+00:00 ― 6 leggere min

Sistemi e controllo Garantire la sicurezza nel reinforcement learning con set invarianti di controllo

Un metodo per migliorare la sicurezza nell'apprendimento per rinforzo usando Insiemi Invarianti al Controllo.

2025-10-31T02:01:53+00:00 ― 7 leggere min

Apprendimento automatico Skill-Critic: Un Nuovo Approccio nel Reinforcement Learning

Skill-Critic combina l'apprendimento ad alto e basso livello per migliori prestazioni nei task di RL.

2025-10-31T00:35:48+00:00 ― 7 leggere min

Intelligenza artificiale Migliorare il Machine Learning con una Gerarchia delle Competenze di Interazione

Nuovo metodo migliora come le macchine imparano compiti tramite il rilevamento delle interazioni.

2025-10-31T00:20:00+00:00 ― 6 leggere min

Gestione del portafoglio Un Nuovo Approccio alla Gestione del Rischio negli Investimenti

Combinare l'apprendimento per rinforzo e le funzioni barriera per strategie d'investimento più intelligenti.

2025-10-30T22:43:28+00:00 ― 6 leggere min

Suono Migliorare i modelli RNN-T con l'apprendimento per rinforzo

Un nuovo approccio migliora le prestazioni di RNN-T nel riconoscimento vocale automatico.

2025-10-30T19:53:45+00:00 ― 7 leggere min

Robotica Avanzamenti nei salti per robot a zampe

Un nuovo metodo migliora le capacità di salto dei robot con le zampe su terreni irregolari.

2025-10-30T19:43:30+00:00 ― 8 leggere min

Robotica Simulando il riordino di scatole come un umano in ambienti virtuali

Un sistema che imita le abilità umane nel riordinare le scatole in modo realistico.

2025-10-30T19:11:54+00:00 ― 6 leggere min

Crittografia e sicurezza Soluzioni automatizzate per la sicurezza della rete

Scopri come il machine learning migliora la difesa della rete contro le minacce online.

2025-10-30T14:59:06+00:00 ― 8 leggere min

Robotica Sviluppare la guida autonoma con la pianificazione predittiva delle manovre

Un nuovo metodo migliora la sicurezza e il comfort delle auto a guida autonoma tramite modelli predittivi.

2025-10-30T10:46:18+00:00 ― 6 leggere min

Intelligenza artificiale Sviluppi nei Sistemi di Controllo dei Semafori

Migliorare il flusso del traffico con metodi di controllo moderni per gli incroci urbani.

2025-10-30T07:20:54+00:00 ― 7 leggere min

Apprendimento automatico Avanzare nella Generazione di Testo con Apprendimento per Rinforzo Semi-Off-Line

Un nuovo metodo mescola strategie di dati per migliorare la generazione di testo nell'AI.

2025-10-29T21:52:06+00:00 ― 6 leggere min

Calcolo e linguaggio Generare linguaggio informale con l'IA

Un nuovo metodo per creare riassunti informali coinvolgenti usando l'apprendimento per rinforzo offline.

2025-10-29T19:29:54+00:00 ― 5 leggere min

Calcolo e linguaggio Estrazione di informazioni adattiva usando ordine dinamico

Nuovo metodo migliora l'accuratezza dell'estrazione dei dati con ordine dinamico e apprendimento rinforzato.

2025-10-29T13:10:42+00:00 ― 4 leggere min

Robotica Addestrare Veicoli Autonomi con Deep Q-Learning

Usare il Deep Q-Learning per insegnare alle auto autonome a mantenere la corsia e evitare collisioni.

2025-10-29T11:28:00+00:00 ― 5 leggere min

Apprendimento automatico Migliorare la Flessibilità nell'Apprendimento per Rinforzo

Un nuovo algoritmo aumenta l'adattabilità all'apprendimento nei modelli di apprendimento per rinforzo.

2025-10-29T05:40:24+00:00 ― 8 leggere min

Apprendimento automatico Sviluppi nel Tuning Online per Acceleratori di Particelle

Automatizzare il processo di messa a punto migliora le prestazioni in sistemi complessi come gli acceleratori di particelle.

2025-10-29T05:40:21+00:00 ― 6 leggere min

Apprendimento automatico Migliorare le previsioni a lungo termine nei sistemi dinamici

La teoria di Koopman migliora la precisione delle previsioni in ambienti dinamici per l'apprendimento per rinforzo.

2025-10-29T05:16:42+00:00 ― 7 leggere min

Apprendimento automatico Migliorare il Reinforcement Learning attraverso la modellazione delle ricompense

Esaminando come la modellazione delle ricompense migliori il processo decisionale nell'apprendimento per rinforzo.

2025-10-29T01:11:48+00:00 ― 6 leggere min

Strutture dati e algoritmi Migliorare l'esplorazione dei grafi con feedback negativo

Questo studio esplora come il feedback negativo possa migliorare l'efficienza nella traversata dei grafi.

2025-10-29T01:08:40+00:00 ― 6 leggere min

Apprendimento automatico Navigare nel Safe Multi-Agent Reinforcement Learning

Uno sguardo all'apprendimento sicuro con più agenti in ambienti ristretti.

2025-10-28T03:41:00+00:00 ― 7 leggere min

Apprendimento automatico Progressi nella Distillazione della Conoscenza Generalizzata

Nuovi metodi migliorano l'efficienza nell'addestramento di modelli neurali più piccoli.

2025-10-28T00:02:54+00:00 ― 5 leggere min

Apprendimento automatico Capire Minigrid e Miniworld nella ricerca AI

Minigrid e Miniworld sono strumenti per testare il processo decisionale nell'IA.

2025-10-27T22:12:18+00:00 ― 7 leggere min

Apprendimento automatico Progredire nel design dei linker PROTAC con ShapeLinker

ShapeLinker ottimizza la progettazione dei linker per una migliore efficacia dei farmaci usando il machine learning.

2025-10-27T18:08:06+00:00 ― 5 leggere min

Apprendimento automatico Migliorare l'addestramento di GCN con PolicyClusterGCN

Un nuovo framework migliora l'addestramento delle reti neurali convoluzionali su grafi attraverso un clustering adattivo.

2025-10-27T11:08:42+00:00 ― 6 leggere min

Intelligenza artificiale Sviluppi nel Design delle Travature con Tecniche AI

Un nuovo metodo combina algoritmi e apprendimento per rinforzo per la progettazione di travi.

2025-10-27T05:52:42+00:00 ― 6 leggere min

Apprendimento automatico Progressi nell'Apprendimento per Rinforzo con Utilità Generali

Il nuovo algoritmo N-VR-PG migliora la presa di decisione in ambienti complessi.

2025-10-27T01:01:47+00:00 ― 6 leggere min

Apprendimento automatico ChiPFormer: Un Nuovo Approccio alla Posizione dei Chip

ChiPFormer migliora l'efficienza del posizionamento dei chip grazie all'apprendimento per rinforzo offline.

2025-10-27T00:20:54+00:00 ― 6 leggere min

Recupero delle informazioni Affrontare le recensioni false nei sistemi di e-commerce

Questo documento affronta le sfide delle recensioni false nei sistemi di raccomandazione.

2025-10-26T18:49:06+00:00 ― 6 leggere min

Apprendimento automatico Migliorare il controllo del traffico di rete in ambienti tattici

Un nuovo framework che usa il reinforcement learning migliora la gestione del traffico di rete in condizioni difficili.

2025-10-26T13:56:48+00:00 ― 6 leggere min

Crittografia e sicurezza Ransomware alimentato da IA: una nuova sfida

Il ransomware si evolve con l'IA, rendendo sempre più difficile la sua rilevazione per i sistemi di cybersecurity.

2025-10-26T13:01:30+00:00 ― 6 leggere min

Apprendimento automatico Migliorare il Reinforcement Learning con SARC

SARC accelera l'apprendimento negli algoritmi actor-critic per decisioni migliori.

2025-10-26T04:43:48+00:00 ― 5 leggere min

Fisica e società Come nasce la cooperazione nelle reti strutturate

Questo studio analizza le dinamiche della cooperazione attraverso il prisma dell'apprendimento per rinforzo.

2025-10-26T01:17:57+00:00 ― 6 leggere min

Robotica L'ascesa della guida autonoma end-to-end

Uno sguardo ai progressi e alle sfide delle auto a guida autonoma.

2025-10-25T22:32:30+00:00 ― 6 leggere min

Terapia intensiva e medicina critica Sistemi basati sui dati nel trattamento della sepsi

Esaminando sistemi che migliorano il trattamento per la sepsi negli adulti utilizzando i dati.

2025-10-25T14:02:30+00:00 ― 6 leggere min