Artigos mais recentes para Processos de Decisão de Markov

Lógica na Informática Nova Método para Analisar Sistemas Incertos

Uma nova técnica melhora as checagens de segurança em sistemas aleatórios como robôs e veículos.

2025-09-28T12:20:24+00:00 ― 7 min ler

Aprendizagem de máquinas Um Novo Olhar sobre Aprendizado por Reforço Inverso

Pesquisadores propõem uma abordagem bayesiana para melhorar a tomada de decisão em agentes inteligentes.

2025-09-26T14:23:18+00:00 ― 7 min ler

Robótica Treinando robôs pra jogar pingue-pongue como humanos

Pesquisadores desenvolvem robôs que aprendem pingue-pongue através de demonstrações parecidas com as humanas.

2025-09-25T19:57:18+00:00 ― 8 min ler

Otimização e Controlo Processos de Decisão de Markov Contínuos na Tomada de Decisão

Uma imersão em MDPs contínuos e suas aplicações na tomada de decisão e aprendizado por reforço.

2025-09-25T06:59:55+00:00 ― 7 min ler

Otimização e Controlo Navegando na Tomada de Decisão com Processos de Markov Robustos à Distribuição

Aprenda como MDPs robustos lidam com a incerteza em frameworks de tomada de decisão.

2025-09-22T23:30:24+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando o Fluxo de Tráfego com Veículos Autônomos

Um novo sistema melhora a tomada de decisão de veículos autônomos durante a construção de estradas.

2025-09-22T03:52:12+00:00 ― 6 min ler

Robótica Melhorando o Manejo de Objetos por Robôs Através de Planejamento Avançado

Um novo método melhora a habilidade dos robôs de pegar e mover objetos com segurança.

2025-09-21T18:23:24+00:00 ― 9 min ler

Aprendizagem de máquinas Avanços em Aprendizado por Reforço com Múltiplos Operadores de Bellman

Explorando o multi-aprendizado e seu impacto na estabilidade e no desempenho do aprendizado por reforço.

2025-09-20T17:46:06+00:00 ― 8 min ler

Aprendizagem de máquinas Analisando a Complexidade de Amostras em Algoritmos NPMD

Este estudo destaca a complexidade da amostra dos algoritmos de Descida de Espelho de Política Neural no aprendizado profundo.

2025-09-18T18:51:28+00:00 ― 6 min ler

Inteligência Artificial Garantindo a segurança de agentes de IA em vários ambientes

Um olhar sobre como agentes de IA podem ficar seguros em diferentes ambientes.

2025-09-18T14:25:06+00:00 ― 7 min ler

Lógica na Informática Analisando Processos com Observações Imperfeitas

Um método pra calcular probabilidades em sistemas com tempos de observação incertos.

2025-09-17T10:22:24+00:00 ― 7 min ler

Probabilidade Aplicando Processos de Decisão de Markov na Gestão Florestal

Usando MDPs pra otimizar estratégias de desbaste pra um crescimento florestal sustentável.

2025-09-14T19:19:07+00:00 ― 7 min ler

Computação e linguagem A Integração de Aprendizado por Reforço e Modelos de Linguagem Grandes

Explorando a sinergia entre RL e LLMs pra melhorar as aplicações de IA.

2025-09-12T05:17:24+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços em Aprendizado por Reforço através de Processos de Decisão de Markov Suaves

Novos algoritmos enfrentam desafios em espaços de estado-ação contínuos do Aprendizado por Reforço.

2025-09-10T14:42:42+00:00 ― 8 min ler

Aprendizagem de máquinas Navegando Processos de Decisão de Markov com Estado Infinito

Um olhar sobre MDPs de estados infinitos e seu papel no aprendizado por reforço.

2025-09-10T09:50:24+00:00 ― 8 min ler

Inteligência Artificial Aprimorando a Inferência Contrafactual na Tomada de Decisão

Esse trabalho aperfeiçoa a inferência contrafactual pra melhorar a tomada de decisão na saúde.

2025-09-08T14:15:30+00:00 ― 9 min ler

Matemática discreta Limites de Performance dos Métodos Clássicos de Otimização

Analisando os piores cenários no algoritmo simplex e na iteração de políticas.

2025-09-06T02:27:33+00:00 ― 7 min ler

Inteligência Artificial Projetando Controladores Eficazes para Ambientes Complexos

Um método usando aprendizado por reforço profundo e síntese reativa para design de controladores.

2025-09-05T12:07:48+00:00 ― 6 min ler

Inteligência Artificial Otimizando o Planejamento de Rovers para Missões Espaciais

Um novo método melhora o planejamento dos rovers em missões científicas, garantindo eficiência e confiabilidade.

2025-09-03T23:31:36+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços em Algoritmos de Aprendizado Sem Escala

Novos algoritmos enfrentam desafios em MDPs adversariais sem precisar de conhecimento prévio sobre perdas.

2025-09-02T12:30:12+00:00 ― 8 min ler

Aprendizagem automática Avaliação de Políticas com Métodos Off-Policy

Uma olhada nas técnicas de avaliação off-policy e como elas são relevantes na tomada de decisão.

2025-09-01T13:48:28+00:00 ― 7 min ler

Aprendizagem de máquinas Aumentando a Segurança no Controle de Naves Espaciais Autônomas

Um estudo sobre Aprendizado por Reforço Profundo Blindado para a autonomia segura de naves espaciais.

2025-08-31T07:50:12+00:00 ― 8 min ler

Aprendizagem de máquinas Soft Q-Learning: Equilibrando Exploração na Tomada de Decisão

Analisando o soft Q-learning pra tomar decisões eficazes em ambientes incertos.

2025-08-30T19:19:42+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços na Tomada de Decisão de Caminhões Autônomos

Esse artigo fala sobre o desenvolvimento de sistemas inteligentes para caminhões autônomos.

2025-08-30T10:30:24+00:00 ― 7 min ler

Sistemas e Controlo Melhorando a Tomada de Decisão em Sistemas Autônomos

Misturando HMDP e MPC para operações de veículos autônomos mais seguras.

2025-08-30T06:57:45+00:00 ― 8 min ler

Aprendizagem de máquinas Uma Visão Geral dos Métodos de Aprendizado por Reforço

Aprenda como os computadores tomam decisões através de técnicas e processos de Aprendizado por Reforço.

2025-08-28T19:24:06+00:00 ― 7 min ler

Robótica Um Novo Método para Navegação Segura em Veículos Autônomos

Este trabalho apresenta um modelo para melhorar a segurança na navegação de veículos autônomos.

2025-08-26T15:31:30+00:00 ― 9 min ler

Robótica Robôs e Preferências Humanas: Uma Nova Abordagem

Este artigo fala sobre como os robôs podem entender melhor as preferências humanas na execução de tarefas.

2025-08-25T17:24:18+00:00 ― 8 min ler

Engenharia de software Melhorando o Comportamento do Software com Requisitos de Término Obrigatório

Este artigo fala sobre como melhorar o comportamento de software através de requisitos de liveness.

2025-08-23T05:45:36+00:00 ― 6 min ler

Otimização e Controlo Avaliação de Desempenho de Políticas em MDPs Aproximados

Esse artigo examina como as políticas funcionam bem a partir de modelos aproximados em ambientes complexos.

2025-08-22T04:09:53+00:00 ― 6 min ler

Aprendizagem de máquinas Árvores de Decisão em Tempo Real Usando Métodos de Monte Carlo

Apresentando um algoritmo ideal para Decision Trees em dados de streaming.

2025-08-20T21:00:42+00:00 ― 7 min ler

Inteligência Artificial Avanços na Tomada de Decisão com BTS e DENTS

Novos algoritmos melhoram a tomada de decisão em tarefas de planejamento de IA.

2025-08-20T10:36:36+00:00 ― 8 min ler

Ciência da Computação e Teoria dos Jogos Gerenciando Energia e Recompensas nas Decisões

Explorando estratégias para otimizar níveis de energia e recompensas em Processos de Decisão de Markov.

2025-08-17T14:40:12+00:00 ― 7 min ler

Robótica Abordando o Problema da Mão Tremendo em Robôs

Este estudo foca em como os robôs conseguem planejar mesmo cometendo erros.

2025-08-16T20:37:54+00:00 ― 8 min ler

Aprendizagem de máquinas Simplificando a Análise de Convergência em Aprendizado por TD

Essa pesquisa simplifica a prova de convergência pra aprendizado por TD com aproximação de função linear.

2025-08-16T02:13:31+00:00 ― 8 min ler

Aprendizagem de máquinas Tornando a dosagem de Warfarin mais compreensível

Uma nova abordagem melhora a clareza na dosagem de warfarina e o cuidado com os pacientes.

2025-08-16T02:11:54+00:00 ― 9 min ler

Sistemas e Controlo Avançando a Segurança em Sistemas de Radar

A tecnologia de radar adaptativo melhora a segurança contra inimigos enquanto mantém o desempenho.

2025-08-16T01:15:35+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços em Aprendizagem por Reforço Multi-Objetivo

Uma nova abordagem de ator-crítico enfrenta desafios multi-objetivos em aprendizado por reforço.

2025-08-13T17:27:00+00:00 ― 11 min ler

Inteligência Artificial Melhorando a FMEA na Saúde com Automação

Um novo framework usa tecnologia pra agilizar a análise de falhas na saúde.

2025-08-13T09:09:18+00:00 ― 7 min ler

Criptografia e segurança Analisando mineração egoísta em sistemas de blockchain

Uma olhada mais de perto nos ataques de mineração egoísta e seu impacto na segurança da blockchain.

2025-08-13T01:31:06+00:00 ― 9 min ler