Artigos mais recentes para Aprendizado por Reforço

Aprendizagem de máquinas Usando Modelos de Linguagem Grandes pra Ajuste de Recompensas em Aprendizado por Reforço

Esse trabalho explora o papel dos LLMs em melhorar o aprendizado por reforço com modelagem de recompensa.

2025-08-08T16:19:00+00:00 ― 9 min ler

Inteligência Artificial Tornando as Decisões da IA Mais Claras com Políticas de Árvore

Novas estruturas de árvore melhoram a visibilidade na tomada de decisão em sistemas de IA.

2025-08-08T12:06:12+00:00 ― 10 min ler

Aprendizagem de máquinas Melhorando o Aprendizado dos Robôs com Suporte Sensorial

Usar sensores avançados durante o treinamento ajuda os robôs a realizarem as tarefas melhor.

2025-08-08T11:10:54+00:00 ― 7 min ler

Inteligência Artificial Melhorando Testes de Penetração Automatizados com Aprendizado por Reforço

Uma nova estrutura melhora a eficiência dos testes de penetração automatizados usando aprendizado por reforço.

2025-08-07T19:22:54+00:00 ― 9 min ler

Aprendizagem de máquinas Uma Nova Abordagem para Alinhar Modelos de Linguagem

Apresentando Alinhamento por Demonstrações para modelos de linguagem seguros e eficazes.

2025-08-07T16:44:54+00:00 ― 12 min ler

Finanças computacionais Avanços na Gestão de Portfólio de Investimentos

Um novo modelo melhora a gestão de portfólio usando IA e teorias tradicionais.

2025-08-07T05:24:47+00:00 ― 8 min ler

Computação e linguagem O Papel da IA na Prosecução de Patentes

Explorando como a IA melhora a eficiência na redação de pedidos de patente e as taxas de aprovação.

2025-08-07T02:00:06+00:00 ― 5 min ler

Computação e linguagem Apresentando a Otimização de Triple Preferência para LLMs

A TPO oferece um novo método pra alinhar modelos de linguagem com as preferências humanas de forma eficiente.

2025-08-06T22:11:00+00:00 ― 7 min ler

Robótica Avanços em Aprendizado de Máquina com Ego-Previsão

Um novo método melhora o aprendizado de máquina ao aperfeiçoar a previsão de movimentos.

2025-08-06T15:43:54+00:00 ― 7 min ler

Otimização e Controlo Otimização de Estratégias em Aprendizado por Reforço

Uma visão geral dos métodos de gradiente de política em aprendizado de reforço.

2025-08-06T14:34:38+00:00 ― 6 min ler

Otimização e Controlo Avanços em Q-Learning de Duas Escalas para Sistemas Multi-Agentes

Explorando o algoritmo de Q-learning em duas escalas de tempo no aprendizado por reforço de campo médio.

2025-08-06T10:38:41+00:00 ― 8 min ler

Aprendizagem de máquinas Avançando a Segurança em Aprendizado por Reforço com SRCPO

Um novo método melhora a segurança no aprendizado por reforço através da gestão de riscos.

2025-08-06T01:14:54+00:00 ― 8 min ler

Computação e linguagem Melhorando a Geração de Código com Modelos de Auto-Debugging

Aprimorando a capacidade dos LLMs de melhorar seu código com técnicas de auto-debugging.

2025-08-06T00:19:36+00:00 ― 7 min ler

Robótica Avanços em Micro-Robótica: O Papel do SwarmRL

SwarmRL ajuda cientistas a controlar micro-robôs pra várias aplicações, especialmente na medicina.

2025-08-05T23:30:45+00:00 ― 7 min ler

Inteligência Artificial A Interseção entre Jogos de Tabuleiro e Aprendizado de IA

Pesquisadores misturam jogos de tabuleiro com IA usando técnicas de Aprendizado por Reforço.

2025-08-05T17:05:06+00:00 ― 10 min ler

Processamento de Sinal Otimizando o Uso de Energia em Estações Base mmWave

Esse estudo propõe um novo método pra economizar energia em redes mmWave.

2025-08-05T16:40:30+00:00 ― 7 min ler

Aprendizagem de máquinas O Impacto dos Métodos de Gradiente de Política em Aprendizado por Reforço

Explorando métodos de gradiente de política e seus efeitos na tomada de decisão em aprendizado por reforço.

2025-08-05T12:36:30+00:00 ― 6 min ler

Inteligência Artificial Melhorando a Análise de Imagens Médicas com Modelos de IA

Avanços em modelos de IA melhoram a precisão na interpretação de imagens médicas.

2025-08-05T08:39:30+00:00 ― 9 min ler

Aprendizagem de máquinas Modelos com Senha: Revelando Habilidades Ocultas da IA

Um novo conceito de modelo mostra como testar as capacidades da IA de forma eficaz.

2025-08-05T08:15:48+00:00 ― 8 min ler

Arquitetura de redes e da Internet Gestão Eficiente de Recursos em Comunicações Sem Fio

Aprenda como otimizar a alocação de recursos em redes sem fio pra ter um serviço melhor.

2025-08-05T03:07:42+00:00 ― 8 min ler

Aprendizagem de máquinas Avançando o Aprendizado com Restrições em Aprendizado por Reforço

Um novo algoritmo melhora o aprendizado em ambientes restritos usando amostragem posterior.

2025-08-05T02:28:12+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços no Agendamento de Trabalhos através do Índice de Gittins

Aproveitando o aprendizado por reforço pra otimizar o agendamento de trabalhos usando técnicas do índice de Gittins.

2025-08-05T01:45:44+00:00 ― 6 min ler

Aprendizagem de máquinas Impacto das Escolhas de Ação no RL em Operações Espaciais

Examinando como as escolhas de ação influenciam os agentes de RL em tarefas espaciais.

2025-08-05T01:17:25+00:00 ― 8 min ler

Inteligência Artificial Aprimorando Táticas de Conversa no ONUW

Estudo sobre como melhorar as estratégias de discussão para IA no One Night Ultimate Werewolf.

2025-08-04T15:24:36+00:00 ― 7 min ler

Aprendizagem de máquinas Agentes LLM: Uma Nova Abordagem para Tomada de Decisão em IA

Analisando o papel dos agentes LLM na resolução de problemas do dia a dia.

2025-08-04T14:45:06+00:00 ― 9 min ler

Aprendizagem de máquinas Integrando Preferências Humanas em IA com PFM

O Preference Flow Matching traz uma nova forma de alinhar os resultados da IA com as preferências dos usuários.

2025-08-04T14:21:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Os robôs conseguem aprender a dançar como os humanos?

Pesquisas mostram que agentes não-humanóides conseguem analisar danças humanas e criar movimentos em sincronia com a música.

2025-08-04T13:02:24+00:00 ― 5 min ler

Inteligência Artificial Melhorando a Aprendizagem em Sistemas de Reforço Visual

Um novo método melhora o aprendizado em ambientes em sistemas de reforço visual.

2025-08-04T12:54:30+00:00 ― 5 min ler

Inteligência Artificial Como os Autoencoders Imitam Células de Lugar na Formação de Memória

Esse estudo mostra como autoencoders esparsos criam representações de memória parecidas com células de lugar.

2025-08-04T12:20:03+00:00 ― 9 min ler

Aprendizagem de máquinas Melhorando o Aprendizado por Reforço em Ambientes Barulhentos

Um novo framework usa Máquinas de Recompensa pra melhorar o desempenho de RL em situações de incerteza.

2025-08-04T02:54:06+00:00 ― 9 min ler

Aprendizagem de máquinas Avançando Modelos de Difusão com Equilíbrio de Trajetória Relativa

Melhorando a qualidade das amostras em machine learning com métodos inovadores.

2025-08-04T00:16:06+00:00 ― 6 min ler

Aprendizagem automática Colaboração em Aprendizado por Reforço Sem Compartilhamento de Dados

Explorando controle federado em aprendizado por reforço pra agentes trabalharem juntos de forma segura.

2025-08-03T21:23:28+00:00 ― 7 min ler

Computação e linguagem Avanços na Extração de Relações entre Documentos

Um novo método melhora a extração de relações em documentos longos.

2025-08-03T21:22:18+00:00 ― 9 min ler

Aprendizagem de máquinas Equilibrando a Adaptabilidade em Modelos de Aprendizado de Máquina

Esse estudo propõe uma nova abordagem pra manter o aprendizado em sistemas de IA.

2025-08-03T19:31:42+00:00 ― 7 min ler

Recuperação de informação Avançando Sistemas de Recomendação com Comportamento de Usuário Sintético

Um novo modelo pra treinar sistemas de recomendação usando interações de usuários simuladas.

2025-08-03T19:23:48+00:00 ― 9 min ler

Robótica Um Novo Método para Reorganização Eficiente da Casa

Este artigo apresenta uma abordagem inovadora para organizar casas bagunçadas.

2025-08-03T17:33:12+00:00 ― 7 min ler

Gráficos Avançando o Movimento Realista na Animação

Um novo método melhora os movimentos humanos na animação e na robótica.

2025-08-03T14:47:18+00:00 ― 7 min ler

Aprendizagem de máquinas Melhorando Sistemas de Compartilhamento de Bicicletas com Aprendizado de Política Dual

Uma nova abordagem melhora a eficiência do compartilhamento de bicicletas e a satisfação dos usuários.

2025-08-03T13:20:24+00:00 ― 7 min ler

Aprendizagem de máquinas Melhorando o Aprendizado por Reforço com Modelos de Linguagem Visual

Combinar modelos de linguagem visual com aprendizado por reforço melhora a eficiência na conclusão de tarefas.

2025-08-03T10:34:30+00:00 ― 7 min ler

Aprendizagem de máquinas Avançando na Tomada de Decisões com Processos Não Acumulativos

Um novo modelo pra melhorar a tomada de decisões em situações dinâmicas.

2025-08-03T08:42:32+00:00 ― 9 min ler