Um método que usa exemplos pra guiar os agentes na tomada de decisão.
― 8 min ler
Ciência de ponta explicada de forma simples
Um método que usa exemplos pra guiar os agentes na tomada de decisão.
― 8 min ler
Um novo método melhora o desempenho dos robôs usando pontos de referência na aprendizagem por imitação.
― 8 min ler
MOTO melhora o aprendizado de robôs juntando treinamento offline com ajustes online.
― 7 min ler
AutoFT melhora o desempenho do modelo em dados não vistos através de técnicas inovadoras de ajuste fino.
― 8 min ler
Um novo sistema melhora a maneira como os robôs coletam e aprendem com dados do mundo real.
― 7 min ler
Apresentando o SERL: um novo framework pra tarefas de aprendizado de robôs de forma eficiente.
― 7 min ler
Esse artigo fala sobre um jeito de melhorar os LLMs usando feedback verbal sem generalizar demais.
― 12 min ler
Um estudo sobre a eficácia do RLAIF em comparação com o ajuste fino supervisionado para modelos de linguagem.
― 10 min ler
Um método pra melhorar o aprendizado de máquina usando dados não rotulados em vários domínios.
― 6 min ler
Estudo revela benefícios de treinar robôs com experiências variadas de tarefas.
― 8 min ler
Os robôs estão aprendendo a se adaptar e fazer tarefas em várias áreas.
― 8 min ler
Robôs aprendem a se adaptar e melhorar recebendo feedback humano em tempo real.
― 8 min ler
Novo modelo melhora o aprendizado de máquina separando dados complexos em partes mais simples.
― 8 min ler
Este estudo avalia métodos para melhorar modelos de linguagem grande usando dados de preferência dos usuários.
― 6 min ler
Esse artigo fala sobre o papel das simulações na avaliação das habilidades de robôs.
― 7 min ler
Políticas de robôs generalistas melhoram a adaptabilidade para várias tarefas na robótica.
― 8 min ler
Analisando a superotimização em DAAs e seu impacto no desempenho do modelo.
― 9 min ler
Um novo modelo permite que robôs aprendam tarefas melhor usando entradas visuais e de linguagem.
― 8 min ler
Uma nova abordagem ajuda os robôs a se adaptarem rapidamente a tarefas desconhecidas.
― 9 min ler
Novos métodos melhoram o movimento de robôs de pernas em ambientes complexos usando IA.
― 8 min ler
Os robôs melhoram a navegação entendendo tanto fala quanto imagens.
― 7 min ler
Um novo método pra avaliar os valores diversos dos usuários em modelos de linguagem.
― 9 min ler
Esse método melhora a confiabilidade das pontuações de confiança dos modelos de linguagem.
― 6 min ler
Uma maneira divertida de todo mundo ajudar a ensinar robôs através de dados colaborativos.
― 6 min ler
Descubra como o Aprendizado por Reforço Agnóstico a Políticas muda a tomada de decisão das máquinas.
― 8 min ler