Um novo conjunto de dados sintético melhora o treinamento para modelos de IA multimodais.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo conjunto de dados sintético melhora o treinamento para modelos de IA multimodais.
― 6 min ler
Melhorando como as máquinas respondem a perguntas visuais por meio de raciocínio estruturado.
― 7 min ler
Um novo método mede como os modelos de linguagem adaptam suas crenças com novas evidências.
― 11 min ler
Um novo benchmark avalia a eficácia de modelos de linguagem em aplicações robóticas.
― 7 min ler
Uma nova abordagem melhora o raciocínio em modelos de linguagem gerando erros controlados.
― 7 min ler
ReGround3D melhora a compreensão das instruções humanas em ambientes 3D.
― 5 min ler
Uma estrutura pra melhorar a resposta a perguntas de múltiplas etapas usando raciocínio em forma de árvore.
― 5 min ler
Um novo método melhora as habilidades de raciocínio dos modelos de linguagem por meio da análise de questões.
― 6 min ler
Um novo modelo melhora o monitoramento de segurança para grandes modelos de linguagem contra conteúdos prejudiciais.
― 8 min ler
Este artigo desafia a crença na auto-consistência entre as respostas de modelos de linguagem.
― 8 min ler
Este artigo examina como os Transformers raciocinam e o papel dos cadernos de anotação.
― 6 min ler
A gente testa as habilidades de raciocínio dos modelos de linguagem com vários jogos, mostrando limitações bem grandes.
― 9 min ler
Combinar LLMs e Prolog melhora o raciocínio na geração de texto.
― 8 min ler
Este artigo fala como o raciocínio de LLM melhora sistemas de recomendação e apresenta o Rec-SAVER.
― 8 min ler
Uma nova abordagem melhora as capacidades de raciocínio de GNN para tarefas de relacionamentos complexos.
― 7 min ler
Um novo método melhora as habilidades de resolução de matemática em modelos de linguagem menores usando DPO e auto-treinamento.
― 7 min ler
Um novo parâmetro pra avaliar modelos que analisam música e linguagem.
― 7 min ler
Um olhar sobre como medimos a inteligência dos modelos de linguagem de IA.
― 5 min ler
Estudo avalia as habilidades de raciocínio de modelos de linguagem grandes com perguntas complexas.
― 6 min ler
Esse artigo analisa como o raciocínio automatizado pode melhorar o desempenho dos modelos de linguagem.
― 8 min ler
Esse artigo explora a importância de lembrar fatos no raciocínio de LLMs.
― 9 min ler
Uma nova estrutura pra avaliar modelos de visão-linguagem de forma eficaz.
― 7 min ler
Um estudo sobre como melhorar as habilidades cognitivas da IA usando o xadrez como plataforma.
― 7 min ler
Este estudo avalia as habilidades de raciocínio de LLM usando o desafiador problema 3-SAT.
― 7 min ler
MathScape melhora a avaliação de MLLMs com problemas de matemática visuais e textuais.
― 6 min ler
Pesquisadores criam um conjunto de dados pra melhorar a tomada de decisões éticas dos modelos de linguagem.
― 8 min ler
Modelos de linguagem mandam bem em tarefas de memória, mas têm dificuldade com desafios de raciocínio.
― 6 min ler
Consistência de caminho melhora a eficiência e a precisão em grandes modelos de linguagem.
― 6 min ler
Um novo método permite que modelos de linguagem corrijam seus próprios erros em matemática.
― 5 min ler
Um novo conjunto de dados melhora a capacidade dos robôs de entender e navegar em ambientes 3D.
― 7 min ler
ECHO combina diferentes padrões de raciocínio pra resolver problemas melhor em modelos de linguagem.
― 7 min ler
Aprenda como os cognitive-logs podem melhorar nosso raciocínio sobre ações e eventos.
― 8 min ler
Essa pesquisa melhora a forma como os modelos respondem perguntas usando tabelas.
― 7 min ler
Um estudo sobre a capacidade dos LLMs em entender intervalos musicais, acordes e escalas.
― 10 min ler
Explora a ascensão e o impacto dos Modelos Fundamentais na inteligência artificial.
― 6 min ler
Um estudo mede como os modelos de IA entendem as emoções humanas através de uma estrutura organizada.
― 8 min ler
Apresentando um conjunto de dados pra avaliar o desempenho dos sistemas RAG em situações do dia a dia.
― 6 min ler
Essa pesquisa destaca momentos chave em diálogos através de um novo conjunto de dados e uma estrutura de análise.
― 9 min ler
Uma nova estrutura busca melhorar a confiabilidade e a clareza no raciocínio da IA.
― 9 min ler
Estudo mostra que pseudo-código melhora o desempenho de LLM em tarefas de gráfico.
― 8 min ler