Um novo framework avalia como os LLMs raciocinam pra responder perguntas complexas.
― 5 min ler
Ciência de ponta explicada de forma simples
Um novo framework avalia como os LLMs raciocinam pra responder perguntas complexas.
― 5 min ler
Esse artigo fala sobre um método pra melhorar modelos de linguagem usando instruções estruturadas.
― 6 min ler
Uma nova ferramenta ajuda os pesquisadores a modelar a turbulência óptica de forma eficaz.
― 6 min ler
Explora como o DualView melhora a atribuição de dados em modelos de aprendizado de máquina.
― 7 min ler
Novo conjunto de dados melhora os métodos de avaliação para desaprendizado de máquina na geração de imagens.
― 7 min ler
A simplificação do texto ajuda a melhorar o acesso à informação para leitores diferentes.
― 6 min ler
Analisando a importância e os desafios das revisões de literatura em Análise de Padrões e Inteligência de Máquinas.
― 11 min ler
Automatizando a expansão de taxonomia usando modelos de linguagem avançados pra uma organização de conhecimento mais bacana.
― 7 min ler
Apresentando uma nova forma de avaliar modelos de linguagem grandes de maneira eficaz.
― 7 min ler
Um novo método identifica layouts típicos de documentos em várias áreas e idiomas.
― 10 min ler
Pesquisa revela informações sobre as práticas de comunicação científica entre a equipe do NIH.
― 9 min ler
Este estudo destaca a importância da incerteza na avaliação de Modelos de Visão-Linguagem.
― 8 min ler
A KIEval oferece avaliação interativa pra lidar com contaminação de dados em modelos de linguagem.
― 7 min ler
Esse artigo fala sobre uma nova estrutura pra avaliar alucinações em LVLMs.
― 8 min ler
O SportQA avalia a compreensão de modelos de linguagem sobre esportes através de mais de 70.000 perguntas.
― 9 min ler
A pesquisa destaca o viés nas avaliações de modelos de linguagem e sugere métodos pra melhorar isso.
― 7 min ler
A pesquisa desafia os métodos tradicionais de avaliar os valores e opiniões dos modelos de linguagem.
― 7 min ler
OpenMEDLab melhora o acesso a ferramentas e recursos de IA médica pra um atendimento de saúde melhor.
― 7 min ler
SyllabusQA oferece uma visão sobre perguntas automáticas em educação.
― 10 min ler
Novo conjunto de dados melhora a avaliação de sistemas de correção de erros gramaticais.
― 7 min ler
Um estudo sobre a eficácia do GPT-4 em simplificar frases.
― 6 min ler
Um novo método pra avaliar ferramentas de processamento de linguagem tá mostrando potencial pra melhorar.
― 6 min ler
Um novo conjunto de dados tem como objetivo melhorar a qualidade das mensagens de commit automáticas para os desenvolvedores.
― 11 min ler
Um novo método melhora as habilidades de comunicação dos agentes de linguagem.
― 7 min ler
E avaliando como os preconceitos nos modelos de linguagem afetam aplicações no mundo real.
― 7 min ler
X-LLaVA melhora as capacidades multilíngues para responder perguntas visuais.
― 8 min ler
Descubra como o ChartThinker melhora os resumos de gráficos pra facilitar a compreensão.
― 7 min ler
Avaliar LLMs na habilidade de processar textos longos na literatura.
― 6 min ler
Um novo método pra avaliar modelos de linguagem grandes usando menos exemplos.
― 7 min ler
Melhorando a eficiência no Datalog através de semirring e técnicas de grounding.
― 6 min ler
Um novo conjunto de dados ajuda os modelos de IR a se adaptarem a instruções complexas pra ter um desempenho melhor.
― 3 min ler
Descubra como os modelos de linguagem podem melhorar nossa compreensão sobre a qualidade dos argumentos.
― 9 min ler
Explorando as complexidades de avaliar sistemas de recuperação de informações legais e sua eficácia.
― 8 min ler
A TriviaHG oferece dicas pra perguntas, estimulando um pensamento mais profundo e aprendizado.
― 7 min ler
Um novo conjunto de dados melhora a avaliação do conhecimento molecular em modelos de linguagem.
― 8 min ler
Esse estudo explora como nossos cérebros avaliam escolhas e tomam decisões.
― 7 min ler
Esse guia ajuda a facilitar a avaliação de sistemas de recomendação pra melhorar a experiência do usuário.
― 8 min ler
Esse trabalho foca em identificar cenas importantes pra melhorar os resumos de roteiros de filmes.
― 6 min ler
Um método para aprender e avaliar políticas ao mesmo tempo usando todos os dados disponíveis.
― 8 min ler
Esse artigo explora como os LLMs geram e refinam hipóteses científicas a partir de dados existentes.
― 8 min ler