Ferramentas automáticas como LLMs ajudam a checar afirmações de forma eficiente.
― 7 min ler
Ciência de ponta explicada de forma simples
Ferramentas automáticas como LLMs ajudam a checar afirmações de forma eficiente.
― 7 min ler
Essa abordagem usa autoavaliação pra se proteger de resultados prejudiciais em modelos de linguagem.
― 2 min ler
Estudando como a quantização afeta o desempenho em diferentes línguas.
― 6 min ler
DCoT melhora o desempenho do modelo de linguagem por meio de vários caminhos de raciocínio.
― 9 min ler
Estudo revela como os significados das palavras mudam com o contexto e o tempo usando embeddings de palavras.
― 5 min ler
Uma nova abordagem para treinar modelos de recompensa que se alinham com as preferências humanas.
― 6 min ler
Adaptar os prompts pra modelos específicos melhora a performance em tarefas de linguagem.
― 8 min ler
Analisando o papel dos gráficos semânticos em simplificar frases com modelos de linguagem grandes.
― 7 min ler
A pesquisa explora como melhorar a geração de textos de citação usando grandes modelos de linguagem.
― 6 min ler
Um olhar sobre métodos e desafios de gerar contrafactuais em PNL.
― 6 min ler
Um estudo classifica tweets de pais sobre transtornos na infância.
― 6 min ler
O estudo mostra que as ferramentas de avaliação de IA têm um viés a favor de respostas mais longas.
― 6 min ler
Analisando como os usuários moldam a linguagem tóxica em conversas com modelos de linguagem grandes.
― 6 min ler
Um novo método melhora a resumação com dados de treinamento limitados.
― 5 min ler
Este artigo avalia o desempenho de LLM em um curso de Teoria da Computação.
― 6 min ler
Explorando como os níveis de confiança são atribuídos aos LLMs e suas implicações.
― 8 min ler
A gente testa as habilidades de raciocínio dos modelos de linguagem com vários jogos, mostrando limitações bem grandes.
― 9 min ler
Um novo método simplifica a comunicação científica usando modelos de linguagem colaborativos.
― 6 min ler
Um novo método aumenta a eficiência dos modelos de linguagem usando pesos de atenção compartilhados.
― 6 min ler
Este estudo analisa como os LLMs mudam a informação através das interações.
― 6 min ler
Este artigo estuda como o treinamento influencia as previsões dos grandes modelos de linguagem.
― 8 min ler
Novos métodos melhoram a gestão de cache para modelos de linguagem grandes.
― 6 min ler
Uma olhada detalhada no benchmark MMAU para modelos de linguagem.
― 6 min ler
Este artigo analisa como a inicialização de embeddings afeta o desempenho do modelo transformer.
― 7 min ler
Esse artigo analisa a eficácia e a confiabilidade dos vetores de direcionamento em modelos de linguagem.
― 7 min ler
Analisando as habilidades de contar histórias de modelos de linguagem grandes em comparação com autores humanos.
― 5 min ler
Um novo benchmark avalia modelos de linguagem em desafios de codificação científica em várias áreas.
― 7 min ler
Pesquisas mostram vulnerabilidades em métodos de marca d'água para texto gerado por IA.
― 15 min ler
Uma análise de como os LLMs se saem no Abstraction and Reasoning Corpus.
― 6 min ler
Uma análise do desempenho de LLM em quebra-cabeças de grade pra avaliar habilidades de raciocínio.
― 8 min ler
Este artigo analisa a decodificação de múltiplos prompts para melhorar a qualidade da geração de texto.
― 7 min ler
O MIBench testa o desempenho de modelos multimodais em várias imagens.
― 7 min ler
Um novo método aumenta a eficiência dos LLMs na criação de designs de hardware complexos.
― 6 min ler
Analisando a eficácia do RAG e de LLMs de longo contexto no processamento de texto.
― 7 min ler
Um estudo sobre o comportamento de agentes linguísticos em um jogo de dedução social.
― 5 min ler
Um novo método pra detectar e corrigir erros de fato nas histórias.
― 12 min ler
Um novo método melhora as habilidades de resolução de matemática em modelos de linguagem menores usando DPO e auto-treinamento.
― 7 min ler
Novos métodos pra personalizar modelos de linguagem de IA são essenciais pra diversidade dos usuários.
― 7 min ler
Um olhar sobre como os modelos de linguagem lidam com tarefas de aritmética e seu processo de aprendizado.
― 7 min ler
Um kit de ferramentas feito pra avaliar melhor as interações entre humanos e bots.
― 6 min ler