Apresentando modelos feitos pra melhorar o processamento de linguagem natural em português.
― 7 min ler
Ciência de ponta explicada de forma simples
Apresentando modelos feitos pra melhorar o processamento de linguagem natural em português.
― 7 min ler
Aprenda como a engenharia de prompt ativa melhora as tarefas para modelos de linguagem.
― 5 min ler
Este artigo analisa como o tamanho dos blocos afeta as respostas geradas por IA.
― 6 min ler
Uma nova abordagem destaca tokens surpreendentes para avaliar os dados de treinamento dos modelos de linguagem.
― 7 min ler
Esse estudo analisa métodos pra melhorar modelos de linguagem em italiano em áreas especializadas.
― 10 min ler
Um novo método melhora a resistência a manipulações em modelos de linguagem de peso aberto.
― 8 min ler
Melhorando modelos de linguagem menores como o MiniCPM com práticas de fine-tuning eficazes.
― 7 min ler
O benchmark avalia a capacidade de modelos de linguagem grandes de entender relações espaciais.
― 5 min ler
Um novo método analisa modelos de linguagem examinando suas características específicas.
― 5 min ler
Esse artigo analisa como a geração estruturada afeta o raciocínio e a compreensão dos modelos de linguagem.
― 6 min ler
OpenFactCheck oferece uma estrutura pra avaliar a precisão das saídas de modelos de linguagem.
― 7 min ler
Métodos inovadores para aumentar a justiça em modelos de linguagem grandes.
― 8 min ler
Um novo método melhora a qualidade dos dados sintéticos pra alinhar melhor os modelos de linguagem.
― 6 min ler
Um novo sistema melhora o reconhecimento de fala usando palavras-chave contextuais pra ter mais precisão.
― 6 min ler
A SAGE-RT cria dados sintéticos pra melhorar as avaliações de segurança de modelos de linguagem.
― 6 min ler
ArabLegalEval avalia o desempenho dos LLMs em lidar com informações legais em árabe.
― 7 min ler
Um novo método pra avaliar os resultados de modelos de linguagem usando vários juízes LLM.
― 8 min ler
Um novo benchmark avalia agentes de modelos de linguagem para lidar com análise de dados científicos.
― 9 min ler
Novos métodos melhoram a precisão de modelos pequenos em perguntas e respostas de telecomunicações.
― 6 min ler
O ConflictBank oferece insights sobre conflitos de conhecimento em modelos de linguagem.
― 6 min ler
Este artigo explora o papel da memorização em melhorar o desempenho do ICL.
― 7 min ler
Apresentando um novo modelo e referência para processamento de texto em russo.
― 6 min ler
Pesquisadores avaliam a confiabilidade das métricas para a segurança de modelos de linguagem.
― 7 min ler
Uma análise aprofundada de como a previsão do próximo token molda a compreensão de linguagem nos modelos.
― 7 min ler
FPDT oferece uma solução pra treinar LLMs de contexto longo de forma mais eficiente.
― 6 min ler
MemLong melhora a capacidade dos modelos de linguagem de lidar com textos longos de forma eficaz.
― 7 min ler
Esse artigo analisa como os modelos de linguagem criam redes sociais realistas e seus preconceitos.
― 7 min ler
Este artigo fala sobre uma nova estrutura pra melhorar o raciocínio em modelos de IA.
― 6 min ler
Apresentando uma estrutura pra gerar itens de teste de criatividade usando modelos de linguagem.
― 6 min ler
Um novo método melhora o processamento de textos longos em modelos de linguagem pra dar respostas melhores.
― 5 min ler
O LongGenBench avalia modelos de linguagem grandes na geração de textos longos de alta qualidade.
― 7 min ler
RAG continua sendo essencial pra otimizar as respostas de modelos de linguagem, especialmente com textos longos.
― 6 min ler
Este artigo avalia a eficácia de autoencoders esparsos na representação do conhecimento sobre cidades.
― 5 min ler
Um estudo sobre o impacto do ICL e SFT na estrutura de modelos de linguagem.
― 7 min ler
Estudo mostra que ajustar LLMs com TMs melhora a qualidade da tradução para as organizações.
― 7 min ler
Esse artigo fala sobre MLSAEs e o papel deles em examinar as camadas de modelos de linguagem.
― 6 min ler
ECHO combina diferentes padrões de raciocínio pra resolver problemas melhor em modelos de linguagem.
― 7 min ler
Estudo avalia modelos de linguagem na capacidade de gerar código para aplicações web.
― 7 min ler
AdaPPA aprimora ataques de jailbreak em modelos de linguagem combinando respostas seguras e prejudiciais.
― 5 min ler
PF-PPO melhora os modelos de linguagem filtrando recompensas não confiáveis pra ter respostas de código melhores.
― 5 min ler