Estudo avalia como os LLMs lidam de forma consistente com perguntas sobre valores.
― 6 min ler
Ciência de ponta explicada de forma simples
Estudo avalia como os LLMs lidam de forma consistente com perguntas sobre valores.
― 6 min ler
Um estudo sobre como diferenciar texto gerado por IA da escrita humana.
― 6 min ler
Talkamatic melhora os chatbots ao aprimorar a gestão de diálogos para interações com os usuários.
― 6 min ler
GPTQT melhora a eficiência e o desempenho na quantização de grandes modelos de linguagem, tornando a IA mais acessível.
― 6 min ler
Melhorando a experiência do usuário ao unir ergonomia cognitiva com modelos de linguagem.
― 6 min ler
Um novo benchmark aborda os desafios na recuperação de código para desenvolvedores.
― 9 min ler
O MindBench melhora a avaliação de modelos pra entender mapas mentais complexos.
― 6 min ler
Uma visão geral de métodos para proteger informações pessoais enquanto mantém a utilidade dos dados.
― 6 min ler
Estudo revela como os significados das palavras mudam com o contexto e o tempo usando embeddings de palavras.
― 5 min ler
Um novo framework analisa e reduz o viés em modelos de visão-linguagem através de intervenções específicas.
― 7 min ler
Esse artigo fala sobre novas abordagens pra melhorar as previsões em reações químicas usando tecnologia.
― 9 min ler
A UniGloR oferece uma nova forma de traduzir e produzir linguagem de sinais sem anotações.
― 9 min ler
A IA ajuda a lidar com a subjetividade nas avaliações de sustentabilidade corporativa.
― 9 min ler
Um novo conjunto de dados traz à tona jornais históricos da América Latina.
― 7 min ler
Esse artigo apresenta um método pra identificar e gerenciar memes prejudiciais de forma eficaz.
― 5 min ler
Novo método ESQA usa modelos de linguagem grandes para análise de sequência de eventos.
― 7 min ler
Uma olhada nos benefícios dos métodos de avaliação de qualidade de tradução em nível de segmento.
― 11 min ler
Apresentando o TTPD pra identificar de forma precisa declarações falsas em modelos de linguagem grandes.
― 8 min ler
Frameworks de teste melhoram a confiabilidade dos modelos de linguagem pra dar respostas confiáveis.
― 6 min ler
Novo conjunto de dados melhora a geração de imagens e textos em Modelos de Visão-Linguagem.
― 5 min ler
Pesquisadores testam métodos pra melhorar o raciocínio em modelos de linguagem com novas técnicas de prompting.
― 6 min ler
O PersuaBot é eficaz em entregar informações persuasivas e precisas através de métodos inovadores.
― 9 min ler
Novas maneiras aumentam a confiabilidade do texto gerado por modelos de linguagem.
― 5 min ler
Analisando a dinâmica de gênero nas conversas online sobre imagem corporal.
― 8 min ler
Uma análise de viés de gênero e religioso em modelos de linguagem para Bangla.
― 6 min ler
Um novo teste para avaliar o raciocínio sobre timing sem depender de conhecimento prévio.
― 6 min ler
XferBench avalia a qualidade das línguas desenvolvidas por máquinas.
― 9 min ler
Um estudo sobre como os LLMs gerenciam regras e restrições de programação.
― 5 min ler
Explorando como os LLMs se comparam a avaliadores humanos na pontuação das respostas dos alunos.
― 7 min ler
Um framework pra monitorar e analisar o consumo de energia em modelos de linguagem grandes.
― 10 min ler
Um conjunto de dados ajuda modelos de linguagem a estimar carboidratos nas refeições a partir de descrições do dia a dia.
― 7 min ler
Método de conjunto inovador melhora a precisão de modelos de linguagem e visuais.
― 8 min ler
Um novo método pra ajustar modelos de linguagem de forma eficiente com menos parâmetros.
― 8 min ler
Uma nova abordagem para treinar modelos de recompensa que se alinham com as preferências humanas.
― 6 min ler
Esse artigo fala sobre LLMs e o papel deles na edição do conteúdo da Wikipedia.
― 6 min ler
ChartGemma melhora a compreensão de gráficos usando dados visuais pra dar insights melhores.
― 7 min ler
Um conjunto de dados rico pra estudar linguagens emergentes em sistemas de comunicação.
― 8 min ler
As preocupações aumentam sobre ataques por trás das cortinas em modelos de linguagem, afetando a segurança e a confiabilidade.
― 7 min ler
Uma ferramenta pra identificar respostas enganosas de grandes modelos de linguagem.
― 7 min ler
Adaptar os prompts pra modelos específicos melhora a performance em tarefas de linguagem.
― 8 min ler