Apresentando o planejamento aberto e fundamentado pra melhorar a execução de tarefas no mundo real.
― 10 min ler
Ciência de ponta explicada de forma simples
Apresentando o planejamento aberto e fundamentado pra melhorar a execução de tarefas no mundo real.
― 10 min ler
Um método pra criar representações de texto claras usando perguntas de sim/não.
― 5 min ler
Um novo método melhora a resolução de eventos ao combinar modelos de linguagem pra ter mais precisão.
― 6 min ler
Um novo sistema pra avaliar modelos de linguagem usando fluxos de dados do mundo real.
― 6 min ler
Um estudo compara as respostas empáticas de modelos de linguagem e humanos.
― 7 min ler
Este artigo analisa como os LLMs entendem as crenças e sentimentos humanos.
― 7 min ler
Usando IA pra automatizar a vetorização, melhorando a eficiência e a correção do código.
― 7 min ler
Ataques de jamming podem atrapalhar sistemas de geração aumentada por recuperação bloqueando as respostas.
― 7 min ler
Este estudo analisa como as percepções sociais afetam as interações dos estudantes com LLMs em cursos de programação.
― 8 min ler
O LogBatcher simplifica a análise de logs usando modelos de linguagem grandes sem precisar de treinamento prévio.
― 7 min ler
Um novo benchmark testa a capacidade dos LLMs de encontrar vulnerabilidades de software.
― 7 min ler
Explorando como as máquinas detectam opiniões em posts de redes sociais.
― 9 min ler
Um olhar sobre como os LLMs encaram desafios de programação por meio de exemplos.
― 6 min ler
Avaliando o papel dos LLMs em melhorar a representação estruturada de trabalhos científicos.
― 8 min ler
Um novo método melhora o processamento de gráficos cheios de texto pra ter insights melhores.
― 8 min ler
Investigando como as previsões de LLM se alinham com as escolhas humanas usando modelagem estatística.
― 12 min ler
Esse artigo explora como usar IA pra melhorar processos de otimização de múltiplos objetivos.
― 7 min ler
Avaliando os riscos de resultados tendenciosos em robôs usando modelos de linguagem.
― 7 min ler
A SciEx revela os pontos fortes e os desafios dos LLMs na avaliação científica.
― 8 min ler
Esse estudo avalia como LLMs podem melhorar o teste de mutação no desenvolvimento de software.
― 6 min ler
Um novo teste de referência avalia as habilidades dos LLMs com formatos de dados estruturados.
― 7 min ler
Este artigo investiga o Efeito de Falso Consenso em modelos de linguagem grandes.
― 5 min ler
Apresentando o RePrompt pra melhorar o desempenho do modelo de linguagem com prompts otimizados.
― 7 min ler
Este estudo analisa os preconceitos em modelos de IA durante a rotulagem de dados de discurso de ódio.
― 8 min ler
Explorando o papel da IA em melhorar a consistência das notas na educação online.
― 9 min ler
Pesquisas mostram que estilos de resposta consistentes melhoram a eficácia dos LLMs com menos exemplos.
― 8 min ler
Um novo método combina humano e IA pra classificar texto de forma eficiente.
― 18 min ler
Este estudo analisa como a linguagem influencia os valores culturais em grandes modelos.
― 9 min ler
A APPL facilita o desenvolvimento com grandes modelos de linguagem usando uma sintaxe intuitiva, parecida com Python.
― 2 min ler
Este artigo fala sobre como redes neurais profundas aprendem a linguagem através da previsão do próximo token.
― 8 min ler
A UNCTAD criou uma ferramenta RAG de código aberto pra melhorar o acesso aos dados e a eficiência.
― 7 min ler
Este estudo investiga a eficácia do FActScore em várias línguas.
― 12 min ler
O CEBench ajuda empresas e pesquisadores a avaliar LLMs enquanto gerenciam custos e desempenho.
― 7 min ler
O GIEBench avalia as respostas empáticas de LLMs com base em identidades de grupos diversos.
― 8 min ler
Um estudo sobre o PlagBench e seu papel na detecção de plágio em saídas de LLM.
― 5 min ler
Um novo conjunto de dados avalia o desempenho de LLM na resolução de desafios relacionados a gráficos.
― 7 min ler
Este artigo apresenta um método pra usar LLMs pra anotar dados em tabelas com o mínimo de esforço humano.
― 17 min ler
Este estudo examina os LLMs como uma alternativa econômica para a classificação de textos.
― 8 min ler
LLaMIPa melhora a capacidade dos computadores de compreender a dinâmica da conversa.
― 8 min ler
Uma nova estrutura aprimora a análise e recuperação de dados FMEA.
― 6 min ler