DEnsity traz uma nova maneira de avaliar sistemas de diálogo com base em padrões de conversa humana.
― 8 min ler
Ciência de ponta explicada de forma simples
DEnsity traz uma nova maneira de avaliar sistemas de diálogo com base em padrões de conversa humana.
― 8 min ler
Este artigo fala sobre os benefícios de usar feedback diversificado de usuários para ter recomendações melhores.
― 7 min ler
ArgU cria argumentos estruturados com base em informações reais pra discussões eficazes.
― 6 min ler
Este estudo avalia a capacidade do GPT-3 de resumir literatura médica de forma eficaz.
― 6 min ler
Um método matemático pra avaliar a beleza das performances musicais.
― 5 min ler
Esse estudo avalia o cuidado periodontal nos Centros de Especialidades Odontológicas do Brasil.
― 6 min ler
Este artigo analisa a eficácia das explicações geradas por IA para os usuários.
― 9 min ler
Uma competição pra melhorar a criação automática de sons Foley pra multimídia.
― 6 min ler
O C-Eval avalia as habilidades de raciocínio e conhecimento dos LLMs em chinês.
― 6 min ler
Um novo conjunto de dados melhora como as máquinas leem e respondem a documentos.
― 6 min ler
Uma análise dos pontos fortes e fracos do conjunto de dados RACE para compreensão de leitura.
― 9 min ler
Um olhar crítico sobre os benchmarks de modelos de linguagem e suas implicações para o desempenho humano.
― 6 min ler
Esse artigo apresenta um novo método pra lidar com pontuações faltando nas avaliações de sistemas de PNL.
― 7 min ler
Aprenda como os chatbots estão sendo treinados pra responder com empatia.
― 6 min ler
mLongT5 gerencia textos mais longos de forma eficiente em várias línguas.
― 5 min ler
Um novo método melhora como avaliamos imagens geradas por IA a partir de descrições em texto.
― 7 min ler
Um estudo sobre como criar instruções estruturadas através da decomposição hierárquica de tarefas.
― 7 min ler
O IKDSumm resume tweets durante desastres usando um conhecimento específico sobre desastres.
― 6 min ler
Uma nova taxonomia pra melhorar o desempenho de LLM em tarefas complexas.
― 7 min ler
Um novo método pra avaliar a qualidade dos argumentos levando em conta o contexto.
― 6 min ler
Estudo avalia métodos pra avaliar modelos de linguagem na compreensão da língua.
― 7 min ler
Seahorse oferece uma grande coleção de resumos multilíngues com avaliações de humanos.
― 7 min ler
Pesquisas sobre avanços em traduzir referências culturais usando sistemas de tradução automática.
― 10 min ler
Um novo método pra integrar vários tipos de dados médicos pra uma análise melhor.
― 10 min ler
Avaliar o desempenho dos modelos de linguagem em diferentes demografias humanas é essencial pra um uso eficaz.
― 7 min ler
Um estudo revela limitações em modelos de linguagem com recuperação aumentada para geração de texto.
― 5 min ler
Apresentando uma estrutura organizada pra raciocinar bem sobre textos longos.
― 5 min ler
O conjunto de dados MMSMR tem como objetivo melhorar a avaliação de conversas de chatbots com respostas humanas variadas.
― 5 min ler
Esse estudo compara as normas sociais entre as culturas chinesa e americana por meio da análise de dados.
― 7 min ler
Uma nova abordagem para resumir tabelas com base nas perguntas dos usuários para obter melhores insights.
― 6 min ler
Apresentando um sistema que explica de forma clara a avaliação de texto gerado por máquinas.
― 6 min ler
Um novo conjunto de dados melhora a capacidade dos modelos de linguagem de entender instruções em várias línguas.
― 6 min ler
Um novo método enfrenta os desafios que os modelos de linguagem têm em dar respostas precisas.
― 7 min ler
Um método pra avaliar classificadores que se abstêm, estimando suas previsões que estão faltando.
― 9 min ler
Perguntas de esclarecimento são essenciais pra uma comunicação efetiva em sistemas de conversa.
― 7 min ler
Um novo método melhora a resumos de vídeos para conteúdo em língua de sinais.
― 5 min ler
Aprimorando as capacidades do modelo pra conectar diferentes tipos de dados de forma eficaz.
― 6 min ler
Uma ferramenta pra avaliar as capacidades de raciocínio em várias etapas de modelos de linguagem grandes.
― 6 min ler
Combinando métodos baseados em referência e métodos sem referência pra uma avaliação de resumo melhor.
― 7 min ler
Estudo mostra que LLMs oferecem traduções mais naturais, especialmente pra expressões idiomáticas.
― 5 min ler