Avaliando métodos de atribuição de características através de solidez e completude para melhores previsões de IA.
― 7 min ler
Ciência de ponta explicada de forma simples
Avaliando métodos de atribuição de características através de solidez e completude para melhores previsões de IA.
― 7 min ler
Este estudo avalia como o ChatGPT se sai em combinar ontologias.
― 6 min ler
Uma visão geral de como avaliar sistemas GEC de forma eficaz.
― 8 min ler
Este artigo analisa métodos para avaliar a relação entre conceitos usando o DBpedia.
― 8 min ler
Um olhar sobre como o ajuste de instruções melhora as respostas dos modelos de linguagem.
― 10 min ler
KGrEaT avalia a qualidade e a utilidade de gráficos de conhecimento para várias tarefas.
― 6 min ler
Um novo método melhora os modelos de linguagem especificamente para o português.
― 5 min ler
Um padrão pra melhorar a ligação de entidades biomédicas e comparações de pesquisa.
― 6 min ler
Investigando Sistemas de Saúde Aprendentes pra melhorar a entrega dos cuidados de saúde.
― 7 min ler
O SciEval avalia modelos de linguagem nas suas habilidades de pesquisa científica com perguntas variadas.
― 7 min ler
Uma abordagem prática pra avaliar sistemas de orientação pra uma análise de dados eficaz.
― 9 min ler
Esse artigo fala sobre a necessidade de melhores técnicas de classificação de documentos.
― 8 min ler
Combinar redes neurais com métodos tradicionais melhora a segurança e o desempenho do airbrake.
― 6 min ler
Esse artigo analisa quão bem os métodos de avaliação atuais pontuam traduções em nível de parágrafo.
― 7 min ler
Um novo conjunto de dados ajuda a avaliar modelos de linguagem para aplicações de saúde.
― 8 min ler
Um novo método pra melhorar a qualidade do áudio usando redes eficientes em energia.
― 6 min ler
Apresentando um conjunto de dados focado em conversas de perguntas e respostas factuais.
― 6 min ler
Um estudo avalia a eficácia da vigilância One Health em onze sistemas europeus.
― 6 min ler
Um novo método pra avaliar melhor propostas de objetos em tarefas de visão e linguagem.
― 7 min ler
Pesquisadores usam tradução automática pra melhorar as avaliações de qualidade de diálogos em várias línguas.
― 7 min ler
Esse artigo analisa alucinações em modelos de linguagem de IA e pesquisas em andamento.
― 8 min ler
Analisando problemas e soluções para otimizadores de consultas aprendidos na gestão de banco de dados.
― 5 min ler
O HAE-RAE Bench foca em avaliar o conhecimento cultural em modelos de linguagem coreanos.
― 7 min ler
Este trabalho avalia quão bem os VLMs raciocinam com base no conteúdo visual.
― 7 min ler
Um estudo sobre como gerar perguntas de acompanhamento significativas pra aprofundar a compreensão.
― 7 min ler
Um novo conjunto de dados melhora a síntese de fala ao capturar a expressão emocional sem depender de texto.
― 6 min ler
Um modelo que integra avaliação e aprendizado por reforço melhora a avaliação emocional.
― 6 min ler
Este estudo analisa como classificar revisões para melhorar a escrita argumentativa.
― 6 min ler
Explorando como LLMs podem avaliar saídas de modelos em várias línguas.
― 8 min ler
O SLIDE melhora as avaliações de tradução automática ao incorporar um contexto mais amplo durante a avaliação.
― 6 min ler
Esse método melhora o planejamento de rotas de robôs móveis em ambientes que mudam.
― 7 min ler
Este estudo compara o desempenho entre vários modelos de linguagem em responder perguntas complexas.
― 5 min ler
Um estudo analisa a eficácia de mascaradores de som automáticos em espaços públicos.
― 5 min ler
Uma abordagem focada pra identificar rápido bugs de software com testes direcionados.
― 6 min ler
Um novo método melhora o diagnóstico de câncer ao integrar sinais de causalidade fraca na imagem médica.
― 8 min ler
Novos métodos melhoram a transferência de estilo para texto sem perder o significado.
― 7 min ler
Um estudo sobre como detectar discurso de ódio na linguagem das redes sociais na Argélia.
― 8 min ler
Este artigo fala sobre as métricas de avaliação para chatbots de saúde eficazes.
― 7 min ler
Este estudo analisa como os modelos de deep learning mudam durante a Busca por Arquitetura Neural.
― 8 min ler
Descubra uma nova forma de melhorar a eficiência da avaliação em cálculo lambda.
― 8 min ler