Dados sintéticos oferecem soluções econômicas enquanto garantem privacidade e reduzem viés.
― 7 min ler
Ciência de ponta explicada de forma simples
Dados sintéticos oferecem soluções econômicas enquanto garantem privacidade e reduzem viés.
― 7 min ler
Um novo parâmetro avalia como os modelos de linguagem entendem os significados das palavras e suas relações.
― 6 min ler
Novas métricas melhoram a avaliação de sistemas de extração de informações em documentos manuscritos.
― 8 min ler
Uma estrutura para avaliar estratégias de IA em ambientes competitivos e cooperativos.
― 8 min ler
Avaliando a confiabilidade dos resumos produzidos por IA pra melhorar a manutenção de software.
― 8 min ler
Analisando como o ChatGPT impacta a saúde e suas possíveis utilizações.
― 6 min ler
Modelos DynaMo geram texto mais rápido e com melhor qualidade usando previsão de múltiplos tokens.
― 6 min ler
Um novo conjunto de dados melhora a geração de seções de trabalhos relacionados em artigos científicos.
― 9 min ler
O TREC iKAT tem como objetivo melhorar as interações com agentes de conversa por meio de diálogos personalizados.
― 8 min ler
A SCRABLE oferece soluções automatizadas para uma gestão eficaz de avaliações de apps.
― 6 min ler
Avaliando as capacidades e desafios dos modelos avançados de entendimento de vídeo.
― 7 min ler
Esse estudo analisa a eficácia dos LLMs em avaliar explicações geradas por IA.
― 9 min ler
Um novo framework avalia como modelos de linguagem ajudam especialistas com tarefas de escrita.
― 6 min ler
PEAVS analisa como o áudio e o vídeo funcionam juntos pra melhorar a experiência do espectador.
― 8 min ler
Uma maneira rápida de avaliar o desempenho de DNN depois de um novo treinamento.
― 7 min ler
Autoencoders esparsos melhoram a interpretabilidade dos sistemas de IA e dos processos de tomada de decisão deles.
― 12 min ler
Um olhar sobre como os modelos de IA entendem o conhecimento essencial do mundo.
― 7 min ler
Novo benchmark avalia a toxicidade em modelos de linguagem grandes em vários idiomas.
― 9 min ler
Esse artigo fala sobre a necessidade de práticas de avaliação melhores na pesquisa de fuzzing.
― 7 min ler
Este estudo avalia métodos de saliência em PLN através de avaliação humana.
― 10 min ler
Apresentando o PQAH pra entender melhor os heatmaps de IA e como avaliá-los.
― 9 min ler
Um novo método melhora a otimização em problemas caros e de alta dimensão.
― 7 min ler
Um novo método pra avaliar como os modelos de linguagem tão alinhados com os valores humanos.
― 8 min ler
Um novo método melhora a criação de imagens a partir de vários prompts de texto.
― 7 min ler
Uma visão geral dos comportamentos em comunidades de crowdsourcing e seus impactos.
― 8 min ler
Essa pesquisa destaca a necessidade de uma avaliação melhor do uso do histórico de conversa pelos sistemas de diálogo.
― 6 min ler
AdvEval expõe fraquezas nas métricas de avaliação de Geração de Linguagem Natural.
― 8 min ler
Nova ferramenta converte rascunhos em gráficos claros para pesquisadores.
― 7 min ler
Um novo método melhora a confiabilidade das saídas de IA em ambientes de blockchain.
― 11 min ler
Os participantes enfrentam a restauração de imagens degradadas em um ambiente competitivo.
― 6 min ler
Um novo sistema rastreia e reconhece cenas 3D dinâmicas usando um único vídeo.
― 7 min ler
Avaliação de algoritmos para segmentação eficaz de frases musicais e análise de estrutura.
― 5 min ler
Um novo método melhora a maneira como as mensagens de inteligência são avaliadas, priorizando a credibilidade.
― 6 min ler
Novos recursos melhoram a avaliação dos modelos de linguagem coreana.
― 5 min ler
Este artigo fala sobre um jeito novo de criar algoritmos com LLMs.
― 6 min ler
Aprenda como a lógica de sete valores melhora a tomada de decisão com múltiplos critérios.
― 7 min ler
Um desafio focado em modelos generativos profundos pra geração de imagens médicas realistas.
― 10 min ler
Um modelo avalia a legibilidade dos artigos da Wikipedia em 14 idiomas.
― 8 min ler
Uma nova abordagem usando LLMs pra criar distrações com o mínimo de input humano.
― 4 min ler
Uma nova abordagem pra avaliar preconceitos em métricas de avaliação automatizadas de IA.
― 7 min ler