Artigos mais recentes para Avaliação

Engenharia de software Melhorando a Revisão de Código com o ReviewRanker

Um novo sistema pra melhorar o processo de revisão de código e garantir qualidade.

2025-10-22T07:46:24+00:00 ― 7 min ler

Aprendizagem de máquinas Uma Abordagem Sustentável para Busca de Arquitetura Neural

Novo framework equilibra eficiência de deep learning e emissões de carbono.

2025-10-22T01:58:48+00:00 ― 7 min ler

Medicina legale Desafios Enfrentados por Crianças Sozinho Buscando Asilo

Mais de 300.000 crianças estão pedindo asilo nos EUA, enfrentando várias dificuldades.

2025-10-21T16:46:00+00:00 ― 7 min ler

Processamento de Áudio e Fala FALL-E: Uma Nova Era na Criação de Som

FALL-E cria efeitos sonoros de alta qualidade a partir de descrições em texto.

2025-10-21T13:13:20+00:00 ― 5 min ler

Inteligência Artificial Desafios na IA Explicável: Um Mergulho Profundo

Examinando os problemas e o potencial dos métodos de IA explicável.

2025-10-20T10:13:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Usando a Linguagem pra Criar Cenários de Tráfego Dinâmicos

Um método que gera cenas de trânsito usando linguagem natural para testes de direção autônoma.

2025-10-19T09:27:48+00:00 ― 8 min ler

Computação e linguagem A Ascensão dos Pequenos Modelos de Linguagem

Descubra o potencial dos pequenos modelos de linguagem na tecnologia de IA.

2025-10-19T09:12:00+00:00 ― 6 min ler

Computação e linguagem Melhorando a Avaliação de Taxonomia com Modelos de Linguagem

Um novo método pra avaliar taxonomias usando modelos de linguagem tá mostrando potencial.

2025-10-18T17:08:12+00:00 ― 8 min ler

Computação e linguagem Avaliando Efeitos em Cadeia na Edição de Conhecimento

Novas pesquisas destacam a importância dos efeitos em cascata na atualização de modelos de linguagem.

2025-10-16T11:40:48+00:00 ― 9 min ler

Sistemas Multiagentes Aprimorando o Orçamento Participativo Através do Consenso

Um novo método melhora a justiça no orçamento participativo promovendo diálogo entre os eleitores.

2025-10-16T11:01:18+00:00 ― 7 min ler

Comunicação científica e educação Analisando a Clareza da Linguagem na Revisão por Pares do eLife

Estudo avalia a clareza das frases de revisão por pares da eLife e sugere melhorias.

2025-10-16T05:29:36+00:00 ― 7 min ler

Recuperação de informação Avaliação de Sistemas de Recomendação: DCG vs nDCG

Uma olhada na eficácia das métricas de recomendação nas experiências dos usuários.

2025-10-15T06:11:12+00:00 ― 11 min ler

Aprendizagem de máquinas Avaliando a Incerteza em Modelos de Aprendizado de Máquina

Avaliando a capacidade dos modelos de estimar incertezas pra melhorar as previsões.

2025-10-15T03:22:00+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando a Geração de Imagens a partir de Descrições em Texto

Um novo método melhora como as imagens combinam com entradas de texto.

2025-10-14T14:00:56+00:00 ― 7 min ler

Computação e linguagem Novo Ponto de Avaliação para Modelos Multimodais

Um novo benchmark tem como objetivo melhorar a avaliação de Modelos de Linguagem Grande Multimodais.

2025-10-14T06:05:30+00:00 ― 7 min ler

Computação e linguagem Avaliação de Estratégias de Aprendizado Ativo em PLN

Uma estrutura pra comparar métodos de aprendizado ativo pra melhorar a eficiência na rotulação de dados.

2025-10-13T16:31:48+00:00 ― 7 min ler

Computação e linguagem Nova Método para Avaliar Respostas de Modelos de Linguagem

Uma abordagem nova usa redes maiores pra melhorar a qualidade da avaliação dos modelos de linguagem.

2025-10-12T17:13:30+00:00 ― 7 min ler

Computação e linguagem Abordando o Viés em Dados Textuais: A Framework Nbias

Uma estrutura pra identificar e reduzir viés em dados textuais pra resultados mais justos.

2025-10-12T14:51:18+00:00 ― 11 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Dados de Radar para Condução Automática

Um novo método usa GANs pra criar dados de radar realistas para dirigir de forma automática mais segura.

2025-10-12T08:40:00+00:00 ― 5 min ler

Criptografia e segurança Avaliação de Detectores de Mau Uso da Crypto-API com o MASC

O MASC oferece uma nova forma de testar detectores de uso indevido de API de criptografia de maneira eficaz.

2025-10-12T06:49:24+00:00 ― 6 min ler

Otimização e Controlo Otimização Estocástica: Encarando a Incerteza na Tomada de Decisão

Aprenda como a otimização estocástica lida com a incerteza em várias áreas.

2025-10-12T04:55:12+00:00 ― 6 min ler

Computação e linguagem Melhorando Avaliações de Resumo com Consciência de Redundância

Uma nova métrica melhora a qualidade do resumo ao lidar com redundância e referências múltiplas.

2025-10-12T04:11:24+00:00 ― 7 min ler

Engenharia de software Avaliação de Modelos de Linguagem Grandes para Código

Novos métodos melhoram a compreensão dos modelos de linguagem usados em tarefas de programação.

2025-10-11T13:18:42+00:00 ― 8 min ler

Computação e linguagem Apresentando o SciGraphQA: Um Novo Conjunto de Dados para Gráficos Científicos

O SciGraphQA oferece um conjunto de dados incrível pra entender gráficos científicos por meio de perguntas e respostas.

2025-10-11T06:20:00+00:00 ― 6 min ler

Computação e linguagem CheXOFA: Um Passo Rumo à Automação de Relatórios de Raio-X

CheXOFA resume relatórios de raio-X do peito, melhorando a eficiência na saúde.

2025-10-11T05:26:50+00:00 ― 6 min ler

Computação e linguagem Apresentando o CLEVA: Uma Plataforma de Avaliação para Modelos de Linguagem Chinês

A CLEVA oferece avaliações padronizadas pra avaliar modelos de língua chinesa de forma eficaz.

2025-10-10T07:57:00+00:00 ― 7 min ler

Recuperação de informação Tendências em Recomendações Personalizadas de POI para Turistas

Analisando os avanços recentes em sistemas de recomendação de POI de 2017 a 2022.

2025-10-09T04:25:54+00:00 ― 12 min ler

Aprendizagem de máquinas Apresentando o UPREVE: Uma Ferramenta para Descoberta Causal

O UPREVE simplifica a descoberta causal em sistemas sociais e comportamentais para pesquisadores.

2025-10-08T18:39:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Nova Método de Avaliação para Síntese de Texto para Imagem

Uma nova maneira de avaliar a qualidade da geração de imagens com base em descrições de texto.

2025-10-08T01:26:24+00:00 ― 8 min ler

Física de Altas Energias - Experiência Gerando Imagens a partir de Dados de Física de Partículas Usando Modelos de IA

Esse artigo destaca o uso de modelos generativos pra criar imagens de física de partículas.

2025-10-07T19:22:00+00:00 ― 7 min ler

Computação e linguagem Apresentando o Benchmark Médico Completo para LLMs na China

Um novo padrão para avaliar modelos de linguagem em contextos médicos chineses.

2025-10-07T18:51:24+00:00 ― 12 min ler

Aprendizagem de máquinas Melhorando Métodos de Atribuição de Recursos em IA

Avaliando métodos de atribuição de características através de solidez e completude para melhores previsões de IA.

2025-10-07T18:35:36+00:00 ― 7 min ler

Computação e linguagem Avaliando o ChatGPT para Alinhamento de Ontologia

Este estudo avalia como o ChatGPT se sai em combinar ontologias.

2025-10-07T15:57:36+00:00 ― 6 min ler

Computação e linguagem Avaliação de Sistemas de Correção de Erros Gramaticais

Uma visão geral de como avaliar sistemas GEC de forma eficaz.

2025-10-07T12:40:06+00:00 ― 8 min ler

Inteligência Artificial Medindo a Relação Semântica no DBpedia

Este artigo analisa métodos para avaliar a relação entre conceitos usando o DBpedia.

2025-10-07T02:16:00+00:00 ― 8 min ler

Computação e linguagem Melhorando Modelos de Linguagem Através do Ajuste de Instruções

Um olhar sobre como o ajuste de instruções melhora as respostas dos modelos de linguagem.

2025-10-06T12:02:48+00:00 ― 10 min ler

Inteligência Artificial Avaliando Grafos de Conhecimento com KGrEaT

KGrEaT avalia a qualidade e a utilidade de gráficos de conhecimento para várias tarefas.

2025-10-06T01:22:54+00:00 ― 6 min ler

Computação e linguagem Melhorando Modelos de Linguagem para Português

Um novo método melhora os modelos de linguagem especificamente para o português.

2025-10-05T21:10:06+00:00 ― 5 min ler

Computação e linguagem Apresentando o Benchmark de Ligação de Entidades Biomédicas (BELB)

Um padrão pra melhorar a ligação de entidades biomédicas e comparações de pesquisa.

2025-10-05T17:28:54+00:00 ― 6 min ler

Sistemi sanitari e miglioramento della qualità Conectando Pesquisa e Cuidados ao Paciente em Sistemas de Saúde

Investigando Sistemas de Saúde Aprendentes pra melhorar a entrega dos cuidados de saúde.

2025-10-05T07:57:00+00:00 ― 7 min ler