Artigos mais recentes para Avaliação

Computação e linguagem Apresentando o SciEval: um novo padrão para testes de LLM em ciência

O SciEval avalia modelos de linguagem nas suas habilidades de pesquisa científica com perguntas variadas.

2025-10-05T01:01:24+00:00 ― 7 min ler

Interação Homem-Computador Avaliando Sistemas de Orientação em Análise Visual

Uma abordagem prática pra avaliar sistemas de orientação pra uma análise de dados eficaz.

2025-10-04T23:02:54+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando a Classificação de Documentos para Aplicações do Mundo Real

Esse artigo fala sobre a necessidade de melhores técnicas de classificação de documentos.

2025-10-04T21:43:54+00:00 ― 8 min ler

Otimização e Controlo Avanço dos Sistemas de Freio a Ar com Tecnologia de IA

Combinar redes neurais com métodos tradicionais melhora a segurança e o desempenho do airbrake.

2025-10-04T20:23:40+00:00 ― 6 min ler

Computação e linguagem Avaliação de Tradução Automática: Métricas de Sentença vs. Métricas de Parágrafo

Esse artigo analisa quão bem os métodos de avaliação atuais pontuam traduções em nível de parágrafo.

2025-10-04T14:29:24+00:00 ― 7 min ler

Computação e linguagem Avaliação de Modelos de Linguagem na Saúde: Um Novo Conjunto de Dados

Um novo conjunto de dados ajuda a avaliar modelos de linguagem para aplicações de saúde.

2025-10-03T22:25:36+00:00 ― 8 min ler

Som Avanços na Melhoria de Voz Usando Redes Neurais com Pulsos

Um novo método pra melhorar a qualidade do áudio usando redes eficientes em energia.

2025-10-03T21:44:15+00:00 ― 6 min ler

Computação e linguagem Um Novo Conjunto de Dados para Geração de Conhecimento Conversacional

Apresentando um conjunto de dados focado em conversas de perguntas e respostas factuais.

2025-10-03T00:26:18+00:00 ― 6 min ler

Epidemiologia Avaliando Sistemas de Vigilância One Health na Europa

Um estudo avalia a eficácia da vigilância One Health em onze sistemas europeus.

2025-10-02T14:44:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avaliando Propostas de Objetos em Tarefas de Visão-Linguagem

Um novo método pra avaliar melhor propostas de objetos em tarefas de visão e linguagem.

2025-10-02T04:25:30+00:00 ― 7 min ler

Computação e linguagem Avanços em Sistemas de Avaliação de Diálogo Multilíngue

Pesquisadores usam tradução automática pra melhorar as avaliações de qualidade de diálogos em várias línguas.

2025-10-02T01:08:00+00:00 ― 7 min ler

Computação e linguagem Abordando as Alucinações em Modelos de Linguagem Grandes

Esse artigo analisa alucinações em modelos de linguagem de IA e pesquisas em andamento.

2025-10-01T04:19:48+00:00 ― 8 min ler

Bases de dados Desafios na Otimização de Consultas Aprendidas

Analisando problemas e soluções para otimizadores de consultas aprendidos na gestão de banco de dados.

2025-10-01T01:26:00+00:00 ― 5 min ler

Computação e linguagem Novo Conjunto de Dados HAE-RAE Avalia Modelos de Linguagem em Coreano

O HAE-RAE Bench foca em avaliar o conhecimento cultural em modelos de linguagem coreanos.

2025-09-30T02:31:24+00:00 ― 7 min ler

Computação e linguagem Avaliando o Raciocínio em Modelos de Linguagem e Visão

Este trabalho avalia quão bem os VLMs raciocinam com base no conteúdo visual.

2025-09-29T06:14:48+00:00 ― 7 min ler

Computação e linguagem Criando Perguntas de Acompanhamento Eficazes

Um estudo sobre como gerar perguntas de acompanhamento significativas pra aprofundar a compreensão.

2025-09-28T14:03:06+00:00 ― 7 min ler

Computação e linguagem Avançando a Síntese de Fala Expressiva com Novo Conjunto de Dados

Um novo conjunto de dados melhora a síntese de fala ao capturar a expressão emocional sem depender de texto.

2025-09-27T18:22:05+00:00 ― 6 min ler

Interação Homem-Computador Um Novo Modelo para Entender Emoções

Um modelo que integra avaliação e aprendizado por reforço melhora a avaliação emocional.

2025-09-27T18:10:12+00:00 ― 6 min ler

Computação e linguagem Classificando Revisões em Ensaios Argumentativos

Este estudo analisa como classificar revisões para melhorar a escrita argumentativa.

2025-09-27T09:44:36+00:00 ― 6 min ler

Computação e linguagem Avaliando Modelos de Linguagem em Diversas Línguas

Explorando como LLMs podem avaliar saídas de modelos em várias línguas.

2025-09-27T00:00:00+00:00 ― 8 min ler

Computação e linguagem Melhorando a Qualidade da Tradução com Avaliação Contextual

O SLIDE melhora as avaliações de tradução automática ao incorporar um contexto mais amplo durante a avaliação.

2025-09-26T15:10:42+00:00 ― 6 min ler

Robótica Novo Método para Navegação de Robôs Móveis

Esse método melhora o planejamento de rotas de robôs móveis em ambientes que mudam.

2025-09-26T02:56:00+00:00 ― 7 min ler

Computação e linguagem Avaliação de Respostas a Perguntas Longas em Modelos de Linguagem

Este estudo compara o desempenho entre vários modelos de linguagem em responder perguntas complexas.

2025-09-26T02:24:24+00:00 ― 5 min ler

Processamento de Áudio e Fala Avaliando um Sistema Automático de Máscara de Som em Parques Urbanos

Um estudo analisa a eficácia de mascaradores de som automáticos em espaços públicos.

2025-09-25T18:35:40+00:00 ― 5 min ler

Engenharia de software Fuzzing Direcionado: Testes de Software Focados na Descoberta de Bugs

Uma abordagem focada pra identificar rápido bugs de software com testes direcionados.

2025-09-25T00:36:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando o Diagnóstico de Câncer com Sinais de Causalidade em Imagens Médicas

Um novo método melhora o diagnóstico de câncer ao integrar sinais de causalidade fraca na imagem médica.

2025-09-24T21:02:42+00:00 ― 8 min ler

Computação e linguagem Avanços na Transferência de Estilo de Texto Complexo

Novos métodos melhoram a transferência de estilo para texto sem perder o significado.

2025-09-24T17:53:06+00:00 ― 7 min ler

Computação e linguagem Combatendo a Discurso de Ódio no Dialeto Algérien

Um estudo sobre como detectar discurso de ódio na linguagem das redes sociais na Argélia.

2025-09-24T05:22:36+00:00 ― 8 min ler

Computação e linguagem Avaliação de Chatbots de Saúde: Métricas para o Sucesso

Este artigo fala sobre as métricas de avaliação para chatbots de saúde eficazes.

2025-09-23T19:53:48+00:00 ― 7 min ler

Inteligência Artificial Evoluindo Modelos de Deep Learning com Evolução Regularizada

Este estudo analisa como os modelos de deep learning mudam durante a Busca por Arquitetura Neural.

2025-09-23T17:07:54+00:00 ― 8 min ler

Lógica na Informática Aprimorando a Avaliação de Expressões no Cálculo Lambda

Descubra uma nova forma de melhorar a eficiência da avaliação em cálculo lambda.

2025-09-23T16:28:24+00:00 ― 8 min ler

Aprendizagem de máquinas SALSA-CLRS: Um Novo Padrão para Algoritmos

Apresentando o SALSA-CLRS pra melhorar a avaliação de algoritmos usando grafos esparsos.

2025-09-23T14:06:12+00:00 ― 7 min ler

Computação e linguagem Uma Nova Forma de Avaliar Sistemas de Pergunta e Resposta

A métrica SQuArE melhora a avaliação de sistemas de QA através de múltiplas referências de resposta.

2025-09-23T13:58:18+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando a Saúde Online com Classificação Automática

Um novo sistema pretende conectar usuários a profissionais de saúde por meio de classificação automatizada.

2025-09-21T11:16:48+00:00 ― 5 min ler

Computação e linguagem O Futuro da Telemedicina: Resumindo as Interações com Pacientes

Avanços em resumir conversas entre médicos e pacientes melhoram a comunicação na telemedicina.

2025-09-21T04:18:06+00:00 ― 9 min ler

Linguagens de programação Provando a Confiabilidade no Cálculo Lambda Tipado Simples

Explorando técnicas de prova pra avaliar funções em linguagens de programação.

2025-09-21T03:46:30+00:00 ― 7 min ler

Estruturas de dados e algoritmos A Importância da Estabilidade das Preferências Individuais na Agrupamento

A estabilidade na agrupamento garante que os grupos sejam eficazes e significativos.

2025-09-20T18:01:54+00:00 ― 7 min ler

Aprendizagem de máquinas Apresentando o GRANDE: Um Novo Método para Dados Tabulares

GRANDE usa gradiente descendente pra melhorar o aprendizado a partir de dados tabulares.

2025-09-20T08:17:18+00:00 ― 5 min ler

Computação e linguagem Avaliação de Modelos de IA com Meta Características

Um novo método pra avaliar modelos de IA através de embeddings e meta características.

2025-09-19T10:10:06+00:00 ― 7 min ler

Computação e linguagem Insights Automatizados na Análise de Textos Jurídicos

Um novo método revela padrões em decisões legais usando análise de texto automatizada.

2025-09-19T06:21:00+00:00 ― 9 min ler