Artigos mais recentes para Avaliação

Computação e linguagem Nova Métrica de Densidade Melhora a Avaliação de Sistemas de Diálogo

DEnsity traz uma nova maneira de avaliar sistemas de diálogo com base em padrões de conversa humana.

2025-11-19T08:03:48+00:00 ― 8 min ler

Recuperação de informação Melhorando Recomendações Com a Integração do Feedback do Usuário

Este artigo fala sobre os benefícios de usar feedback diversificado de usuários para ter recomendações melhores.

2025-11-18T22:03:24+00:00 ― 7 min ler

Computação e linguagem ArgU: Uma Nova Ferramenta para Gerar Argumentos

ArgU cria argumentos estruturados com base em informações reais pra discussões eficazes.

2025-11-18T18:06:24+00:00 ― 6 min ler

Computação e linguagem Avaliando o GPT-3 na Resumão Médico

Este estudo avalia a capacidade do GPT-3 de resumir literatura médica de forma eficaz.

2025-11-18T08:06:00+00:00 ― 6 min ler

Som Medindo a Beleza na Música: Uma Nova Abordagem

Um método matemático pra avaliar a beleza das performances musicais.

2025-11-18T07:37:25+00:00 ― 5 min ler

Odontoiatria e medicina orale Melhorando os Cuidados Odontológicos no Brasil: Um Estudo

Esse estudo avalia o cuidado periodontal nos Centros de Especialidades Odontológicas do Brasil.

2025-11-18T03:45:30+00:00 ― 6 min ler

Computação e linguagem Avaliação de Racionais Gerados por Máquinas para Usuários Humanos

Este artigo analisa a eficácia das explicações geradas por IA para os usuários.

2025-11-17T22:53:00+00:00 ― 9 min ler

Som DCASE 2023: Avançando a Síntese Automática de Sons Foley

Uma competição pra melhorar a criação automática de sons Foley pra multimídia.

2025-11-17T14:37:10+00:00 ― 6 min ler

Computação e linguagem Apresentando o C-Eval: Uma Nova Ferramenta de Avaliação para Modelos de Linguagem Chinesa

O C-Eval avalia as habilidades de raciocínio e conhecimento dos LLMs em chinês.

2025-11-17T02:52:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Compreensão de Documentos: Um Novo Conjunto de Dados

Um novo conjunto de dados melhora como as máquinas leem e respondem a documentos.

2025-11-16T12:39:00+00:00 ― 6 min ler

Computação e linguagem Avaliando o Conjunto de Dados de Compreensão de Leitura RACE

Uma análise dos pontos fortes e fracos do conjunto de dados RACE para compreensão de leitura.

2025-11-16T12:15:18+00:00 ― 9 min ler

Computação e linguagem Avaliando Alegações de Desempenho Sobrenatural em PNL

Um olhar crítico sobre os benchmarks de modelos de linguagem e suas implicações para o desempenho humano.

2025-11-16T11:51:36+00:00 ― 6 min ler

Computação e linguagem Abordando Pontuações Faltantes em Avaliações de PLN

Esse artigo apresenta um novo método pra lidar com pontuações faltando nas avaliações de sistemas de PNL.

2025-11-15T11:45:54+00:00 ― 7 min ler

Computação e linguagem Avançando a Empatia em Chatbots

Aprenda como os chatbots estão sendo treinados pra responder com empatia.

2025-11-15T09:00:00+00:00 ― 6 min ler

Computação e linguagem mLongT5: Avançando o Processamento de Texto Multilíngue

mLongT5 gerencia textos mais longos de forma eficiente em várias línguas.

2025-11-15T00:10:42+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Avaliação da Síntese de Texto para Imagem

Um novo método melhora como avaliamos imagens geradas por IA a partir de descrições em texto.

2025-11-15T00:02:48+00:00 ― 7 min ler

Computação e linguagem Avanços na Geração de Script Hierárquico

Um estudo sobre como criar instruções estruturadas através da decomposição hierárquica de tarefas.

2025-11-14T19:26:18+00:00 ― 7 min ler

Computação e linguagem IKDSumm: Uma Nova Abordagem para Resumir Tweets sobre Desastres

O IKDSumm resume tweets durante desastres usando um conhecimento específico sobre desastres.

2025-11-14T07:51:06+00:00 ― 6 min ler

Inteligência Artificial Aprimorando LLMs: A Taxonomia TELeR

Uma nova taxonomia pra melhorar o desempenho de LLM em tarefas complexas.

2025-11-14T04:49:24+00:00 ― 7 min ler

Computação e linguagem Avaliando Argumentos em um Mundo Desinformado

Um novo método pra avaliar a qualidade dos argumentos levando em conta o contexto.

2025-11-14T03:46:12+00:00 ― 6 min ler

Computação e linguagem Avaliação de Modelos de Linguagem: Um Olhar Mais Atento

Estudo avalia métodos pra avaliar modelos de linguagem na compreensão da língua.

2025-11-13T03:08:54+00:00 ― 7 min ler

Computação e linguagem Apresentando o Seahorse: Um Conjunto de Dados de Resumo Multilíngue

Seahorse oferece uma grande coleção de resumos multilíngues com avaliações de humanos.

2025-11-13T01:42:00+00:00 ― 7 min ler

Computação e linguagem Conteúdo Cultural na Tradução Automática: Novas Ideias

Pesquisas sobre avanços em traduzir referências culturais usando sistemas de tradução automática.

2025-11-12T14:14:42+00:00 ― 10 min ler

Inteligência Artificial Conectando Diferentes Tipos de Dados com o LoReTTa

Um novo método pra integrar vários tipos de dados médicos pra uma análise melhor.

2025-11-12T13:51:00+00:00 ― 10 min ler

Computação e linguagem Avaliação de Modelos de Linguagem: Fechando a Lacuna Demográfica

Avaliar o desempenho dos modelos de linguagem em diferentes demografias humanas é essencial pra um uso eficaz.

2025-11-12T13:35:12+00:00 ― 7 min ler

Computação e linguagem Desafios dos Modelos de Linguagem com Aumento de Recuperação

Um estudo revela limitações em modelos de linguagem com recuperação aumentada para geração de texto.

2025-11-12T08:11:18+00:00 ― 5 min ler

Computação e linguagem Uma Nova Maneira de Abordar o Raciocínio em Documentos Longos

Apresentando uma estrutura organizada pra raciocinar bem sobre textos longos.

2025-11-12T05:41:12+00:00 ― 5 min ler

Computação e linguagem Apresentando o MMSMR: Um Novo Conjunto de Dados pra Avaliar Chatbots

O conjunto de dados MMSMR tem como objetivo melhorar a avaliação de conversas de chatbots com respostas humanas variadas.

2025-11-12T04:38:00+00:00 ― 5 min ler

Computação e linguagem Normas Culturais: Uma Comparação entre a China e os EUA

Esse estudo compara as normas sociais entre as culturas chinesa e americana por meio da análise de dados.

2025-11-12T03:50:36+00:00 ― 7 min ler

Computação e linguagem Melhorando a Resumo de Tabelas para Perguntas dos Usuários

Uma nova abordagem para resumir tabelas com base nas perguntas dos usuários para obter melhores insights.

2025-11-12T00:48:54+00:00 ― 6 min ler

Computação e linguagem Uma Nova Maneira de Avaliar Texto Gerado

Apresentando um sistema que explica de forma clara a avaliação de texto gerado por máquinas.

2025-11-12T00:17:18+00:00 ― 6 min ler

Computação e linguagem Avanços em Modelos de Linguagem Multilíngues

Um novo conjunto de dados melhora a capacidade dos modelos de linguagem de entender instruções em várias línguas.

2025-11-10T17:20:48+00:00 ― 6 min ler

Computação e linguagem Melhorando a Precisão em Modelos de Linguagem

Um novo método enfrenta os desafios que os modelos de linguagem têm em dar respostas precisas.

2025-11-10T09:58:24+00:00 ― 7 min ler

Aprendizagem automática Avaliando Classificadores que se Abstêm com Pontuações Contrafactuais

Um método pra avaliar classificadores que se abstêm, estimando suas previsões que estão faltando.

2025-11-10T06:52:08+00:00 ― 9 min ler

Recuperação de informação O Papel das Perguntas de Esclarecimento em Sistemas Conversacionais

Perguntas de esclarecimento são essenciais pra uma comunicação efetiva em sistemas de conversa.

2025-11-09T18:34:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Resumindo Vídeos de Linguagem de Sinais pra Melhorar a Comunicação

Um novo método melhora a resumos de vídeos para conteúdo em língua de sinais.

2025-11-09T12:22:48+00:00 ― 5 min ler

Computação e linguagem Avançando Técnicas de Reconhecimento de Entidades de Múltiplos Modos

Aprimorando as capacidades do modelo pra conectar diferentes tipos de dados de forma eficaz.

2025-11-09T09:44:48+00:00 ― 6 min ler

Computação e linguagem Hub de Cadeia de Pensamento: Avaliando o Raciocínio em Modelos de Linguagem

Uma ferramenta pra avaliar as capacidades de raciocínio em várias etapas de modelos de linguagem grandes.

2025-11-09T08:41:36+00:00 ― 6 min ler

Computação e linguagem Uma Nova Abordagem para Avaliação de Resumos

Combinando métodos baseados em referência e métodos sem referência pra uma avaliação de resumo melhor.

2025-11-09T01:11:18+00:00 ― 7 min ler

Computação e linguagem LLMs Superam Sistemas Tradicionais na Tradução

Estudo mostra que LLMs oferecem traduções mais naturais, especialmente pra expressões idiomáticas.

2025-11-08T23:12:48+00:00 ― 5 min ler