Artigos mais recentes para Avaliação

Visão computacional e reconhecimento de padrões Avanços no Processamento de Imagens de Smartphones

Um modelo pra ter qualidade de foto consistente em diferentes smartphones.

2025-09-18T16:39:24+00:00 ― 9 min ler

Recuperação de informação Melhorando Recomendações de Moda com Alternativas

Apresentar alternativas pode aumentar a satisfação do usuário em sistemas de recomendação de moda.

2025-09-17T15:30:30+00:00 ― 7 min ler

Computação e linguagem Avaliação de LLMs em Competições de Matemática do Ensino Médio

Um novo conjunto de dados avalia as habilidades de modelos de linguagem na resolução de problemas de matemática avançada.

2025-09-17T08:47:36+00:00 ― 6 min ler

Engenharia de software Abordando a Duplicação de Código entre Conjuntos de Dados na Avaliação de Modelos

Analisando os efeitos da duplicação de código entre conjuntos de dados nas métricas de desempenho do modelo.

2025-09-17T01:33:06+00:00 ― 9 min ler

Aprendizagem de máquinas Melhorando RAG para Geração de Texto em Português Brasileiro

Esse estudo foca em melhorar os métodos de geração aumentada por recuperação para o português brasileiro.

2025-09-17T00:53:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões WAVES: Um Novo Referencial para Marcação de Imagens

Esse estudo apresenta o WAVES, um benchmark pra avaliar técnicas de marca d'água contra vários ataques.

2025-09-16T13:42:06+00:00 ― 5 min ler

Computação e linguagem Orion-14B: Uma Nova Era nos Modelos de Linguagem

O Orion-14B manda muito bem em entender e gerar texto multilíngue com 14 bilhões de parâmetros.

2025-09-15T17:49:12+00:00 ― 7 min ler

Recuperação de informação Avaliação de Persona em Sistemas de Diálogo

Novos métodos avaliam como os sistemas de diálogo mantêm a consistência da personalidade.

2025-09-15T11:14:12+00:00 ― 8 min ler

Computação e linguagem Uma Nova Abordagem para a Composição de Conhecimento em PLN

Esse framework melhora a forma como o conhecimento é combinado em modelos de machine learning pra ter um desempenho melhor.

2025-09-14T22:59:30+00:00 ― 8 min ler

Inteligência Artificial Usando Modelos de Linguagem pra Resumir Relatórios de PET

Estudo revela que modelos de linguagem podem gerar impressões úteis de laudos PET.

2025-09-14T07:36:21+00:00 ― 7 min ler

Computação e linguagem Avaliando Modelos de Linguagem Grandes no Diagnóstico Médico

Avaliando a precisão dos LLMs em diagnosticar condições médicas a partir de imagens e sintomas.

2025-09-13T23:41:12+00:00 ― 5 min ler

Computação e linguagem Melhorando a Avaliação de IA em Laudos de Radiologia

Essa pesquisa melhora a avaliação de relatórios de radiologia gerados por IA com a colaboração de especialistas.

2025-09-13T18:56:48+00:00 ― 10 min ler

Computadores e sociedade Avaliação da Segurança da IA Generativa: O Papel do Red-Teaming

Analisando como o red-teaming pode melhorar a segurança da IA e lidar com riscos potenciais.

2025-09-13T12:13:54+00:00 ― 9 min ler

Computadores e sociedade Abordando a Amplificação de Danos em Modelos de IA

Analisando a amplificação de danos em modelos de texto para imagem e seu impacto na sociedade.

2025-09-12T18:11:36+00:00 ― 7 min ler

Computação e linguagem Alinhando Modelos de Linguagem com Preferências Humanas

Esse artigo fala sobre ajustar modelos de linguagem pra alinhar com os valores e expectativas humanas.

2025-09-12T13:03:30+00:00 ― 7 min ler

Computação e linguagem Apresentando um Modelo de Linguagem Aberto e Transparente

Um novo modelo de linguagem aberto pra pesquisa e inovação em processamento de linguagem natural.

2025-09-12T09:14:24+00:00 ― 7 min ler

Som Uma Nova Estrutura para Anonimização de Locutores

Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.

2025-09-12T05:05:10+00:00 ― 8 min ler

Interação Homem-Computador EvaLLM: Uma Estrutura para Avaliar Visualizações Geradas por IA

EvaLLM oferece uma abordagem estruturada pra avaliar conteúdo visual gerado por IA.

2025-09-11T21:07:36+00:00 ― 7 min ler

Aprendizagem de máquinas Garantindo Confiança em Aprendizado de Máquina: Uma Nova Abordagem

Um método pra verificar modelos de aprendizado de máquina pra aumentar a confiança e a transparência.

2025-09-11T16:15:18+00:00 ― 7 min ler

Computação e linguagem Entendendo a IA com o SIDU-TXT: Uma Nova Abordagem

O SIDU-TXT esclarece as decisões de IA no processamento de linguagem natural.

2025-09-11T02:57:24+00:00 ― 7 min ler

Comunicação científica e educação Viés de Gênero nas Avaliações de Pesquisa Acadêmica

Pesquisas mostram que mulheres enfrentam preconceitos nas avaliações e no financiamento na academia.

2025-09-11T00:05:30+00:00 ― 12 min ler

Visão computacional e reconhecimento de padrões Transformando Notas Escritas à Mão em Tinta Digital

Um novo método transforma anotações manuscritas em tinta digital pra facilitar o uso.

2025-09-09T20:56:12+00:00 ― 8 min ler

Engenharia de software Desafios de Reproduzibilidade na Previsão de Falhas de Software

Uma análise dos problemas de reprodutibilidade na pesquisa de previsão de falhas em software de aprendizado profundo.

2025-09-09T19:21:24+00:00 ― 10 min ler

Computação e linguagem Resolvendo a Confusão de Nomes na Geração de Texto

Novo método melhora a verificação de fatos para textos gerados por computador com nomes ambíguos.

2025-09-09T17:30:48+00:00 ― 8 min ler

Multimédia Design de Pôster Eficaz Através de Métricas Simples

Aprenda a criar pôsteres que transmitam mensagens de forma clara e atraente.

2025-09-09T08:49:24+00:00 ― 6 min ler

Aprendizagem de máquinas Abordando o Hackeamento de Recompensas no Treinamento de IA

Explorando os desafios e soluções do hackeamento de recompensas no treinamento de modelos de IA.

2025-09-09T06:58:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Novo Framework para Avaliar Modelos de Resposta a Perguntas Visuais

Um jeito novo de avaliar como os modelos respondem a perguntas relacionadas a imagens.

2025-09-09T06:11:24+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Computação e linguagem Avaliação de Modelos de Geração de Expressões Referenciais

Novos métodos melhoram como a gente avalia o texto gerado por computador.

2025-09-08T20:18:54+00:00 ― 10 min ler

Inteligência Artificial Avaliando Modelos de Linguagem Grandes em Cibersegurança

Um olhar detalhado sobre a avaliação da CyberMetric de especialistas em IA e humanos em cibersegurança.

2025-09-08T19:39:24+00:00 ― 10 min ler

Aprendizagem de máquinas A Necessidade de Desaprender Máquinas na IA

Abordando preocupações éticas através da remoção seletiva de memória em modelos de IA.

2025-09-08T16:53:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Imagens a partir de Texto

Explorando como máquinas criam imagens a partir de textos e se alinham com as preferências humanas.

2025-09-08T11:29:36+00:00 ― 6 min ler

Computação e linguagem Avançando a Personalização em Modelos de Linguagem

Esse estudo analisa os benefícios das respostas personalizadas em modelos de linguagem.

2025-09-08T05:02:30+00:00 ― 5 min ler

Recuperação de informação Estratégias de Benchmarking para Sistemas de Recomendação

Uma nova maneira de avaliar e comparar algoritmos de RecSys usando conjuntos de dados diversos.

2025-09-07T16:00:24+00:00 ― 19 min ler

Computação e linguagem Melhorando Métodos de Avaliação de Respostas a Perguntas

Uma nova estrutura pra avaliar a correção das respostas da IA com um julgamento parecido com o humano.

2025-09-07T13:06:36+00:00 ― 8 min ler

Computação e linguagem Melhorando o Ensino de Ciências com Modelos de Linguagem

Modelos de linguagem têm como objetivo melhorar o aprendizado de ciências, oferecendo ajuda personalizada.

2025-09-07T12:27:06+00:00 ― 10 min ler

Aprendizagem de máquinas avaliando a detecção de anomalias em séries temporais com o TimeSeriesBench

Uma ferramenta de referência pra melhorar métodos de detecção de anomalias em séries temporais.

2025-09-07T10:04:54+00:00 ― 8 min ler

Computação e linguagem Viés no Julgamento de Modelos de Linguagem

Pesquisas mostram que tem muitos preconceitos nas avaliações de respostas feitas por humanos e por LLM.

2025-09-07T05:12:36+00:00 ― 7 min ler

Computação e linguagem Avaliação de IA Médica: Um Novo Padrão para Med-MLLMs

Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.

2025-09-07T01:47:12+00:00 ― 9 min ler

Computação e linguagem Avaliando o Raciocínio em Modelos de Linguagem Grandes

Um novo framework avalia como os LLMs raciocinam pra responder perguntas complexas.

2025-09-07T00:51:54+00:00 ― 5 min ler