Artigos mais recentes para Avaliação

Aprendizagem de máquinas Melhorando a Otimização em Alta Dimensão com Melhoria Esperada por Coordenadas

Um novo método melhora a otimização em problemas caros e de alta dimensão.

2025-08-09T10:04:04+00:00 ― 7 min ler

Inteligência Artificial Avaliação de Modelos de Linguagem com a Estrutura ALI-Agent

Um novo método pra avaliar como os modelos de linguagem tão alinhados com os valores humanos.

2025-08-09T06:16:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Técnicas Inovadoras pra Misturar Prompt de Texto na Geração de Imagens

Um novo método melhora a criação de imagens a partir de vários prompts de texto.

2025-08-08T22:14:30+00:00 ― 7 min ler

Economia Geral O Equilíbrio entre Competição e Colaboração no Crowdsourcing

Uma visão geral dos comportamentos em comunidades de crowdsourcing e seus impactos.

2025-08-08T20:43:00+00:00 ― 8 min ler

Computação e linguagem Melhorando Sistemas de Diálogo com Consciência da História da Conversa

Essa pesquisa destaca a necessidade de uma avaliação melhor do uso do histórico de conversa pelos sistemas de diálogo.

2025-08-08T14:28:24+00:00 ― 6 min ler

Computação e linguagem Avaliação de NLG com o Framework AdvEval

AdvEval expõe fraquezas nas métricas de avaliação de Geração de Linguagem Natural.

2025-08-08T07:29:42+00:00 ― 8 min ler

Computação e linguagem Uma Ferramenta pra Transformar Figuras Científicas

Nova ferramenta converte rascunhos em gráficos claros para pesquisadores.

2025-08-07T11:28:54+00:00 ― 7 min ler

Inteligência Artificial Apresentando a Prova de Qualidade para IA Generativa Descentralizada

Um novo método melhora a confiabilidade das saídas de IA em ambientes de blockchain.

2025-08-05T14:19:12+00:00 ― 11 min ler

Visão computacional e reconhecimento de padrões Desafio NTIRE 2024: Restauração de Imagens do Mundo Real

Os participantes enfrentam a restauração de imagens degradadas em um ambiente competitivo.

2025-08-05T11:49:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Método para Rastreamento de Cena 3D a Partir de Vídeo

Um novo sistema rastreia e reconhece cenas 3D dinâmicas usando um único vídeo.

2025-08-05T06:33:06+00:00 ― 7 min ler

Inteligência Artificial Segmentação de Frases Musicais Usando Algoritmos

Avaliação de algoritmos para segmentação eficaz de frases musicais e análise de estrutura.

2025-08-04T22:31:12+00:00 ― 5 min ler

Lógica na Informática Repensando a Avaliação de Inteligência: Foco na Credibilidade

Um novo método melhora a maneira como as mensagens de inteligência são avaliadas, priorizando a credibilidade.

2025-08-04T15:48:18+00:00 ― 6 min ler

Computação e linguagem Avanços na Avaliação de Modelos de Linguagem Coreana

Novos recursos melhoram a avaliação dos modelos de linguagem coreana.

2025-08-04T10:48:06+00:00 ― 5 min ler

Computação Neural e Evolutiva Novo Framework para Geração de Algoritmos Usando LLMs

Este artigo fala sobre um jeito novo de criar algoritmos com LLMs.

2025-08-04T07:14:48+00:00 ― 6 min ler

Inteligência Artificial Uma Nova Abordagem para Tomada de Decisões com Lógica de Sete Valores

Aprenda como a lógica de sete valores melhora a tomada de decisão com múltiplos critérios.

2025-08-04T05:00:30+00:00 ― 7 min ler

Processamento de Imagem e Vídeo Desafio Grande AAPM 2023 sobre Imagem Médica

Um desafio focado em modelos generativos profundos pra geração de imagens médicas realistas.

2025-08-04T00:01:12+00:00 ― 10 min ler

Computação e linguagem Novo Modelo Avalia a Legibilidade de Artigos da Wikipedia em Várias Línguas

Um modelo avalia a legibilidade dos artigos da Wikipedia em 14 idiomas.

2025-08-03T06:53:18+00:00 ― 8 min ler

Computação e linguagem Automatizando a Geração de Distratores em Compreensão de Leitura

Uma nova abordagem usando LLMs pra criar distrações com o mínimo de input humano.

2025-08-03T00:57:48+00:00 ― 4 min ler

Inteligência Artificial Avaliando Favoritismo em Métricas de IA Generativa

Uma nova abordagem pra avaliar preconceitos em métricas de avaliação automatizadas de IA.

2025-08-02T22:04:00+00:00 ― 7 min ler

Computação e linguagem Avançando o Raciocínio em Modelos de Linguagem

Novos métodos visam melhorar as habilidades de raciocínio em modelos de linguagem.

2025-08-02T09:25:36+00:00 ― 7 min ler

Computação e linguagem Avaliação de Modelos de Linguagem e a Compreensão do Mundo deles

Novas métricas esclarecem as limitações dos modelos de linguagem em representar a realidade.

2025-08-02T05:12:48+00:00 ― 8 min ler

Aprendizagem de máquinas Benchmarks Dinâmicos para Avaliar Modelos de Linguagem

Um novo sistema pra avaliar modelos de linguagem usando fluxos de dados do mundo real.

2025-08-02T01:23:42+00:00 ― 6 min ler

Computação e linguagem IrokoBench: Um Novo Padrão para Línguas Africanas

Apresentando o IrokoBench pra melhorar a avaliação de LLM em línguas africanas.

2025-08-02T00:44:12+00:00 ― 8 min ler

Processamento de Imagem e Vídeo Avanços na Segmentação de Tumores com o Desafio ULS23

O Desafio ULS23 tem como objetivo melhorar a segmentação de tumores em exames de TC pra um tratamento de câncer mais eficiente.

2025-07-31T18:27:20+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Método para Detectar Imagens Geradas por IA

Uma abordagem nova melhora a detecção de imagens falsas criadas por IA.

2025-07-30T00:58:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando a Compreensão de Vídeo em Modelos de Linguagem Multimodais

Um novo padrão pretende avaliar MLLMs na compreensão de vídeos sobre vários temas.

2025-07-29T22:20:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Atribuindo Influência em Modelos de Texto para Imagem

Esse estudo apresenta um novo método pra identificar as imagens de treinamento chave em visuais gerados por IA.

2025-07-29T11:56:36+00:00 ― 9 min ler

Aprendizagem de máquinas A Ascensão do Desaprender em Aprendizado de Máquina

Explorando a importância de desaprender métodos no aprendizado de máquina moderno.

2025-07-29T06:16:54+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando os Padrões de Pesquisa em Aprendizado por Reforço Multi-Agente Offline

Analisando as principais questões no MARL offline e propondo soluções padronizadas.

2025-07-29T05:53:12+00:00 ― 7 min ler

Computação Neural e Evolutiva Entendendo a Programação Genética Cartesiana: Uma Abordagem Flexível

Aprenda sobre CGP, sua função, vantagens, aplicações e desafios na programação.

2025-07-29T05:37:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Imagens e Texto

Um novo conjunto de dados melhora a coerência em sequências de imagem-texto para uma criação de conteúdo mais eficaz.

2025-07-29T01:32:30+00:00 ― 6 min ler

Computação e linguagem Avaliação de LLMs com o novo benchmark SciEx

A SciEx revela os pontos fortes e os desafios dos LLMs na avaliação científica.

2025-07-29T00:53:00+00:00 ― 8 min ler

Computação e linguagem Avançando a IA para as Línguas do Sudeste Asiático

A SEACrowd tem como objetivo melhorar a representação da IA para as línguas e culturas do Sudeste Asiático.

2025-07-28T21:03:54+00:00 ― 8 min ler

Inteligência Artificial Testando Modelos de Linguagem com Vários Problemas

Um estudo avalia modelos de linguagem sobre como lidar com várias tarefas ao mesmo tempo.

2025-07-28T14:05:12+00:00 ― 9 min ler

Computação e linguagem Avaliação de Modelos de Linguagem Grandes com Texto Estruturado

Um novo teste de referência avalia as habilidades dos LLMs com formatos de dados estruturados.

2025-07-28T12:22:30+00:00 ― 7 min ler

Multimédia Avaliando a Qualidade de Cursos Online com o VCEval

O VCEval oferece uma maneira automatizada de avaliar a eficácia de cursos online.

2025-07-28T10:39:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Padrão para Modelos de Vídeo-Linguagem

Um novo benchmark foca na composicionalidade na compreensão de vídeos e em modelos de linguagem.

2025-07-28T04:52:12+00:00 ― 7 min ler

Aprendizagem de máquinas Avançando os Padrões de Avaliação de Modelos de Linguagem

Um novo método melhora os testes para modelos de linguagem usando dados reais de usuários.

2025-07-27T21:06:06+00:00 ― 7 min ler

Computação e linguagem Apresentando a família de modelos Nemotron-4 340B

A família Nemotron-4 340B oferece modelos poderosos para aplicações diversas e geração de dados sintéticos.

2025-07-27T18:43:54+00:00 ― 8 min ler

Computação e linguagem Competência Cultural em Modelos de Linguagem: Um Estudo

Avaliar como modelos de linguagem lidam com pistas culturais em tarefas reais.

2025-07-27T16:53:18+00:00 ― 9 min ler