Artigos mais recentes para Referência

Aprendizagem de máquinas Avanço do Desaprendizado de Máquina: Um Benchmark Unificado

Um novo padrão para o desaprendizado de máquinas melhora a avaliação e a comparação de métodos.

2025-07-26T12:42:42+00:00 ― 9 min ler

Engenharia de software Avanços na Geração de Código com Técnicas Aumentadas por Recuperação

Um novo método melhora a precisão da geração de código usando documentos externos.

2025-07-26T08:06:12+00:00 ― 9 min ler

Desempenho CEBench: Uma Abordagem Equilibrada para Avaliar LLMs

O CEBench ajuda empresas e pesquisadores a avaliar LLMs enquanto gerenciam custos e desempenho.

2025-07-26T00:43:48+00:00 ― 7 min ler

Computação e linguagem Avaliando o Aprendizado em Contexto em Modelos de Linguagem

Destaques da pesquisa mostram as habilidades de aprendizado em contexto em grandes modelos de linguagem.

2025-07-25T16:18:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos SLAM em Ambientes Barulhentos

Novo framework avalia o desempenho do SLAM em condições desafiadoras.

2025-07-25T00:06:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avaliação de Alucinações em Modelos de Vídeo-Linguagem

Novo benchmark avalia como modelos de vídeo-linguagem lidam com imprecisões de forma eficaz.

2025-07-24T17:47:18+00:00 ― 8 min ler

Computação e linguagem A Influência dos Modelos de Linguagem na Persuasão

Avaliar como LLMs criam textos persuasivos sobre vários assuntos.

2025-07-24T13:26:36+00:00 ― 7 min ler

Computação e linguagem Avaliando Modelos de Linguagem Italianos com Testes INVALSI

Este estudo compara o desempenho de Modelos de Linguagem usando testes INVALSI de italiano.

2025-07-24T09:37:30+00:00 ― 9 min ler

Aprendizagem de máquinas Melhorando a Aprendizagem Ativa com Nova Ferramenta de Referência

Uma ferramenta de referência avança estratégias de aprendizado ativo em aprendizado de máquina.

2025-07-24T06:51:36+00:00 ― 8 min ler

Engenharia de software Avaliando LLMs para Geração de Aserções em Design de Hardware

Este artigo avalia a eficácia de modelos de linguagem de grande escala na criação de asserções de hardware.

2025-07-24T01:27:42+00:00 ― 8 min ler

Computação e linguagem Melhorando a Leitura de Tela para Deficiências Visuais

Um novo sistema de IA melhora a acessibilidade para usuários com deficiências visuais por meio de uma melhor leitura de tela.

2025-07-23T10:27:06+00:00 ― 6 min ler

Computação e linguagem Apresentando um Novo Benchmark para Modelos de Linguagem em Russo

Um benchmark de pares mínimos tem como objetivo melhorar a compreensão da gramática russa por modelos de linguagem.

2025-07-23T09:55:30+00:00 ― 7 min ler

Aprendizagem de máquinas Descoberta de Dados Eficiente com Modelos Baseados em Esboços

Um novo modelo simplifica a análise de dados em grandes conjuntos de dados usando esboços.

2025-07-23T03:44:12+00:00 ― 8 min ler

Aprendizagem de máquinas Apresentando as Funções de Ehrlich para Otimização de Sequências

Um novo padrão para melhorar os métodos de otimização de sequência biofísica.

2025-07-23T01:53:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Uma Nova Abordagem para Detecção de Anomalias

Este estudo apresenta um novo método para detectar anomalias em diversos contextos.

2025-07-22T23:47:12+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Repensando Métodos de Avaliação para Modelos Multimodais

Novo benchmark melhora a avaliação de modelos multimodais ao minimizar preconceitos.

2025-07-22T12:12:00+00:00 ― 7 min ler

Biomoléculas Avanços na Classificação de Enzimas com o Benchmark CARE

Novo padrão ajuda a prever o comportamento de enzimas usando aprendizado de máquina.

2025-07-22T04:11:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Modelos Avançados para Geração de Descrições de Vídeo

Novos modelos produzem descrições de vídeo de alta qualidade de forma eficiente.

2025-07-22T02:35:18+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Novo Padrão para Modelos de Linguagem e Visão em Microscopia

Um marco abrangente melhora a avaliação de modelos de visão-linguagem para análise de imagens biológicas.

2025-07-21T21:03:30+00:00 ― 9 min ler

Computação e linguagem Avaliação de Modelos de Linguagem para Pesquisa Científica

Um novo padrão pra avaliar grandes modelos de linguagem em testes de hipótese.

2025-07-21T19:52:24+00:00 ― 8 min ler

Recuperação de informação Melhorando a Recuperação de Código com um Novo Benchmark

Um novo benchmark aborda os desafios na recuperação de código para desenvolvedores.

2025-07-20T02:47:36+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avaliando a Robustez Visual em Sistemas de VQA

Essa pesquisa analisa como problemas visuais afetam modelos de Resposta a Perguntas Visuais.

2025-07-19T18:22:00+00:00 ― 8 min ler

Criptografia e segurança NFARD: Uma Nova Abordagem para Detecção de Reuso de Modelos

A NFARD oferece métodos inovadores pra proteger os direitos autorais de modelos de aprendizado profundo.

2025-07-19T07:02:36+00:00 ― 8 min ler

Inteligência Artificial Modelo de Guardrail Inovador Melhora a Segurança para Modelos de Linguagem

Um novo modelo melhora o monitoramento de segurança para grandes modelos de linguagem contra conteúdos prejudiciais.

2025-07-18T02:12:30+00:00 ― 8 min ler

Aprendizagem de máquinas Avançando a Otimização Bayesiana para Problemas Complexos

Uma olhada em como a otimização bayesiana enfrenta desafios de alta dimensão.

2025-07-17T19:40:44+00:00 ― 9 min ler

Inteligência Artificial Avaliando Agentes de Análise de Dados com um Novo Referencial

Um novo método pra avaliar agentes de análise de dados pra ter insights melhores nos negócios.

2025-07-17T16:35:48+00:00 ― 6 min ler

Inteligência Artificial Padronizando a Avaliação de Algoritmos para Problemas de Corte Máximo

Apresentando o MaxCut-Bench para uma avaliação consistente de algoritmos em desafios de otimização.

2025-07-17T09:34:08+00:00 ― 8 min ler

Computação e linguagem Avaliando a Confiança no Processamento de Documentos Longos

Melhorar como os modelos lidam com evidências em documentos longos aumenta a confiança do usuário.

2025-07-15T22:35:42+00:00 ― 5 min ler

Inteligência Artificial Benchmarking Modelos de Linguagem Através de Jogos Clássicos

Avaliando as capacidades de LLM usando jogos em grade como Jogo da Velha e Conecta Quatro.

2025-07-15T22:27:48+00:00 ― 8 min ler

Computadores e sociedade Garantindo a Segurança da IA: Novo Marco Introduzido

Um novo benchmark tem como objetivo avaliar os riscos de segurança da IA de forma eficaz.

2025-07-15T13:14:48+00:00 ― 9 min ler

Arquitetura de Hardware Avanços no Design de Hardware Multi-Modais

Combinar visuais e linguagem melhora a precisão da geração de código de hardware.

2025-07-15T02:50:42+00:00 ― 7 min ler

Aprendizagem de máquinas Avaliação de Modelos de Predição Espacial-Temporal

Um novo benchmark aborda a necessidade de uma avaliação padrão na previsão espaço-temporal.

2025-07-15T01:47:30+00:00 ― 9 min ler

Computação e linguagem Avançando as técnicas de avaliação de modelos de linguagem

Novos métodos melhoram os testes para modelos de linguagem, focando em áreas chave de desempenho.

2025-07-15T00:20:36+00:00 ― 7 min ler

Aprendizagem de máquinas Abordando Desafios em Aprendizado de Grafo com um Novo Benchmark

Um novo padrão para avaliar métodos de aprendizado de grafos que lidam com heterofilia e heterogeneidade.

2025-07-13T09:22:12+00:00 ― 7 min ler

Computação e linguagem Avaliação de LLMs Usando Intérpretes de Código para Tarefas de Ciência de Dados

Uma estrutura pra avaliar as habilidades dos LLMs em tarefas relacionadas a dados com interpretadores de código.

2025-07-13T01:20:18+00:00 ― 6 min ler

Computação e linguagem Analisando a Compreensão da Negação pelo CLIP

Um olhar sobre como o CLIP processa a negação na linguagem.

2025-07-13T01:04:30+00:00 ― 7 min ler

Aprendizagem de máquinas Justiça em Aprendizado de Gráficos: Um Novo Padrão

Estabelecendo um parâmetro pra avaliar a justiça em métodos de aprendizado de grafos.

2025-07-12T17:26:18+00:00 ― 9 min ler

Inteligência Artificial Avanços no Raciocínio com Modelos de Linguagem

Explorando como modelos de linguagem lidam com tarefas de raciocínio de forma eficaz.

2025-07-12T06:46:24+00:00 ― 6 min ler

Inteligência Artificial Avaliando Modelos de Linguagem em Programação Científica

Um novo benchmark avalia modelos de linguagem em desafios de codificação científica em várias áreas.

2025-07-10T17:22:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Interpretação de Gráficos de Máquinas

Um novo modelo melhora como as máquinas leem gráficos, mesmo sem rótulos.

2025-07-10T11:11:30+00:00 ― 6 min ler