Artigos mais recentes para Referência

Visão computacional e reconhecimento de padrões Aprimorando a Adaptabilidade do CLIP em Visão Computacional

Novos métodos melhoram o desempenho do CLIP em diferentes domínios visuais.

2025-07-09T12:16:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Padrão Melhora Compreensão de Vídeo e Linguagem

Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.

2025-07-09T01:29:06+00:00 ― 6 min ler

Computação e linguagem Avaliando o Impacto dos Agentes da Web em Tarefas da Internet

Esse artigo avalia a eficácia dos agentes da web em gerenciar tarefas online complexas.

2025-07-09T00:10:06+00:00 ― 7 min ler

Arquitetura de Hardware Melhorando a Geração de Código HDL com Prompting Hierárquico

Um novo método aumenta a eficiência dos LLMs na criação de designs de hardware complexos.

2025-07-08T15:05:00+00:00 ― 6 min ler

Computação e linguagem Melhorando os Marcos de Extração de Informações Abertas

Um novo parâmetro busca melhorar as avaliações dos sistemas OIE para ter melhores insights de desempenho.

2025-07-08T12:34:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Imagem Hiperespectral com o HyTAS

O HyTAS facilita a busca por modelos de transformador em imagens hiperespectrais.

2025-07-08T02:26:36+00:00 ― 9 min ler

Computação e linguagem Combatendo Alucinações em Modelos de Linguagem

Um novo parâmetro avalia LLMs para precisão factual.

2025-07-07T18:08:54+00:00 ― 7 min ler

Computação e linguagem A Necessidade de Personalização em Modelos de IA

Novos métodos pra personalizar modelos de linguagem de IA são essenciais pra diversidade dos usuários.

2025-07-07T00:54:00+00:00 ― 7 min ler

Genómica Integrando sequências de DNA e descrições pra melhorar a previsão da função dos genes

Um novo conjunto de dados combina sequências de DNA e descrições de funções de enzimas pra melhorar os modelos preditivos.

2025-07-06T21:54:09+00:00 ― 9 min ler

Aprendizagem de máquinas Novo Método de Referência para Avaliar Algoritmos de Aprendizado por Reforço

Uma nova abordagem melhora as comparações de algoritmos de aprendizado por reforço em diferentes ambientes.

2025-07-06T13:03:00+00:00 ― 8 min ler

Robótica Novo Padrão para Treinamento de Robôs em Casa

Um novo padrão tem como objetivo melhorar o treinamento de robôs em ambientes domésticos realistas.

2025-07-06T07:31:12+00:00 ― 8 min ler

Computação e linguagem Otimizando a Avaliação de Modelos de Linguagem com Metabench

Uma nova estrutura de benchmarking melhora a eficiência na avaliação de modelos de linguagem.

2025-07-05T16:27:28+00:00 ― 6 min ler

Inteligência Artificial Avaliando Modelos de Linguagem com Novos Métodos de Avaliação

Uma nova abordagem pra melhorar as avaliações de tarefas de codificação para modelos de linguagem.

2025-07-05T07:49:12+00:00 ― 7 min ler

Computação e linguagem Avaliando Referências para Sistemas de Texto para Visualização

A pesquisa analisa a eficácia dos benchmarks atuais em tarefas de visualização.

2025-07-05T07:17:36+00:00 ― 5 min ler

Engenharia de software Avaliação de Desafios de Codificação para Modelos de Linguagem

Um novo framework avalia a dificuldade em tarefas de codificação para grandes modelos de linguagem.

2025-07-05T04:39:36+00:00 ― 9 min ler

Computação e linguagem Avaliando o Raciocínio Lógico em Modelos de Linguagem Grandes

Estudo avalia as habilidades de raciocínio de modelos de linguagem grandes com perguntas complexas.

2025-07-04T17:20:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Visão-Linguagem com UniBench

Uma nova estrutura pra avaliar modelos de visão-linguagem de forma eficaz.

2025-06-30T16:33:42+00:00 ― 7 min ler

Aprendizagem de máquinas Novo Padrão para Detecção de Anomalias em Aprendizado Federado

Apresentando uma ferramenta pra avaliar métodos de detecção de anomalias não supervisionados em aprendizado federado.

2025-06-30T09:58:42+00:00 ― 8 min ler

Bioinformática Avaliando as Habilidades da IA em Protocolos Biológicos

Avaliar modelos de IA pela capacidade de seguir procedimentos de laboratório.

2025-06-28T19:07:49+00:00 ― 7 min ler

Lógica na Informática Avanços nas Técnicas de Contagem de Modelos

Uma revisão das melhorias recentes em ferramentas de contagem de modelos e suas aplicações práticas.

2025-06-28T16:14:24+00:00 ― 7 min ler

Computação e linguagem Avaliação de Modelos de Reconhecimento de Emoção na Fala com Novo Referencial

Um novo padrão melhora a avaliação de sistemas de reconhecimento de emoção na fala em diferentes idiomas e emoções.

2025-06-28T04:15:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliação de Modelos 3D para Estimativa de Pose de Objetos

Este artigo analisa a eficácia de modelos 3D baseados em imagem na estimativa de pose.

2025-06-27T11:55:54+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos de Linguagem Visual Através do MuCR

Novos testes de referência avaliam o raciocínio causal da IA usando só imagens.

2025-06-27T08:46:18+00:00 ― 8 min ler

Aprendizagem de máquinas Avaliação de Modelos de Linguagem Grande para Uso no Mundo Real

Uma nova abordagem para avaliar LLMs com conjuntos de avaliação diversos.

2025-06-26T22:53:48+00:00 ― 7 min ler

Computação e linguagem Avaliação de Agentes de Modelos de Linguagem em Pesquisa Científica

Um novo benchmark avalia agentes de modelos de linguagem para lidar com análise de dados científicos.

2025-06-26T10:47:00+00:00 ― 9 min ler

Computação e linguagem Repensando o Aprendizado de Línguas: LLMs vs. Humanos

Uma análise dos LLMs e suas diferenças em relação à aquisição de linguagem humana.

2025-06-26T08:48:30+00:00 ― 9 min ler

Dinâmica dos Fluidos Investigando a Geração de Som por Cilindros Oscilantes em Fluidos

Estudando como cilindros em movimento criam ondas sonoras em fluidos para aplicações práticas.

2025-06-26T05:24:09+00:00 ― 6 min ler

Inteligência Artificial Avaliando o Aprendizado de Regras em Modelos de Linguagem

Um novo benchmark avalia como os LLMs aprendem por meio de interações.

2025-06-26T01:57:42+00:00 ― 6 min ler

Computação e linguagem O-HuBERT: Um Passo à Frente no Reconhecimento de Fala

O-HuBERT melhora o reconhecimento de fala ao separar a informação do conteúdo e a informação expressiva.

2025-06-24T20:04:24+00:00 ― 6 min ler

Computação e linguagem Novo Padrão para Geração de Texto em Energia Eólica

Apresentando o PermitQA, um padrão para avaliar sistemas RAG em energia eólica.

2025-06-24T13:37:18+00:00 ― 8 min ler

Computação e linguagem Aprimorando o reconhecimento de fala em hindi com pseudo-etiquetagem

Um novo método melhora o reconhecimento de fala em Hindi usando técnicas de pseudo-rotulagem.

2025-06-24T06:02:40+00:00 ― 5 min ler

Inteligência Artificial Novo Padrão para Avaliar a Geração de Código em LLMs

Um benchmark de múltiplos domínios avalia as habilidades de geração de código dos LLMs em várias áreas.

2025-06-23T06:56:36+00:00 ― 8 min ler

Inteligência Artificial Avaliando a Habilidade da IA em Entender Gráficos Enganosos

Um novo método testa como a IA interpreta gráficos enganosos.

2025-06-22T02:38:06+00:00 ― 7 min ler

Engenharia de software Avaliação da Resolução de Problemas em Java: Um Novo Padrão

Um novo projeto de referência tem o objetivo de avaliar as capacidades de resolução de problemas em Java.

2025-06-22T01:27:00+00:00 ― 6 min ler

Inteligência Artificial Equilibrando Segurança e Utilidade em Modelos de Linguagem

Uma nova abordagem simplifica a segurança e a utilidade no treinamento de modelos de linguagem.

2025-06-21T13:59:42+00:00 ― 11 min ler

Multimédia Avançando Sistemas de Interação Multimodal

Melhorando como as máquinas ajudam os usuários por meio de interações e respostas mais eficazes.

2025-06-19T23:48:42+00:00 ― 6 min ler

Som Avaliando Modelos de Linguagem Grandes em Musicologia

Este estudo analisa a eficácia dos LLMs em musicologia e sua confiabilidade.

2025-06-19T15:55:20+00:00 ― 6 min ler

Computação distribuída, paralela e em cluster Entendendo o JUPITER Benchmark Suite em HPC

Uma ferramenta completa pra avaliar sistemas de computação de alto desempenho.

2025-06-19T14:12:00+00:00 ― 8 min ler

Linguagens de programação Wasm-R3: Benchmarking Eficiente para Aplicativos WebAssembly

Um sistema pra gravar e reproduzir ações em apps de WebAssembly.

2025-06-18T22:08:12+00:00 ― 8 min ler

Arquitetura de Hardware Avanços em Particionamento de Design VLSI Usando GNNs

Explorando técnicas de machine learning pra uma partição eficiente de design VLSI.

2025-06-18T13:50:30+00:00 ― 7 min ler