Artigos mais recentes para Referência

Aprendizagem de máquinas Prevendo o Desempenho de Modelos de Linguagem em Benchmarks

Pesquisadores analisam a previsibilidade do desempenho de modelos de linguagem à medida que a computação de treinamento aumenta.

2025-09-18T05:27:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Examinando Aprendizado de Backdoor em Redes Neurais Profundas

Uma olhada nos ataques de backdoor e defesas em modelos de deep learning.

2025-09-14T06:00:24+00:00 ― 7 min ler

Engenharia de software Avaliação de Modelos de Geração de Código para Eficiência

Este paper avalia a eficiência do código gerado por vários modelos.

2025-09-11T17:42:12+00:00 ― 8 min ler

Computação e linguagem Avaliação de Modelos de Linguagem com Novo Padrão

Esse artigo apresenta um benchmark pra avaliar modelos de linguagem grandes com tarefas complexas.

2025-09-11T04:55:54+00:00 ― 7 min ler

Inteligência Artificial Avaliando LLMs em Tarefas de Planejamento Assíncrono

Esse estudo avalia as capacidades de modelos de linguagem grandes em cenários de planejamento complexos.

2025-09-10T23:16:12+00:00 ― 7 min ler

Inteligência Artificial Avaliação do Comportamento de Robôs Usando Modelos de Vídeo-Linguagem

A pesquisa examina o uso de VLMs pra avaliar as ações de robôs.

2025-09-10T19:19:12+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços em Modelagem e Design Molecular

Explorando o papel dos grandes modelos de linguagem na ciência molecular.

2025-09-10T18:55:30+00:00 ― 8 min ler

Robótica Testando Robôs para Desafios Inesperados

Explorando métodos pra melhorar o desempenho de robôs em ambientes imprevisíveis.

2025-09-09T02:53:54+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Recuperação de informação Avanços em Modelos de Recuperação de Documentos Longos

Novas ferramentas melhoram como os sistemas conseguem buscar informações em documentos longos.

2025-09-08T20:26:48+00:00 ― 5 min ler

Computação e linguagem Avaliação de IA Médica: Um Novo Padrão para Med-MLLMs

Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.

2025-09-07T01:47:12+00:00 ― 9 min ler

Computação e linguagem Edição de Conhecimento em Nível de Evento: Uma Nova Abordagem

Um jeito de manter os modelos de IA atualizados com base em eventos do mundo real.

2025-09-06T00:54:06+00:00 ― 7 min ler

Computação e linguagem Avaliando Modelos de Linguagem Multimodais em Tarefas de Mídia Social

Novos testes de benchmark avaliam MLLMs em tarefas de mídia social como desinformação e discurso de ódio.

2025-09-05T16:28:30+00:00 ― 12 min ler

Robótica Avançando a Geração de Código de Robô com RobotScript

O RobotScript melhora como os robôs executam tarefas a partir da linguagem natural.

2025-09-05T03:58:00+00:00 ― 8 min ler

Criptografia e segurança Detectando Trojans de Hardware: Novas Abordagens

Uma nova visão sobre como encontrar ameaças escondidas no design de hardware.

2025-09-03T18:55:06+00:00 ― 6 min ler

Inteligência Artificial Melhorando a Avaliação de Raciocínio em Modelos de Linguagem

Novos métodos buscam avaliar melhor as habilidades de raciocínio em modelos de linguagem de IA.

2025-09-02T23:25:54+00:00 ― 7 min ler

Engenharia de software Apresentando o DyPyBench: Uma Nova Ferramenta de Benchmark em Python

DyPyBench oferece um conjunto diversificado de projetos para análise dinâmica em Python.

2025-09-02T10:15:54+00:00 ― 8 min ler

Computação e linguagem IA Transformando o Desenvolvimento Web Através do Design Visual

A capacidade da IA de transformar designs em código tá mudando o desenvolvimento web.

2025-09-01T08:03:48+00:00 ― 9 min ler

Engenharia de software Avaliando Modelos de Linguagem: O Desafio da Contaminação de Dados

Estudo revela uma sobreposição de dados significativa que afeta as avaliações de modelos de linguagem na geração de código.

2025-09-01T02:16:12+00:00 ― 7 min ler

Bioinformática Avaliação de Modelos de Linguagem Grande para Análise de Bio-Imagens

Avaliando o desempenho de LLM com um benchmark específico para análise de bioimagem.

2025-08-31T18:04:57+00:00 ― 7 min ler

Computação e linguagem Avaliando Ferramentas de Processamento de Linguagem pra Melhor Performance

Um novo método pra avaliar ferramentas de processamento de linguagem tá mostrando potencial pra melhorar.

2025-08-31T11:31:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avaliação Eficiente de Detectores de Objetos Pré-treinados

Um método pra avaliar a transferibilidade de modelos pré-treinados pra detecção de objetos.

2025-08-29T09:37:18+00:00 ― 5 min ler

Robótica Novo Padrão para Aprendizado de Robôs em Tarefas Diárias

Um recurso criado pra ajudar os robôs a aprender tarefas do dia a dia de forma eficaz.

2025-08-29T07:46:42+00:00 ― 7 min ler

Computação e linguagem Avaliando Modelos de Linguagem Grandes na Tomada de Decisão

Um olhar sobre como avaliar as habilidades de tomada de decisão de grandes modelos de linguagem.

2025-08-29T02:44:12+00:00 ― 8 min ler

Computação e linguagem Aprimorando o PNL para Dialetos Diversos

Um framework pra melhorar o desempenho de NLP em vários dialetos de linguagem.

2025-08-28T20:51:00+00:00 ― 5 min ler

Aprendizagem de máquinas Novo Benchmark Revela Limitações dos Modelos de Linguagem Visual

Um novo benchmark revela os pontos fortes e fracos dos VLLMs em tarefas multimodais.

2025-08-28T00:50:12+00:00 ― 6 min ler

Física Computacional Cúpula de Computação de Monte Carlo: Avançando Técnicas de Simulação

Especialistas se reúnem pra discutir simulações de Monte Carlo e melhorias em GPUs.

2025-08-27T20:09:15+00:00 ― 8 min ler

Engenharia de software Desafiando Modelos de Geração de Código com Novos Benchmarks

Novos benchmarks revelam os pontos fortes e fracos dos modelos de linguagem de programação.

2025-08-25T06:36:30+00:00 ― 4 min ler

Computação e linguagem Apresentando o Meerkat-7B: Uma Nova Era na IA Médica

Meerkat-7B define um novo padrão pra modelos de linguagem médica de código aberto.

2025-08-24T01:22:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Resumo de Vídeo

Novos métodos melhoram a sumarização de vídeos usando grandes conjuntos de dados e modelos avançados.

2025-08-22T11:11:42+00:00 ― 8 min ler

Computação e linguagem Melhorando a Compreensão de Textos Longos em Modelos de Linguagem

Pesquisas mostram os desafios que os LLMs enfrentam pra entender textos longos e propõem novas referências.

2025-08-21T09:07:30+00:00 ― 7 min ler

Arquitetura de Hardware Unidade de Monitoramento de Desempenho para RISC-V em Aplicações Espaciais

Explorando o design e os benefícios de um PMU para processadores RISC-V usados no espaço.

2025-08-21T07:56:24+00:00 ― 5 min ler

Engenharia de software Analisando Benchmark de Geração de Código para Problemas de Qualidade

Esse estudo analisa problemas de qualidade nas instruções para modelos de geração de código.

2025-08-19T17:45:24+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avaliando a Percepção Visual em Modelos de Linguagem

Um novo benchmark revela lacunas na compreensão visual de grandes modelos de linguagem.

2025-08-18T12:23:42+00:00 ― 8 min ler

Computação e linguagem Avaliando a Precisão de Grandes Modelos de Visão-Linguagem

Um novo parâmetro melhora como a gente avalia os LVLMs e a precisão deles.

2025-08-17T06:46:12+00:00 ― 6 min ler

Lógica na Informática CHC-COMP 2023: Avaliando Solucionadores de Cláusulas Horn Constrangidas

A competição CHC mostrou os avanços nos solucionadores e suas aplicações na verificação de programas.

2025-08-17T00:50:42+00:00 ― 7 min ler

Computação e linguagem Desafios em Interpretar Respostas Indiretas

Esse artigo explora como melhorar a compreensão de respostas indiretas.

2025-08-16T21:56:54+00:00 ― 6 min ler

Computação e linguagem Avançando o Few-Shot Learning para Tarefas em Polonês

Um estudo avaliando métodos de aprendizado com poucos exemplos para classificação da língua polonesa.

2025-08-15T22:38:36+00:00 ― 5 min ler

Computação e linguagem Apresentando o PatentGPT: LLMs especializados em Propriedade Intelectual

Os modelos PatentGPT foram feitos pra lidar com desafios únicos em Propriedade Intelectual.

2025-08-15T17:38:24+00:00 ― 4 min ler

Engenharia de software Avaliando Ferramentas de Segurança de Contratos Inteligentes

Um estudo sobre a eficácia das ferramentas SAST para contratos inteligentes.

2025-08-15T17:30:30+00:00 ― 9 min ler