Um novo benchmark melhora a avaliação de como os modelos aprendem conceitos visuais.
― 13 min ler
Ciência de ponta explicada de forma simples
Um novo benchmark melhora a avaliação de como os modelos aprendem conceitos visuais.
― 13 min ler
Um novo método melhora a avaliação para modelos de completude de Grafo de Conhecimento.
― 10 min ler
A ScienceBenchmark oferece um novo padrão para bases de dados científicas complexas.
― 5 min ler
Esse artigo fala sobre um benchmark pra avaliar LLMs com prompts complicados.
― 9 min ler
Um referencial pra avaliar a semelhança de imagens com base em condições definidas pelo usuário.
― 7 min ler
Nova biblioteca melhora o treinamento e a avaliação de IA no NetHack.
― 9 min ler
Novo software facilita a otimização de parâmetros para modelos neurais, melhorando a eficiência da pesquisa.
― 8 min ler
Um novo benchmark chamado FedNoisy ajuda a lidar com rótulos ruidosos no aprendizado federado.
― 9 min ler
Novos padrões melhoram a capacidade dos robôs de ajudar nas tarefas de casa.
― 6 min ler
A plataforma FLGo facilita o aprendizado federado para pesquisadores com ferramentas flexíveis.
― 7 min ler
Novos métodos buscam melhorar a robustez dos sistemas de resposta a perguntas sobre tabelas.
― 7 min ler
Este artigo explora uma ferramenta de referência para avaliar preconceitos em modelos de linguagem.
― 5 min ler
O HEPScore tem como objetivo melhorar a avaliação do desempenho computacional na pesquisa em física de partículas.
― 6 min ler
Uma estrutura de referência pra avaliar métodos de remoção de pontos dinâmicos pra robôs.
― 7 min ler
O MindOpt Tuner otimiza o desempenho de software numérico automatizando os ajustes de hiperparâmetros.
― 6 min ler
Um jeito de melhorar a eficiência do deep learning em dispositivos limitados.
― 7 min ler
Esse trabalho propõe diretrizes pra medir a performance do controle de congestionamento de forma eficaz.
― 7 min ler
Novas pesquisas destacam a importância dos efeitos em cascata na atualização de modelos de linguagem.
― 9 min ler
Um novo método ajuda os computadores a relacionar desenhos a imagens reais de forma eficaz.
― 7 min ler
Avaliando a capacidade dos modelos de estimar incertezas pra melhorar as previsões.
― 9 min ler
Novos métodos pra proteger sistemas de reconhecimento 3D contra exemplos adversariais.
― 6 min ler
Um olhar mais de perto sobre como os modelos generativos se comportam e o que isso significa para a pesquisa.
― 7 min ler
A LISA melhora a compreensão das máquinas sobre instruções complexas dos usuários.
― 7 min ler
Nova pesquisa melhora a correspondência de imagens com textos ao resolver relações desalinhadas.
― 10 min ler
Uma abordagem nova usa redes maiores pra melhorar a qualidade da avaliação dos modelos de linguagem.
― 7 min ler
Analisando o impacto dos dados sintéticos no desempenho e aprendizado de modelos de IA.
― 6 min ler
Novos benchmarks usando IA generativa melhoram as técnicas de combinação de tabelas de dados.
― 8 min ler
Um novo padrão para RL offline melhora as estratégias em StarCraft II.
― 7 min ler
Ferramentas automatizadas melhoram os testes de penetração com integração de IA e gerenciamento de tarefas.
― 7 min ler
Novos métodos melhoram a forma como as máquinas avaliam as relações espaciais dentro das imagens.
― 6 min ler
Este estudo investiga técnicas de computação quântica para melhorar o agendamento de aquisição de imagens de satélite.
― 6 min ler
Investigando o papel da memória CXL em melhorar sistemas de computação de alto desempenho.
― 10 min ler
Um padrão pra melhorar a ligação de entidades biomédicas e comparações de pesquisa.
― 6 min ler
Esse artigo faz uma revisão dos benchmarks pra avaliar linguagens que integram regras lógicas.
― 9 min ler
Novos métodos melhoram a classificação de vídeo usando dados rotulados limitados.
― 9 min ler
A Languini Kitchen apoia pesquisadores em modelagem de linguagem com comparações justas e conjuntos de dados melhores.
― 7 min ler
Apresentando o SALSA-CLRS pra melhorar a avaliação de algoritmos usando grafos esparsos.
― 7 min ler
Pesquisas mostram como a IA tá melhorando as técnicas de mascaramento em nuvem pra dados de satélite.
― 8 min ler
Novos métodos melhoram a identificação de palavras-chave usando dados de fala disponíveis.
― 5 min ler
Um modelo novo integra de forma eficaz o processamento de imagens 2D e 3D.
― 7 min ler