Novas ferramentas melhoram como os sistemas conseguem buscar informações em documentos longos.
― 5 min ler
Ciência de ponta explicada de forma simples
Novas ferramentas melhoram como os sistemas conseguem buscar informações em documentos longos.
― 5 min ler
Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.
― 9 min ler
Um jeito de manter os modelos de IA atualizados com base em eventos do mundo real.
― 7 min ler
Novos testes de benchmark avaliam MLLMs em tarefas de mídia social como desinformação e discurso de ódio.
― 12 min ler
O RobotScript melhora como os robôs executam tarefas a partir da linguagem natural.
― 8 min ler
Uma nova visão sobre como encontrar ameaças escondidas no design de hardware.
― 6 min ler
Novos métodos buscam avaliar melhor as habilidades de raciocínio em modelos de linguagem de IA.
― 7 min ler
DyPyBench oferece um conjunto diversificado de projetos para análise dinâmica em Python.
― 8 min ler
A capacidade da IA de transformar designs em código tá mudando o desenvolvimento web.
― 9 min ler
Estudo revela uma sobreposição de dados significativa que afeta as avaliações de modelos de linguagem na geração de código.
― 7 min ler
Avaliando o desempenho de LLM com um benchmark específico para análise de bioimagem.
― 7 min ler
Um novo método pra avaliar ferramentas de processamento de linguagem tá mostrando potencial pra melhorar.
― 6 min ler
Um método pra avaliar a transferibilidade de modelos pré-treinados pra detecção de objetos.
― 5 min ler
Um recurso criado pra ajudar os robôs a aprender tarefas do dia a dia de forma eficaz.
― 7 min ler
Um olhar sobre como avaliar as habilidades de tomada de decisão de grandes modelos de linguagem.
― 8 min ler
Um framework pra melhorar o desempenho de NLP em vários dialetos de linguagem.
― 5 min ler
Um novo benchmark revela os pontos fortes e fracos dos VLLMs em tarefas multimodais.
― 6 min ler
Especialistas se reúnem pra discutir simulações de Monte Carlo e melhorias em GPUs.
― 8 min ler
Novos benchmarks revelam os pontos fortes e fracos dos modelos de linguagem de programação.
― 4 min ler
Meerkat-7B define um novo padrão pra modelos de linguagem médica de código aberto.
― 7 min ler
Novos métodos melhoram a sumarização de vídeos usando grandes conjuntos de dados e modelos avançados.
― 8 min ler
Pesquisas mostram os desafios que os LLMs enfrentam pra entender textos longos e propõem novas referências.
― 7 min ler
Explorando o design e os benefícios de um PMU para processadores RISC-V usados no espaço.
― 5 min ler
Esse estudo analisa problemas de qualidade nas instruções para modelos de geração de código.
― 5 min ler
Um novo benchmark revela lacunas na compreensão visual de grandes modelos de linguagem.
― 8 min ler
Um novo parâmetro melhora como a gente avalia os LVLMs e a precisão deles.
― 6 min ler
A competição CHC mostrou os avanços nos solucionadores e suas aplicações na verificação de programas.
― 7 min ler
Esse artigo explora como melhorar a compreensão de respostas indiretas.
― 6 min ler
Um estudo avaliando métodos de aprendizado com poucos exemplos para classificação da língua polonesa.
― 5 min ler
Os modelos PatentGPT foram feitos pra lidar com desafios únicos em Propriedade Intelectual.
― 4 min ler
Um estudo sobre a eficácia das ferramentas SAST para contratos inteligentes.
― 9 min ler
Novos benchmarks revelam desafios para MLLMs em tarefas do mundo real com contextos longos.
― 9 min ler
Este artigo explora o viés em modelos de geração de código em diferentes linguagens.
― 10 min ler
Uma visão geral das alucinações de código em LLMs e seu impacto no desenvolvimento de software.
― 8 min ler
A Wake Vision melhora a detecção de pessoas para TinyML com um baita conjunto de dados.
― 8 min ler
Esse artigo fala sobre a necessidade de explicabilidade nos modelos de geração de texto em IA.
― 7 min ler
Novo benchmark avalia a toxicidade em modelos de linguagem grandes em vários idiomas.
― 9 min ler
Aprenda como a dominância estocástica de segunda ordem pode melhorar sua estratégia de investimento.
― 7 min ler
Um novo padrão avalia as habilidades dos LLMs em processos de modelagem matemática.
― 5 min ler
Explorando como as GPUs melhoram a eficiência dos algoritmos de Evolução Diferencial.
― 6 min ler