Estudo questiona a necessidade de otimizar exemplos em contexto quando instruções claras são dadas.
― 8 min ler
Ciência de ponta explicada de forma simples
Estudo questiona a necessidade de otimizar exemplos em contexto quando instruções claras são dadas.
― 8 min ler
Investigando como as diferenças de habilidade impactam o desempenho em competições.
― 7 min ler
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler
Abordando preocupações éticas através da remoção seletiva de memória em modelos de IA.
― 7 min ler
Como a composição da equipe e a coordenação impactam o desempenho nas organizações.
― 7 min ler
A análise mostra disparidades demográficas na precisão da previsão da idade cerebral.
― 7 min ler
O DeepATLAS identifica estruturas anatômicas em exames de tomografia sem precisar de muitos dados rotulados.
― 6 min ler
Um panorama dos transformers e seu impacto no processamento de dados.
― 6 min ler
Um novo método melhora o uso de memória em modelos de linguagem grandes, aumentando o desempenho.
― 4 min ler
Esse artigo fala sobre um método pra aprender características visuais a partir de dados de vídeo.
― 7 min ler
Esse estudo foca em melhorar os métodos de aprendizado contínuo em tarefas semânticas 3D.
― 8 min ler
Examinando os perigos de integrar modelos de linguagem em sistemas robóticos.
― 6 min ler
Um novo método pretende reduzir os resultados prejudiciais dos modelos de linguagem de IA.
― 7 min ler
Um novo método pra ranquear documentos de forma eficiente dentro dos limites do orçamento.
― 5 min ler
Estudo explora como o gênero impacta as habilidades de cálculo e a autoeficácia em física.
― 7 min ler
Uma nova abordagem resolve o problema de tokens perdidos e padding em modelos de aprendizado de máquina.
― 5 min ler
Esse artigo fala sobre um novo método pra melhorar a performance de prompts em modelos de linguagem.
― 8 min ler
Uma nova abordagem pra deixar modelos de linguagem menores e mais rápidos usando quantização de 1 bit.
― 8 min ler
Esse benchmark avalia o desempenho dos modelos de linguagem médica na área da saúde.
― 9 min ler
Um estudo investiga como os LLMs lembram de gráficos em comparação com a memória humana.
― 7 min ler
Explorando métodos pra melhorar o desempenho em tarefas de programação em modelos de linguagem usando dados.
― 7 min ler
Um novo algoritmo melhora a otimização quando os hiperparâmetros são desconhecidos.
― 6 min ler
Uma nova abordagem usa aprendizado auto-supervisionado pra conectar áudio e partituras.
― 6 min ler
Uma nova ferramenta ajuda os pesquisadores a modelar a turbulência óptica de forma eficaz.
― 6 min ler
Um novo método reduz o esquecimento em modelos de linguagem durante as atualizações.
― 4 min ler
Uma olhada em como os VLMs combinam processamento de imagem e texto.
― 7 min ler
ProSparse melhora a esparsidade de ativação em LLMs pra ter mais eficiência e desempenho.
― 9 min ler
Uma nova abordagem melhora os métodos de malha multigrid para simulações complexas com células de baixa qualidade.
― 7 min ler
Um estudo sobre como melhorar o mapeamento de tarefas em CGRAs usando métodos SAT.
― 6 min ler
Apresentando uma nova abordagem pra classificar modelos de linguagem sem precisar de respostas de referência.
― 12 min ler
Essa pesquisa avalia a confiança dos modelos de IA e a qualidade das explicações em ambientes barulhentos.
― 8 min ler
Soluções de contagem eficientes para aplicações modernas usando métodos aproximados.
― 5 min ler
A multiplicação de matrizes mascaradas melhora a eficiência nas computações de IA ao usar a esparsidade dos dados.
― 7 min ler
Um novo método de marca d'água protege modelos de linguagem personalizados contra uso não autorizado.
― 7 min ler
O FanOutQA ajuda a avaliar modelos de linguagem em perguntas difíceis de múltiplos passos usando dados estruturados.
― 6 min ler
Investigando como os métodos de tokenização afetam tarefas aritméticas em modelos de linguagem.
― 7 min ler
Explorando o papel e desempenho do NAT64 na comunicação entre IPv4 e IPv6.
― 5 min ler
Um estudo sobre como melhorar o raciocínio matemático com estratégias de dados eficazes.
― 5 min ler
Pesquisadores investigam como os modelos se adaptam quando componentes são removidos.
― 7 min ler
Um novo método melhora o desempenho dos agentes em ambientes complexos sem precisar de treinamento extra.
― 7 min ler