Um novo padrão tem o objetivo de melhorar a avaliação de incerteza em modelos de linguagem.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo padrão tem o objetivo de melhorar a avaliação de incerteza em modelos de linguagem.
― 6 min ler
Um novo método melhora o raciocínio do modelo através de rastros de programação estruturada.
― 9 min ler
Analisando como o ajuste fino afeta a segurança em modelos de linguagem em várias tarefas.
― 7 min ler
Uma nova abordagem para avaliar modelos de ML usando a Teoria da Resposta ao Item para obter insights melhores.
― 6 min ler
Modelos base fortes melhoram a avaliação de sistemas de ML na área da saúde.
― 7 min ler
Uma olhada nos intervalos de confiança em aprendizado com poucos exemplos e seu impacto na avaliação de modelos.
― 7 min ler
Analisando a compreensão e a precisão de saída dos modelos de linguagem.
― 6 min ler
Destaques da pesquisa usando funções de influência pra melhorar o desempenho de PINN em problemas de física.
― 7 min ler
Um olhar sobre a dimensão efetiva e seu impacto no treinamento de modelos.
― 7 min ler
Este artigo avalia o quão bem modelos de linguagem explicam conceitos científicos.
― 5 min ler
Esse artigo analisa os GAMs como uma solução para desempenho preditivo e interpretabilidade.
― 8 min ler
Analisando como amostras difíceis afetam o desempenho do modelo e a confiabilidade da precisão do teste.
― 11 min ler
Esse artigo examina como diferentes camadas afetam o desempenho dos LLMs.
― 6 min ler
Rótulos suaves podem melhorar o desempenho de modelos de aprendizado de máquina em cenários de dados incertos.
― 7 min ler
O RepairBench define padrões pra comparar modelos de IA na correção de bugs de software.
― 6 min ler
Esse método melhora a confiabilidade das pontuações de confiança dos modelos de linguagem.
― 6 min ler
Aprenda como o domínio de aplicabilidade afeta a precisão dos modelos preditivos em várias áreas.
― 10 min ler
Um método pra estimar a confiabilidade das respostas de modelos de linguagem grandes.
― 4 min ler
Um novo método pra testar modelos de linguagem usando texto aleatório.
― 6 min ler
Um método pra melhorar a eficácia do vetor de direcionamento em modelos de linguagem.
― 5 min ler
Explore o impacto do aprendizado por atalho em modelos de linguagem e suas aplicações no mundo real.
― 5 min ler
Este artigo analisa métodos para comparar modelos generativos por meio de representações baseadas em embedding.
― 6 min ler
Uma estrutura pra equilibrar o aprendizado de pseudo-rótulos em machine learning.
― 6 min ler
Nova ferramenta H-POPE melhora a precisão dos modelos de visão-linguagem.
― 5 min ler
Um estudo sobre as habilidades de diferentes modelos em Aprendizado em Contexto.
― 7 min ler
Um novo framework identifica quando modelos multimodais usam dados de treinamento inadequados.
― 6 min ler
Este artigo fala sobre a necessidade de transparência nos benchmarks de modelos de linguagem.
― 8 min ler
Uma visão geral das forças e fraquezas dos Modelos de Visão-Linguagem de hoje.
― 6 min ler
Um estudo completo comparando métodos para estimar intervalos de confiança em modelos de machine learning.
― 14 min ler
Uma olhada nas redes de similaridade para melhorar a justiça em machine learning.
― 7 min ler
Aprenda estratégias para melhorar o desempenho do modelo em conjuntos de dados desbalanceados.
― 9 min ler
Um guia pra entender o desempenho de modelos de IA usando o framework FEET.
― 7 min ler
Uma estrutura pra comparar modelos de previsão usando componentes principais.
― 7 min ler
O RLInspect ajuda a analisar e melhorar modelos de aprendizado por reforço de forma eficaz.
― 8 min ler
Analisando como modelos de IA lidam com texto e imagens juntos.
― 8 min ler
Explorando como o tamanho do modelo afeta a performance na detecção OOD.
― 5 min ler
Um novo método melhora a detecção de dados desconhecidos em modelos de aprendizado profundo.
― 8 min ler
As tarefas de NLI ainda são relevantes para testar modelos de linguagem grandes?
― 7 min ler
O framework ICER testa as medidas de segurança em modelos de texto para imagem de forma eficaz.
― 7 min ler
Um estudo revela problemas de precisão em textos longos gerados por IA.
― 7 min ler