Um novo padrão destaca os riscos de viés espúrio em modelos de linguagem multimodal.
― 8 min ler
Ciência de ponta explicada de forma simples
Um novo padrão destaca os riscos de viés espúrio em modelos de linguagem multimodal.
― 8 min ler
Investigando feedback detalhado para modelos de texto para imagem e suas implicações práticas.
― 7 min ler
Novo benchmark avalia como modelos de vídeo-linguagem lidam com imprecisões de forma eficaz.
― 8 min ler
APIGen gera conjuntos de dados diversos e de alta qualidade para agentes de chamada de função.
― 7 min ler
Um novo método para detectar viéses no treinamento de modelos de linguagem.
― 7 min ler
O modelo SAVE melhora a segmentação áudio-visual com eficiência e precisão.
― 7 min ler
Uma nova maneira de avaliar a precisão do modelo sem rótulos durante mudanças nos dados.
― 6 min ler
Insights sobre os desafios do aprendizado de máquina em prever propriedades dos materiais.
― 8 min ler
Novo benchmark melhora a avaliação de modelos multimodais ao minimizar preconceitos.
― 7 min ler
Esse estudo analisa como dados visuais e textuais afetam o desempenho do modelo.
― 8 min ler
CD-T melhora a compreensão dos modelos de transformer, aumentando a interpretação e a confiança.
― 5 min ler
Novo padrão avalia o viés de gênero em modelos de IA relacionados a funções de trabalho.
― 7 min ler
Analisando vulnerabilidades de ataques de backdoor com rótulo limpo e como limites de generalização podem ajudar.
― 7 min ler
Uma nova ferramenta pra testar modelos de linguagem em ambientes barulhentos.
― 5 min ler
Uma nova abordagem pra avaliar modelos de ML, focando na preparação de dados.
― 9 min ler
A pesquisa avalia a estabilidade de métodos de XAI usando um conjunto de dados de diabetes.
― 7 min ler
Um estudo sobre como os LLMs gerenciam regras e restrições de programação.
― 5 min ler
Descubra a importância e os desafios de avaliar o desempenho de LLM de forma eficaz.
― 6 min ler
Uma olhada nas classificações de modelos de fundação e seus problemas de avaliação.
― 8 min ler
Novas métricas oferecem uma melhor avaliação do desempenho de modelos generativos em aprendizado de máquina.
― 6 min ler
O Efeito Rashomon revela vários modelos eficazes em aprendizado de máquina.
― 10 min ler
Uma análise dos métodos para avaliar previsões de tempo até o evento na ciência de dados.
― 8 min ler
Analisando como a invariância impacta o desempenho do modelo em aprendizado por transferência.
― 6 min ler
Analisando os efeitos reais dos métodos pós-treinamento no desempenho de modelos de linguagem.
― 6 min ler
Analisando as vulnerabilidades de modelos leves contra ataques adversariais.
― 6 min ler
Esse estudo avalia como os modelos grandes lidam com vários objetos em imagens.
― 7 min ler
Uma olhada nos desafios e inovações nos métodos de adaptação de domínio em grafos.
― 9 min ler
Essa pesquisa melhora a confiabilidade dos modelos de aprendizado de máquina por meio de técnicas de calibração e recalibração.
― 10 min ler
Analisando as dificuldades que os modelos enfrentam com sequências longas em várias aplicações.
― 6 min ler
Aprenda como a seleção aleatória de sementes impacta o desempenho e a confiabilidade do modelo de IA.
― 7 min ler
Uma nova abordagem para avaliar grandes modelos de linguagem para obter insights de desempenho melhores.
― 6 min ler
Apresentando o HO-FMN pra avaliar melhor a robustez de modelos de machine learning contra ataques adversariais.
― 7 min ler
Analisando ataques adversariais e a robustez do modelo em segmentação semântica.
― 7 min ler
Apresentando o PACE, uma abordagem estruturada para explicações de IA confiáveis.
― 6 min ler
Uma visão geral das práticas que minam a confiança nas avaliações de modelos de aprendizado de máquina.
― 8 min ler
Este artigo analisa a eficácia dos modelos multimodais usando dados de linguagem e visuais.
― 9 min ler
Apresentando o GOAR, um jeito de entender melhor a importância das características na IA.
― 7 min ler
Este artigo aborda problemas de má calibração em modelos de visão-linguagem e oferece soluções.
― 6 min ler
Este estudo avalia as habilidades de raciocínio de modelos de áudio-linguagem com uma nova tarefa.
― 9 min ler
Um estudo sobre como melhorar os métodos de TTA pra variações de dados do mundo real.
― 8 min ler