O que significa "BiasKE"?
Índice
BiasKE é uma nova maneira de avaliar e reduzir a injustiça em modelos de linguagem. Métodos tradicionais costumam se concentrar em garantir que diferentes grupos sociais sejam tratados igualmente, mas às vezes deixam de lado os fatos específicos que os modelos têm. Isso pode levar a previsões incorretas ou injustas.
O BiasKE usa um conjunto de dados novos e existentes para checar como os modelos se saem em termos de justiça e precisão. Ele mede não só quão equilibradas as previsões são entre diferentes grupos, mas também quão específicas e precisas elas são.
Esse método também apoia uma nova abordagem chamada Fairness Stamp (FAST), que permite um ajuste cuidadoso de vieses no conhecimento individual. Assim, ele garante que o modelo mantenha suas informações importantes enquanto reduz a injustiça.
No geral, o BiasKE tem como objetivo ajudar os modelos de linguagem a fornecer resultados mais justos e precisos sem abrir mão de sua capacidade de reter conhecimento.