Abordando a Representatividade em Sistemas de Recuperação de Imagens
Uma nova abordagem pra melhorar a representação de identidades interseccionais na busca de imagens.
― 6 min ler
Índice
A busca e Recuperação de imagens podem gerar estereótipos prejudiciais e problemas sociais. Os métodos atuais tentam melhorar a representação de diferentes grupos, mas muitas vezes ignoram as complexidades das identidades interseccionais, como a combinação de gênero, raça e etnia. Este artigo apresenta uma nova abordagem chamada Representação Proporcional Multi-Grupo (MPR), que visa medir a representação desses grupos interseccionais de forma mais precisa.
Contexto
No aprendizado de máquina justo, o objetivo é identificar e reduzir os preconceitos que podem afetar de forma injusta diferentes grupos populacionais. Isso pode acontecer quando os sistemas distorcem a representação desses grupos ou reforçam estereótipos prejudiciais. Por exemplo, muitos conjuntos de dados disponíveis usados em aprendizado de máquina não são diversificados o suficiente, levando à sub-representação de minorias demográficas.
Quando se trata de tarefas de recuperação, um problema comum é que os resultados retornados não refletem a verdadeira Diversidade do mundo real. Isso pode perpetuar estereótipos e preconceitos. Por exemplo, um estudo mostrou que, ao buscar imagens de CEOs, apenas uma pequena porcentagem dos resultados mostrava mulheres, mesmo que elas constituam uma porcentagem significativa de CEOs na realidade.
A Importância da Representação
A representação de vários grupos nas tarefas de recuperação é crucial. Se certos grupos são sub-representados, isso pode levar a retratações tendenciosas e reforçar estereótipos. Isso é particularmente evidente em mecanismos de busca de imagens, onde preconceitos nos dados subjacentes podem influenciar os resultados.
Existem muitos métodos para promover a diversidade na recuperação de imagens. Métodos tradicionais muitas vezes se concentram em garantir um número igual de itens para grupos pré-definidos. No entanto, esses métodos geralmente não levam em conta a complexidade das identidades interseccionais.
Por exemplo, simplesmente equilibrar a representação de gênero não garante que a interseção de gênero e raça também esteja representada. Essa lacuna pode resultar na invisibilidade de certos grupos ou no tratamento injusto de indivíduos pertencentes a múltiplas identidades marginalizadas.
Introduzindo a Representação Proporcional Multi-Grupo
O MPR é uma nova métrica que visa abordar as falhas nos métodos de representação existentes, concentrando-se em múltiplos grupos interseccionais simultaneamente. O MPR mede a diferença no pior caso nas estatísticas de representação entre os itens recuperados e uma população de referência.
Esse conceito permite que os pesquisadores avaliem a representação proporcional de vários grupos interseccionais, o que é crucial para garantir justiça e diversidade nos resultados de recuperação. Usando o MPR, os pesquisadores podem analisar quão bem um sistema de recuperação representa identidades interseccionais com base em uma ampla variedade de atributos.
Como o MPR Funciona
Para implementar o MPR, uma classe de funções é definida. Essa classe mapeia os itens recuperados a valores numéricos com base em seus atributos, como gênero ou raça. Ao analisar esses valores, é possível comparar a representação média nos itens recuperados em relação à população de referência. Esse processo permite uma medição mais flexível e precisa da representação em comparação com métodos tradicionais.
O MPR também inclui a capacidade de quantificar o Viés representacional por meio da discrepância máxima média, uma medida estatística que ajuda a avaliar o quão bem duas distribuições se correspondem.
Aplicações Práticas
Para estimar o MPR de forma eficaz, os pesquisadores devem usar conjuntos de dados curados que reflitam com precisão a diversidade da população-alvo. Esses conjuntos de dados podem ser projetados para incluir Representações equilibradas de vários parâmetros de identidade, tornando-os úteis para pesquisadores que buscam representar de forma justa grupos interseccionais.
Além de medir o MPR, algoritmos práticos podem ser desenvolvidos para otimizar tarefas de recuperação que atendam às restrições do MPR. Esses algoritmos permitem que os sistemas busquem os itens mais relevantes, garantindo que os resultados recuperados também representem grupos interseccionais diversos.
Desafios para Alcançar Representação
Um grande desafio para alcançar a representação proporcional é o crescimento exponencial dos potenciais grupos interseccionais à medida que o número de atributos aumenta. Essa complexidade pode sobrecarregar a capacidade dos métodos tradicionais de garantir representação.
Ao usar o MPR, os pesquisadores devem considerar o número de atributos do grupo e como eles afetam a representação geral. Essa abordagem permite uma compreensão mais rica e matizada da representação em tarefas de recuperação que vão além de categorias demográficas simples.
Avaliação do MPR
O MPR foi avaliado em comparação com métodos existentes, e os resultados mostram que o MPR pode proporcionar uma melhor representação entre múltiplos grupos interseccionais. Isso é alcançado mantendo um alto nível de precisão nas tarefas de recuperação, equilibrando a necessidade de diversidade com a necessidade de relevância.
Por exemplo, quando testado em vários conjuntos de dados contendo imagens de rostos, o MPR superou consistentemente outros métodos em fornecer tanto representação diversificada quanto alta relevância para as consultas de busca.
Trabalhos Relacionados
Os esforços para promover justiça no aprendizado de máquina levaram a diferentes abordagens, algumas das quais buscam modificar espaços de embedding ou algoritmos de recuperação para melhor diversidade e representação. Trabalhos existentes mostraram que métodos comuns muitas vezes não conseguem alcançar verdadeira igualdade ou representação proporcional.
Avanços recentes em aprendizado de máquina também abordam a necessidade de algoritmos que possam se adaptar a identidades interseccionais, enfatizando a importância de estruturas rigorosas para testar e medir a representação justa.
Conclusão
A Representação Proporcional Multi-Grupo representa um avanço significativo na busca por sistemas de recuperação justos e diversos. Ao focar nas complexidades das identidades interseccionais, o MPR oferece aos pesquisadores e desenvolvedores uma ferramenta robusta para melhorar a representação em tarefas de busca e recuperação de imagens.
Dadas as limitações das estruturas previamente estabelecidas, o MPR oferece uma abordagem mais matizada para medir e otimizar a representação de grupos diversos. Com o desenvolvimento e aplicação prática, o MPR pode contribuir para a criação de sistemas de aprendizado de máquina mais equitativos que realmente reflitam a diversidade das populações que pretendem servir.
Título: Multi-Group Proportional Representation in Retrieval
Resumo: Image search and retrieval tasks can perpetuate harmful stereotypes, erase cultural identities, and amplify social disparities. Current approaches to mitigate these representational harms balance the number of retrieved items across population groups defined by a small number of (often binary) attributes. However, most existing methods overlook intersectional groups determined by combinations of group attributes, such as gender, race, and ethnicity. We introduce Multi-Group Proportional Representation (MPR), a novel metric that measures representation across intersectional groups. We develop practical methods for estimating MPR, provide theoretical guarantees, and propose optimization algorithms to ensure MPR in retrieval. We demonstrate that existing methods optimizing for equal and proportional representation metrics may fail to promote MPR. Crucially, our work shows that optimizing MPR yields more proportional representation across multiple intersectional groups specified by a rich function class, often with minimal compromise in retrieval accuracy.
Autores: Alex Oesterling, Claudio Mayrink Verdun, Carol Xuan Long, Alexander Glynn, Lucas Monteiro Paes, Sajani Vithana, Martina Cardone, Flavio P. Calmon
Última atualização: 2024-10-31 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.08571
Fonte PDF: https://arxiv.org/pdf/2407.08571
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.