La complejidad de la relevancia en los sistemas de ranking
Examinando la relación entre relevancia y equidad en plataformas en línea.
― 10 minilectura
Tabla de contenidos
- El papel de la relevancia en las clasificaciones
- Definiendo la valía
- Midiendo la equidad
- Propiedades deseadas de la relevancia
- Impactos de la relevancia basada en clics
- Estudios de caso y conjuntos de datos utilizados
- Hallazgos del análisis
- Mitigando problemas de medición
- Direcciones futuras para sistemas de clasificación justos
- Conclusión
- Fuente original
- Enlaces de referencia
Las plataformas en línea juegan un papel importante en cómo la gente encuentra empleos, viviendas y productos. Ayudan a conectar a quienes buscan trabajo con las ofertas, a los compradores con los vendedores y a los usuarios de servicios con los proveedores. La forma en que estas plataformas clasifican y presentan opciones puede impactar mucho las oportunidades de las personas. La manera en que los artículos se clasifican a menudo se basa en su relevancia, lo que significa qué tan bien se ajustan a las necesidades o intereses de quienes buscan. Sin embargo, este enfoque puede llevar a resultados injustos, especialmente para grupos que ya enfrentan dificultades.
Por ejemplo, una plataforma de contratación podría mostrar más Candidatos masculinos en la parte superior de la lista, incluso cuando hay candidatas femeninas calificadas disponibles. Este tipo de sesgo puede impedir que algunos grupos obtengan oportunidades equitativas. Para abordar estos problemas, se han introducido medidas de equidad. Estas medidas buscan asegurar que la Exposición o visibilidad en estas clasificaciones no desventaje sistemáticamente a ciertos grupos, especialmente aquellos que están subrepresentados o marginados.
La pregunta principal es si la relevancia mide efectivamente la valía, o qué tan merecedor es alguien o algo de ser clasificado más alto. Dado que la valía no es algo que podamos ver fácilmente, las plataformas a menudo dependen de puntuaciones de relevancia. Estas puntuaciones generalmente se infieren de los clics y el compromiso de los usuarios. Sin embargo, no está claro si estas puntuaciones de relevancia realmente reflejan la valía, especialmente en situaciones donde la equidad es crucial.
El papel de la relevancia en las clasificaciones
Los sistemas de clasificación en motores de búsqueda y plataformas de empleo ordenan los artículos según lo que creen que es más relevante para los buscadores. La idea es que si algo es relevante, debería tener más visibilidad. Sin embargo, esto puede llevar a problemas donde algunos grupos reciben menos visibilidad basada en puntuaciones de relevancia sesgadas. En lugar de representar la verdadera valía, estas puntuaciones podrían simplemente reflejar los sesgos existentes en el comportamiento del usuario.
Se han propuesto medidas de equidad para reducir estos resultados nocivos. Las intervenciones de equidad buscan ajustar las clasificaciones de manera que la exposición se alinee más estrechamente con la valía de los candidatos o productos. Sin embargo, el concepto de valía en sí mismo es a menudo confuso, y la relevancia se ha convertido en un sustituto de ello. Esto puede ser problemático porque si la relevancia no mide la valía con precisión, las intervenciones de equidad pueden no ser efectivas.
Definiendo la valía
La valía es un concepto complejo que puede variar dependiendo del contexto. En el caso de los buscadores de empleo, la valía puede relacionarse con qué tan calificados son para un rol. Para los compradores, la valía podría relacionarse con la calidad o atractivo del producto. Estas diferentes interpretaciones significan que no hay un enfoque único para definir la valía.
Algunos podrían argumentar que la valía está relacionada con el concepto de mérito: qué tan merecedor es un individuo de ser clasificado más alto según sus calificaciones o capacidades. Otros podrían verlo desde una perspectiva de utilidad, considerando qué tan útil es un candidato o producto para los usuarios de la plataforma. El desafío radica en equilibrar estos diferentes puntos de vista y definir adecuadamente lo que significa la valía en cada contexto.
Midiendo la equidad
Medir la equidad implica observar cómo se asigna la exposición entre diferentes grupos. Esto se puede hacer a través de varias métricas que evalúan qué tan equitativas se presentan las oportunidades. Una forma común de medir la equidad es observar la paridad demográfica, que verifica si diferentes grupos reciben niveles similares de exposición según su presencia en el grupo general de candidatos.
Otro enfoque examina la equidad de exposición, que evalúa si los grupos reciben un nivel de exposición que coincida con su relevancia. La equidad individual mide la diferencia en niveles de exposición para artículos individuales entre grupos.
Estas métricas de equidad a menudo dependen de medir la relevancia con precisión, donde surgen complicaciones. Si la relevancia no captura efectivamente la valía, entonces las evaluaciones de equidad resultantes también pueden fallar.
Propiedades deseadas de la relevancia
Para ser útil en la promoción de la equidad, la relevancia debería cumplir ciertos criterios. Estos incluyen:
Credibilidad: Las puntuaciones de relevancia deben reflejar la verdadera valía. Una mayor valía debería llevar a puntuaciones de relevancia más altas, y viceversa.
Consistencia: Las puntuaciones de relevancia producidas por un sistema deberían converger con el tiempo. Si no lo hacen, puede llevar a métricas de equidad fluctuantes.
Estabilidad: Las mediciones de relevancia deberían tener variación limitada. Si se proporciona la misma entrada varias veces, la puntuación de relevancia no debería cambiar drásticamente.
Comparabilidad: La relación entre las puntuaciones de relevancia y la verdadera valía debería ser clara. Si las puntuaciones de relevancia para individuos o grupos son altas, debería correlacionarse con la verdadera valía.
Disponibilidad: Las puntuaciones de relevancia deberían estar accesibles para todos los artículos clasificados. Si faltan o están incompletas, puede sesgar las evaluaciones de equidad.
Estas propiedades destacan la necesidad de una evaluación más profunda de las puntuaciones de relevancia para determinar si pueden guiar de manera confiable asignaciones de exposición justas.
Impactos de la relevancia basada en clics
Un método común para determinar la relevancia es a través de datos de clics. Cuando los usuarios hacen clic en los resultados de búsqueda, se asume que más clics indican mayor relevancia. Sin embargo, este enfoque tiene sus limitaciones.
Los clics a veces pueden reflejar sesgos basados en el comportamiento del usuario en lugar de la verdadera relevancia de los artículos. Por ejemplo, los usuarios podrían hacer clic solo en artículos clasificados más alto, independientemente de su utilidad real. Esto puede llevar a una situación donde los artículos relevantes pero de menor clasificación no reciben la exposición que merecen.
Cuando la relevancia se determina principalmente a partir de clics, puede violar varias de las propiedades deseadas mencionadas anteriormente. Si las puntuaciones no son creíbles o consistentes, la equidad de los sistemas de clasificación también se verá afectada.
Investigaciones han demostrado que depender únicamente de los datos de clics puede llevar a problemas significativos en cómo se asigna la exposición. Esto subraya la necesidad de métodos alternativos para evaluar la relevancia de una manera que refleje con precisión la verdadera valía.
Estudios de caso y conjuntos de datos utilizados
Al examinar los problemas de la relevancia como un proxy para la valía, se evaluaron diferentes conjuntos de datos. Estos incluyeron conjuntos de datos sintéticos y datos de usuarios del mundo real para medir qué tan bien las puntuaciones de relevancia se alinean con la verdadera valía.
Para los conjuntos de datos sintéticos, las condiciones controladas permitieron a los investigadores manipular variables y observar resultados. En los conjuntos de datos del mundo real, surgió una imagen más compleja, reflejando las sutilezas del comportamiento del usuario en un entorno natural.
A través de estos estudios, los investigadores probaron si se cumplían las propiedades deseadas para la relevancia. Observaron cómo variaban las puntuaciones de relevancia entre diferentes grupos y determinaron si estas puntuaciones reflejaban con precisión la verdadera valía de los candidatos o productos.
Hallazgos del análisis
El análisis reveló que cuando la relevancia se infería a partir de datos de clics, no se cumplían todos los criterios. Aunque algunos aspectos de credibilidad parecían cumplirse, otros, como la disponibilidad y comparabilidad, enfrentaron desafíos.
Por ejemplo, con datos sintéticos, la distribución de las puntuaciones de relevancia podría no coincidir con la verdad subyacente de la valía, lo que lleva a resultados sesgados en las evaluaciones de equidad. Los datos del mundo real a menudo mostraron tendencias similares, con las diferencias en las puntuaciones de relevancia a veces fallando en reflejar las verdaderas calificaciones o méritos de los artículos que se clasifican.
Esto resalta la necesidad urgente de nuevos métodos para evaluar la relevancia y asegurarse de que pueda representar con precisión la valía. Sin esto, las medidas de equidad pueden no tener el impacto deseado.
Mitigando problemas de medición
Para mejorar cómo se evalúa la relevancia, los investigadores discutieron varias intervenciones y técnicas. Estos métodos podrían variar desde ajustar la muestreo de datos hasta utilizar intervenciones de equidad que puedan ayudar a redistribuir la exposición de manera más equitativa entre diferentes grupos.
Un enfoque implica re-clasificar los artículos basándose en métricas de equidad. Este método ajusta el orden de los artículos para que los grupos subrepresentados reciban más exposición.
Otra intervención podría involucrar implementar conjuntos de datos de entrenamiento equilibrados que aseguren una representación equitativa de diferentes grupos. Al hacerlo, puede ser posible reducir los sesgos capturados en las puntuaciones de relevancia, mejorando su alineación con la verdadera valía.
Sin embargo, estas intervenciones deben aplicarse con cuidado. Cada método tiene sus pros y contras, y el impacto puede variar dependiendo del algoritmo utilizado y el contexto de aplicación específico.
Direcciones futuras para sistemas de clasificación justos
De cara al futuro, es esencial examinar más a fondo la relación entre relevancia y valía. El objetivo debería ser desarrollar nuevos marcos que aclaren cómo las puntuaciones de relevancia pueden ser tanto válidas como fiables en la promoción de la equidad.
Los investigadores también deben trabajar para definir la valía de manera más clara en diferentes contextos. A medida que las aplicaciones de los sistemas de clasificación evolucionan, también debería hacerlo nuestra comprensión de cómo se operacionaliza la valía. Este entendimiento ayudará a crear sistemas más equitativos.
Además, deberían explorarse mejores métodos para recopilar datos de relevancia. Esto podría incluir encontrar nuevas formas de obtener juicios de relevancia de la multitud o desarrollar modelos avanzados que puedan tener en cuenta mejor los sesgos en el comportamiento del usuario.
Los sistemas de clasificación tienen un poder significativo en la configuración de oportunidades en varios entornos, incluyendo la contratación y los mercados en línea. Por lo tanto, asegurar que estos sistemas operen de manera justa y equitativa es crucial para fomentar una sociedad justa.
Conclusión
En conclusión, aunque la relevancia juega un papel importante en cómo las plataformas en línea clasifican opciones, no se puede asumir que sea igual a la valía. Los métodos utilizados para evaluar la relevancia deben ser examinados críticamente para asegurar que reflejen con precisión el verdadero mérito. Se deben desarrollar nuevos enfoques para recopilar y calcular las puntuaciones de relevancia de maneras más significativas.
Solo así podemos esperar crear sistemas de clasificación que no solo satisfagan bien a los usuarios, sino que también sean justos y equitativos. La investigación futura debe continuar abordando estos desafíos, allanando el camino para una mejor equidad en la recuperación de información y más allá.
Título: The Role of Relevance in Fair Ranking
Resumen: Online platforms mediate access to opportunity: relevance-based rankings create and constrain options by allocating exposure to job openings and job candidates in hiring platforms, or sellers in a marketplace. In order to do so responsibly, these socially consequential systems employ various fairness measures and interventions, many of which seek to allocate exposure based on worthiness. Because these constructs are typically not directly observable, platforms must instead resort to using proxy scores such as relevance and infer them from behavioral signals such as searcher clicks. Yet, it remains an open question whether relevance fulfills its role as such a worthiness score in high-stakes fair rankings. In this paper, we combine perspectives and tools from the social sciences, information retrieval, and fairness in machine learning to derive a set of desired criteria that relevance scores should satisfy in order to meaningfully guide fairness interventions. We then empirically show that not all of these criteria are met in a case study of relevance inferred from biased user click data. We assess the impact of these violations on the estimated system fairness and analyze whether existing fairness interventions may mitigate the identified issues. Our analyses and results surface the pressing need for new approaches to relevance collection and generation that are suitable for use in fair ranking.
Autores: Aparna Balagopalan, Abigail Z. Jacobs, Asia Biega
Última actualización: 2023-06-06 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2305.05608
Fuente PDF: https://arxiv.org/pdf/2305.05608
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://creativecommons.org/licenses/by/4.0/
- https://github.com/DataResponsibly/MirrorDataGenerator
- https://github.com/ULTR-Community/ULTRA_pytorch
- https://github.com/Aparna-B/FairRankingRelevance
- https://huggingface.co/cross-encoder/ms-marco-TinyBERT-L-2-v2
- https://github.com/ULTR-Community/ULTRA_pytorch/blob/main/example/PropensityEstimator/randomized_pbm_0.1_1.0_4_1.0.json