Simple Science

La science de pointe expliquée simplement

# Statistiques # Apprentissage automatique # Econométrie # Méthodologie # Apprentissage automatique

Analyse des écarts de salaire entre les sexes avec des modèles modernes

Des recherches révèlent des infos plus profondes sur les écarts de salaires grâce à des modèles avancés.

Keyon Vafa, Susan Athey, David M. Blei

― 8 min lire


Des modèles avancés Des modèles avancés évaluent les écarts de salaire entre les sexes. de salaire. facteurs complexes dans les différences De nouvelles méthodes révèlent des
Table des matières

En sciences sociales, les chercheurs se penchent souvent sur les raisons pour lesquelles différents groupes ont des résultats variés, comme les salaires. Un point spécifique est de comprendre pourquoi les hommes et les femmes peuvent gagner des montants différents même avec des parcours professionnels similaires. Cet article discute de la manière dont l'utilisation de modèles avancés peut aider à décomposer les différences de salaires entre les sexes.

Qu'est-ce que la décomposition des salaires ?

La décomposition des salaires est une méthode où les chercheurs essaient de déterminer quelle partie de la différence de salaire entre les hommes et les femmes est due à des facteurs observables comme l'éducation et l'expérience, et quelle partie reste inexpliquée, pouvant être liée à des biais ou à de la discrimination. Les méthodes traditionnelles s'appuient souvent sur des modèles simples qui n'examinent que quelques facteurs de base, comme les années d'expérience ou le niveau d'éducation. Cependant, ces méthodes peuvent négliger des détails importants sur l'historique professionnel d'un individu, menant à des conclusions biaisées.

Le problème des modèles traditionnels

Les modèles prédictifs traditionnels ne peuvent pas capturer toute la complexité du parcours professionnel d'une personne. Quand des facteurs critiques liés au salaire et au genre sont négligés, cela conduit à un biais lié aux variables omises (BVO). Cela signifie que le modèle n'inclut pas les informations importantes qui affectent les salaires, provoquant des conclusions inexactes sur l'écart salarial.

Beaucoup de chercheurs ont essayé d'utiliser des modèles plus avancés pour créer de meilleures prédictions. Ces modèles peuvent prendre en compte la grande quantité d'informations disponibles sur le parcours professionnel d'une personne, menant à des résultats plus précis.

Présentation des modèles de base

Les modèles de base sont des modèles avancés d'apprentissage automatique formés sur des ensembles de données vastes et diversifiés. Ils peuvent gérer des informations complexes et faire de meilleures prédictions parce qu'ils sont conçus pour apprendre à partir de grandes quantités de données. Un exemple de ce type de modèle est un grand modèle de langage qui peut générer du texte en comprenant le contexte à partir d'un vaste ensemble de données.

Utilisation des modèles de base pour la décomposition des salaires

Dans cet article, nous explorons l'utilisation d'un modèle de base personnalisé spécialement conçu pour analyser les différences salariales basées sur des historiques d'emploi complets. Notre approche vise à fournir une image plus claire de l'Écart salarial entre les sexes en abordant les limitations des méthodes traditionnelles.

Notre modèle de base, que nous appelons CAREER, est formé sur des millions de CV. Il est conçu non seulement pour prédire les salaires avec précision, mais aussi pour équilibrer les influences de différents facteurs, comme l'historique professionnel et le sexe.

Le défi des biais liés aux variables omises

Un aspect important de notre recherche est de comprendre comment réduire le biais lié aux variables omises. Si notre modèle ignore des aspects significatifs de l'historique de travail de quelqu'un qui sont pertinents pour les salaires et le genre, les estimations peuvent toujours être biaisées. Nous identifions des stratégies spécifiques pour ajuster nos modèles, permettant des prédictions de salaire plus précises.

En développant des procédures de réglage, nous veillons à ce que nos modèles de base puissent s'adapter efficacement à de nouvelles données sans perdre d'informations importantes. De cette façon, nos représentations peuvent refléter plus précisément la complexité des facteurs salariaux.

Méthodes de réglage

Nous proposons plusieurs méthodes pour le réglage de notre modèle de base, qui incluent :

  • Réglage multi-tâches : Cette méthode ajuste le modèle pour prédire à la fois les salaires et l'appartenance à un groupe (sexe) simultanément. En traitant les deux tâches ensemble, nous pouvons mieux comprendre les interactions entre elles.

  • Réglage par projection : Cette approche alternative consiste à ajuster le modèle par cycles pour minimiser les erreurs de prédiction des salaires et des classifications de groupe séparément.

  • Réglage basé sur les différences : Cette méthode se concentre sur l'estimation des différences de salaires entre les groupes et vise à capturer ces différences plus efficacement que les modèles traditionnels.

Analyse des disparités salariales

Pour démontrer l'efficacité de notre approche, nous appliquons ces méthodes de réglage aux données d'enquête recueillies dans le cadre d'une étude à long terme sur les familles américaines. Notre analyse révèle que le cadre d'utilisation des modèles de base conduit à des prédictions salariales significativement meilleures que celles des modèles économétriques standards.

Résultats sur les écarts de salaires entre les sexes

Les résultats indiquent que des historiques d'emploi complets expliquent une plus grande partie de l'écart salarial entre les sexes que ce que les méthodes traditionnelles peuvent prendre en compte. Les résultats suggèrent que de nombreuses subtilités dans les parcours professionnels, souvent négligées, jouent un rôle essentiel dans l'explication des différences de salaires.

De plus, lorsque nous comparons les estimations des écarts de salaires entre les sexes de notre modèle avec celles des modèles traditionnels, nous remarquons des écarts notables. Les dimensions supplémentaires capturées par notre modèle de base révèlent que l'historique est essentiel pour comprendre les disparités salariales.

Aperçus obtenus par le regroupement

Au-delà de simplement estimer les écarts de salaires, nous analysons aussi les caractéristiques spécifiques des parcours professionnels qui contribuent aux différences de salaires. En regroupant différents historiques de travail et en analysant ces groupes, nous tirons des enseignements sur quels types de parcours professionnels génèrent des salaires plus élevés et comment ces parcours peuvent différer selon le genre.

Par exemple, l'un des groupes les plus significatifs identifiés inclut les managers ayant auparavant travaillé dans des rôles techniques comme l'ingénierie. Les données suggèrent que ce groupe tend à gagner plus que les managers issus de milieux non techniques. Cette découverte souligne l'importance des compétences techniques et leur relation avec les résultats salariales.

Limitations observées dans certains domaines

Il est intéressant de noter que l'analyse révèle également des cas où l'historique professionnel ne réduit pas significativement l'écart salarial entre les sexes. Pour des professions spécifiques comme les médecins et les avocats, il y a peu de variation dans les parcours, ce qui limite la capacité du modèle à expliquer efficacement les différences de salaires.

Implications pour les politiques et interventions

Comprendre les nuances des différences salariales peut avoir des implications pratiques pour l'élaboration de politiques. Si une part considérable de l'écart salarial est expliquée par l'historique, les interventions politiques pourraient se concentrer sur l'adressage des disparités de parcours. Par exemple, des programmes de développement de carrière pourraient être adaptés pour encourager les femmes à entrer dans des domaines traditionnellement mieux rémunérés.

D'un autre côté, si l'écart est en grande partie inexpliqué, cela pourrait inciter à des politiques ciblant les tactiques de négociation ou des pratiques de rémunération équitables pour garantir des salaires justes entre les sexes.

Poursuite de la recherche

Bien que cette étude se concentre sur les écarts de salaires entre les sexes, les méthodes et les aperçus peuvent être étendus à un plus large éventail de questions de recherche en sciences sociales. Les chercheurs peuvent appliquer ces modèles de base et techniques de réglage à d'autres domaines comme les résultats scolaires, les métriques de santé, et plus encore.

Conclusion

En conclusion, cette recherche présente une approche puissante pour comprendre les disparités salariales, en particulier entre les sexes. En utilisant des modèles de base et en abordant le biais des variables omises grâce à des méthodes de réglage innovantes, nous pouvons découvrir des aperçus plus profonds sur l'économie du travail. Ce travail met en lumière la nécessité d'analyses plus sophistiquées en sciences sociales pour assurer des décisions politiques plus justes et éclairées.

En adoptant ces techniques avancées, les chercheurs peuvent progresser dans la meilleure compréhension des problèmes sociaux complexes, menant finalement à des interventions plus efficaces et des résultats équitables dans divers domaines.

Source originale

Titre: Estimating Wage Disparities Using Foundation Models

Résumé: One thread of empirical work in social science focuses on decomposing group differences in outcomes into unexplained components and components explained by observable factors. In this paper, we study gender wage decompositions, which require estimating the portion of the gender wage gap explained by career histories of workers. Classical methods for decomposing the wage gap employ simple predictive models of wages which condition on a small set of simple summaries of labor history. The problem is that these predictive models cannot take advantage of the full complexity of a worker's history, and the resulting decompositions thus suffer from omitted variable bias (OVB), where covariates that are correlated with both gender and wages are not included in the model. Here we explore an alternative methodology for wage gap decomposition that employs powerful foundation models, such as large language models, as the predictive engine. Foundation models excel at making accurate predictions from complex, high-dimensional inputs. We use a custom-built foundation model, designed to predict wages from full labor histories, to decompose the gender wage gap. We prove that the way such models are usually trained might still lead to OVB, but develop fine-tuning algorithms that empirically mitigate this issue. Our model captures a richer representation of career history than simple models and predicts wages more accurately. In detail, we first provide a novel set of conditions under which an estimator of the wage gap based on a fine-tuned foundation model is $\sqrt{n}$-consistent. Building on the theory, we then propose methods for fine-tuning foundation models that minimize OVB. Using data from the Panel Study of Income Dynamics, we find that history explains more of the gender wage gap than standard econometric models can measure, and we identify elements of history that are important for reducing OVB.

Auteurs: Keyon Vafa, Susan Athey, David M. Blei

Dernière mise à jour: 2024-09-15 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2409.09894

Source PDF: https://arxiv.org/pdf/2409.09894

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires