Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Calcolo e linguaggio

Carriere: Il Futuro della Predizione dei Percorsi Professionali

Un nuovo dataset che cambia il modo in cui prevediamo i movimenti di carriera.

Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank

― 7 leggere min


Percorsi di carriera:Percorsi di carriera:Prevedere le carrieregioco per le previsioni di carriera.Un dataset che cambia le regole del
Indice

Nel mondo della ricerca di lavoro e del reclutamento, prevedere dove qualcuno potrebbe andare nella propria carriera può essere complicato. È come cercare di indovinare il prossimo passo di danza di qualcuno che è davvero bravo a ballare-potrebbero sorprenderti! La necessità di strumenti che aiutino a prevedere i percorsi professionali sta crescendo, ma il problema è che spesso non abbiamo tutti i Dati necessari. Per fortuna, c'è un nuovo set di dati chiamato Karrierewege che può aiutare.

Cos'è Karrierewege?

Karrierewege è una grande raccolta di oltre 500.000 percorsi professionali. Sono tanti cambi di carriera! Questo set di dati è molto più grande di molti altri in circolazione, rendendolo una risorsa preziosa per chiunque abbia bisogno di approfondimenti sui Percorsi di carriera. I creatori hanno collegato questa raccolta a un popolare sistema di classificazione europeo chiamato ESCO. Facendo ciò, rendono più semplice capire e prevedere i cambiamenti lavorativi.

La sfida dei Titoli di Lavoro e dei curricula

Un problema comune nel mercato del lavoro è che i curricula contengono spesso titoli di lavoro e descrizioni in formato libero. Pensa ai curricula come a un buffet; ognuno ha gusti diversi, e non tutti servono lo stesso piatto. Per rendere le previsioni più accurate, i creatori di Karrierewege hanno ideato una soluzione ingegnosa. Hanno generato nuovi titoli di lavoro e descrizioni per colmare le lacune. Questo si chiama Karrierewege+. Con questi nuovi titoli e descrizioni sintetici, è molto più facile fare previsioni a partire dall'insieme misto di informazioni trovate nei curricula reali.

Perché la previsione dei percorsi di carriera è importante

La previsione dei percorsi di carriera è utile per molte persone. Coloro che cercano lavoro vogliono sapere quali opzioni potrebbero avere in futuro. I reclutatori vogliono trovare i migliori candidati per i lavori. I dipartimenti HR vogliono tenere traccia delle tendenze della forza lavoro. Insegnanti e formatori potrebbero cercare modi per aiutare gli studenti a acquisire le competenze giuste. Tutti questi gruppi possono beneficiare di previsioni migliori sui percorsi professionali.

Tuttavia, il campo è stato limitato dalla disponibilità di set di dati che mostrano storie di carriera dettagliate. La maggior parte dei set di dati esistenti è più piccola e non è disponibile pubblicamente. Questo rende il rilascio di Karrierewege particolarmente eccitante!

Collegamento a ESCO

La tassonomia ESCO sta per "European Skills, Competences, Qualifications, and Occupations." Aiuta a standardizzare i termini di lavoro e le competenze nel mercato del lavoro europeo. È simile ad avere un linguaggio comune; può rendere molto più semplici le conversazioni sui lavori. Il sistema ESCO include migliaia di titoli di lavoro e competenze in 28 lingue diverse. Quindi, quando i creatori di Karrierewege hanno deciso di collegare il loro set di dati a ESCO, hanno davvero aperto molte opportunità per la ricerca e l'applicazione.

Processo di creazione del set di dati

Creare un set di dati come Karrierewege non è affatto una passeggiata! Il team dietro di esso ha utilizzato curricula anonimi dell'Agenzia Federale del Lavoro tedesca come punto di partenza. Hanno trovato curricula di persone che cercavano lavoro in ogni tipo di settore. Tuttavia, come un cuoco che assaggia la zuppa, hanno notato che il set di dati potrebbe avere alcuni pregiudizi. Ad esempio, potrebbe essere più orientato verso settori con un alto tasso di disoccupazione rispetto ad altri, o il contesto culturale potrebbe essere sbilanciato verso la Germania.

Per affrontare questo, hanno mappato i titoli di lavoro dai curricula ai loro equivalenti nel sistema ESCO. Questa attenta mappatura aiuta a garantire che i dati raccolti siano utili e accurati.

Sintesi dei dati

Una delle caratteristiche distintive di Karrierewege+ è l'uso di dati sintetici. Per rendere il set di dati più robusto e utile, hanno impiegato modelli di linguaggio di grandi dimensioni per generare nuovi titoli di lavoro e descrizioni. Immagina un cuoco che inventa nuove varianti divertenti su ricette classiche.

Hanno utilizzato due approcci:

  1. Ogni titolo di lavoro potrebbe avere fino a sette nuove versioni create. Questo approccio mirava a diversificare il set di dati.
  2. L'intera sequenza di titoli di lavoro in un percorso di carriera potrebbe essere riscritta. Questo metodo mirava al contesto e alla coerenza, come raccontare una storia che ha senso dall'inizio alla fine.

Utilizzando questi metodi, i creatori hanno cercato di arricchire il loro set di dati, rendendolo ancora più rappresentativo del mondo reale.

Misure di controllo della qualità

Per garantire che i nuovi dati fossero di alta qualità, gli sviluppatori hanno valutato i titoli di lavoro e le descrizioni in base a diversi criteri. Hanno esaminato:

  • Correttezza: I titoli sono reali titoli di lavoro che le persone usano effettivamente?
  • Somiglianza semantica: I nuovi titoli trasmettono un significato simile a quelli originali?
  • Diversità: Ci sono titoli unici inclusi, o è sempre lo stesso titolo ripetuto?
  • Coerenza: I titoli si adattano bene tra loro all'interno di un percorso di carriera?

Per testare queste qualità, un team di esperti ha esaminato manualmente campioni, e anche un'IA è stata coinvolta per assistere. Usare sia le valutazioni umane che quelle dell'IA ha aiutato a fornire un quadro completo della qualità dei dati.

Confronto con altri set di dati

Già, ci sono molti set di dati disponibili per la previsione dei percorsi di carriera, ma la maggior parte è piccola e privata. I dati di Karrierewege sono molto più ampi e offrono una migliore possibilità per i modelli di imparare. Pensalo come un grande buffet rispetto a uno spuntino piccolo. Più dati hai, meglio puoi prevedere cosa potrebbe succedere dopo.

Karrierewege ha più titoli di lavoro unici rispetto a molti set di dati più piccoli. Copre anche una gamma più ampia di settori, da occupazioni elementari a ruoli di servizio. Questa ampia portata fornisce una migliore comprensione del mercato del lavoro.

Benchmarking e addestramento dei modelli

Per dimostrare l'efficacia di Karrierewege, il team ha condotto esperimenti utilizzando modelli esistenti all'avanguardia. Volevano vedere quanto bene questi modelli potessero prevedere i percorsi di carriera utilizzando il loro set di dati.

Hanno perfezionato i loro modelli insegnando loro a trovare connessioni tra percorsi di carriera e titoli di lavoro. I risultati sono stati promettenti! I modelli addestrati su Karrierewege hanno superato quelli addestrati su set di dati più piccoli. È come correre una maratona con le scarpe giuste rispetto a cercare di farlo con i flip-flop.

Prossimi passi e possibilità future

Ora che Karrierewege è disponibile, ci sono molte opportunità per ricerche future. Il set di dati potrebbe essere ampliato per includere dati di altre regioni e lingue. Questo lo renderebbe ancora più utile per le previsioni globali dei percorsi di carriera. Inoltre, potrebbero essere affrontate sfide come i cambi di carriera tra diversi settori per migliorare l'accuratezza.

Considerazioni etiche

Come per qualsiasi set di dati, ci sono considerazioni etiche da tenere a mente. Se il set di dati evidenzia troppo alcuni settori lavorativi, potrebbe portare a previsioni distorte. Ecco perché è importante monitorare e adattare continuamente i dati per garantire equità. Implementando misure per mitigare i pregiudizi, i creatori sperano di realizzare strumenti più equi per le previsioni di carriera.

Conclusione

Karrierewege e la sua versione migliorata, Karrierewege+, portano aria fresca nel campo della previsione dei percorsi di carriera. Offrendo un grande set di dati disponibile pubblicamente e collegato a una tassonomia standardizzata, aprono la strada a nuove ricerche e applicazioni. Man mano che questo set di dati viene utilizzato, si spera di vedere più persone navigare con successo le proprie carriere, come trovare il miglior percorso su una mappa.

Alla fine, che tu sia un cercatore di lavoro che cerca di capire la propria prossima mossa, un reclutatore in cerca di talento, o semplicemente un curioso spettatore, Karrierewege ha molto potenziale per fare previsioni educate sul futuro del lavoro. Quindi, alziamo un bicchiere virtuale al futuro della previsione dei percorsi di carriera-che sia luminoso e pieno di opportunità!

Fonte originale

Titolo: KARRIEREWEGE: A Large Scale Career Path Prediction Dataset

Estratto: Accurate career path prediction can support many stakeholders, like job seekers, recruiters, HR, and project managers. However, publicly available data and tools for career path prediction are scarce. In this work, we introduce KARRIEREWEGE, a comprehensive, publicly available dataset containing over 500k career paths, significantly surpassing the size of previously available datasets. We link the dataset to the ESCO taxonomy to offer a valuable resource for predicting career trajectories. To tackle the problem of free-text inputs typically found in resumes, we enhance it by synthesizing job titles and descriptions resulting in KARRIEREWEGE+. This allows for accurate predictions from unstructured data, closely aligning with real-world application challenges. We benchmark existing state-of-the-art (SOTA) models on our dataset and a prior benchmark and observe improved performance and robustness, particularly for free-text use cases, due to the synthesized data.

Autori: Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank

Ultimo aggiornamento: Dec 19, 2024

Lingua: English

URL di origine: https://arxiv.org/abs/2412.14612

Fonte PDF: https://arxiv.org/pdf/2412.14612

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili