Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Apprendimento automatico# Intelligenza artificiale

Presentiamo Job-SDF: Un Nuovo Dataset per Prevedere la Domanda di Competenze

Job-SDF offre spunti sulle richieste di competenze in evoluzione nel mercato del lavoro di oggi.

― 10 leggere min


Job-SDF: Mappare leJob-SDF: Mappare letendenze nella domanda dicompetenzeesigenze di competenze lavorative.Nuovo set di dati aiuta a prevedere le
Indice

Nel mercato del lavoro di oggi, sapere quali Competenze sono necessarie è davvero importante per le Aziende, chi cerca lavoro e i politici. Essere in grado di prevedere queste esigenze di competenze aiuta tutti a prepararsi ai cambiamenti nel mondo del lavoro. Questo permette di avere programmi di formazione migliori e assicura che le persone abbiano le competenze giuste per avere successo nei loro lavori. Con l'evoluzione dei lavori, è necessario avere dati che riflettano accuratamente questi cambiamenti. Sfortunatamente, non c'è mai stato un dataset completo che tracciasse le richieste di competenze nel tempo, il che rende difficile studiare e migliorare quest'area. Per affrontare questo problema, abbiamo creato un nuovo dataset chiamato Job-SDF.

Che cos'è Job-SDF?

Job-SDF sta per Job Skill Demand Forecasting. È un dataset creato da oltre 10 milioni di annunci di lavoro raccolti da importanti piattaforme di recruitment online in Cina, in un periodo che va dal 2021 al 2023. Questo dataset contiene informazioni sulla domanda di varie competenze in molte aziende e professioni. Si concentra su 2.324 competenze diverse, suddivise in 52 professioni provenienti da 521 aziende diverse. I dati sono organizzati mensilmente per dare una chiara visione di come cambia la domanda di competenze nel tempo.

Importanza della Previsione della Domanda di Competenze

Essere in grado di prevedere quali competenze saranno richieste aiuta le aziende e le organizzazioni a prepararsi per il futuro. Ad esempio, se un'azienda tecnologica vede che le competenze in intelligenza artificiale diventano popolari, può iniziare a formare i propri dipendenti di conseguenza. Queste informazioni sono utili anche per le istituzioni educative. Possono adattare i loro programmi per assicurarsi che gli studenti stiano imparando le competenze di cui avranno bisogno nel mercato del lavoro. Di conseguenza, ciò contribuisce alla crescita economica, poiché le aziende possono trovare il talento di cui hanno bisogno e gli individui possono ottenere lavori migliori.

Sfide nell'Analisi della Domanda di Competenze

Prima della creazione del dataset Job-SDF, l'analisi della domanda di competenze si basava spesso su sondaggi e altri metodi che richiedevano tempo, che fornivano solo un'istantanea di una specifica azienda o tipo di lavoro. Con l'aumento degli annunci di lavoro online, ora c'è una grande quantità di dati sugli annunci di lavoro disponibili. Tuttavia, molti studi passati non hanno reso pubblici i loro dataset, rendendo difficile per i ricercatori replicare i loro risultati o costruire sul loro lavoro.

Inoltre, gli studi esistenti si sono spesso concentrati su una particolare professione, trascurando le tendenze in diversi settori o aree geografiche. Questa visione limitata ostacola la creazione di strategie efficaci per lo sviluppo della forza lavoro e la formazione delle competenze.

Comprendere le Competenze Professionali

Le competenze professionali sono generalmente suddivise in due categorie: competenze tecniche e competenze trasversali. Le competenze tecniche includono abilità tecniche, come programmazione o pensiero analitico. Le competenze trasversali, d'altra parte, comprendono tratti più "soft" come comunicazione, lavoro di squadra e adattabilità. Entrambi i tipi di competenze sono cruciali per avere successo nel lavoro.

La sfida nella previsione della domanda di competenze sta nel tenere traccia accuratamente di come queste competenze cambiano nel tempo. Ad esempio, una competenza che è importante oggi potrebbe non essere più rilevante in futuro. Allo stesso modo, potrebbero emergere nuove competenze che richiedono attenzione immediata.

Lavori nell'Era Digitale

Negli ultimi anni, il panorama lavorativo è cambiato drasticamente a causa dei progressi nella tecnologia e di Internet. Gli annunci di lavoro sono passati a piattaforme online, dove le aziende pubblicano ora le offerte di lavoro. Questo ha creato una grande quantità di dati che possono essere analizzati per comprendere le tendenze della domanda di competenze. Utilizzando efficacemente i dati disponibili, i ricercatori e le aziende possono prevedere quali competenze saranno necessarie in futuro.

Il dataset Job-SDF fornisce preziose informazioni su queste tendenze analizzando annunci di lavoro pubblici su un periodo specifico. Permette una visione più completa di come le domande di competenze variano non solo per tipo di lavoro, ma anche per azienda e regione.

Metodologia di Creazione del Dataset

Per creare il dataset Job-SDF, abbiamo prima raccolto annunci di lavoro da importanti piattaforme di recruitment online in Cina. Ci siamo concentrati su 52 professioni diverse e abbiamo raccolto annunci da 521 aziende diverse. Dopo aver rimosso le voci duplicate, abbiamo ottenuto circa 10,35 milioni di annunci di lavoro unici.

Successivamente, abbiamo esaminato le descrizioni dei lavori per estrarre le competenze richieste. Utilizzando un metodo chiamato Riconoscimento di Entità Nominate (NER), abbiamo identificato i termini di competenza menzionati nei requisiti di lavoro. Questo ci ha permesso di compilare un dizionario delle competenze che include oltre 2.300 competenze distinte utilizzate negli annunci di lavoro.

Il dataset è stato quindi organizzato per mostrare la domanda mensile di competenze per vari lavori, aziende e regioni. Questo approccio strutturato rende più facile analizzare e confrontare le domande di competenze nel tempo.

Stima della Domanda di Competenze

Stimare la domanda di competenze implica tenere traccia di quanto spesso compaiono competenze specifiche negli annunci di lavoro nel tempo. Questo può essere fatto contando quanti annunci richiedono una certa competenza durante un determinato periodo. Il dataset Job-SDF ci consente non solo di osservare la domanda di competenze per tipo di lavoro, ma anche di analizzarla ulteriormente per diverse aziende e aree geografiche.

Questa capacità è essenziale per capire quali competenze stanno diventando più o meno importanti. Suddividendo i dati in questo modo, diventa possibile identificare tendenze che possono informare programmi di formazione e istruzione, garantendo così che la forza lavoro sia ben preparata per le esigenze future.

Compiti di Previsione della Domanda di Competenze

Il dataset Job-SDF fornisce una piattaforma per vari compiti di previsione. Possiamo studiare come cambia la domanda di alcune competenze nel tempo esaminando i dati storici e costruendo modelli predittivi.

Stabilendo parametri basati sui dati dei mesi precedenti, possiamo creare modelli di previsione che anticipano la domanda di competenze nei mesi a venire. Questa capacità predittiva è cruciale per le organizzazioni e gli educatori che mirano ad allineare i loro sforzi formativi con le esigenze del mercato.

Analisi della Variabilità della Domanda di Competenze

Il dataset rivela che la domanda di competenze tende a seguire una distribuzione a lungo termine. Questo significa che mentre alcune competenze sono molto richieste, molte altre sono necessarie solo per un numero limitato di annunci di lavoro. Ad esempio, competenze altamente specializzate possono essere rilevanti solo per alcune posizioni.

Quando si valutano i modelli di previsione, è importante considerare questa variabilità. Le metriche tradizionali potrebbero non riflettere accuratamente quanto bene i modelli prevedono la domanda per competenze meno comuni. Pertanto, è necessario utilizzare una gamma diversificata di metriche di valutazione che tengano conto di questa natura a lungo termine della domanda di competenze.

Impatto dei Cambiamenti Strutturali

Con i cambiamenti del mercato del lavoro, alcune competenze possono diventare più o meno rilevanti, portando a spostamenti nei modelli di domanda. Questo fenomeno è noto come rottura strutturale. Queste rotture possono influenzare l'efficacia dei modelli di previsione. Ad esempio, una competenza che vede improvvisamente un’impennata nella domanda potrebbe non essere prevista accuratamente da modelli che non tengono conto di questi cambiamenti.

Utilizzando il test di Chow, possiamo identificare dove si verificano queste rotture strutturali e analizzare come influenzano l'accuratezza delle previsioni. Questa analisi è cruciale per affinare i nostri metodi di previsione e migliorare l'affidabilità delle previsioni.

Interdipendenze tra Competenze

Quando si prevede la domanda di competenze, è utile considerare le relazioni tra diverse competenze. Ad esempio, se due competenze sono spesso richieste insieme negli annunci di lavoro, questa interdipendenza può aiutare a migliorare l'accuratezza delle previsioni. Il dataset Job-SDF ci consente di indagare su queste relazioni e di incorporarle nei nostri modelli di previsione.

Esaminando come le competenze interagiscono, possiamo creare una visione più olistica delle esigenze lavorative. Questa comprensione è critica poiché le aziende cercano spesso candidati che possiedano un mix di più competenze piuttosto che solo una.

Benchmarking dei Modelli Utilizzando Job-SDF

Per valutare le prestazioni di diversi modelli di previsione, abbiamo sperimentato con diversi approcci utilizzando il dataset Job-SDF. Abbiamo esaminato modelli statistici come ARIMA, modelli basati su RNN, modelli basati su Transformer e altri.

Ogni modello è stato valutato in base alla sua capacità di prevedere accuratamente le richieste future di competenze. Abbiamo utilizzato diverse metriche come l'Errore Assoluto Medio (MAE) e l'Errore Quadratico Medio (RMSE) per misurare le prestazioni. Confrontando i risultati, possiamo identificare quali modelli sono più efficaci per determinati tipi di compiti di previsione della domanda di competenze.

Risultati dei Modelli di Previsione

I risultati delle prestazioni hanno mostrato che alcuni modelli eccellevano nella previsione della domanda generale di competenze, mentre altri erano più adatti per granualità specifiche, come le domande occupazionali o regionali. Ad esempio, alcuni metodi statistici tradizionali hanno avuto difficoltà con le relazioni complesse nei dati, mentre modelli più avanzati come i Transformer hanno dimostrato risultati migliori nel catturare tendenze a lungo termine.

In generale, le nostre scoperte evidenziano i punti di forza e di debolezza di vari modelli, aprendo la strada a future ricerche e miglioramenti nell'area della previsione della domanda di competenze.

Sfide nella Previsione delle Competenze a Bassa Domanda

Mentre comprendere i modelli di domanda di competenze per quelle ad alta domanda è relativamente semplice, prevedere le tendenze per competenze a bassa domanda presenta una sfida maggiore. Molte competenze a bassa domanda potrebbero non comparire abbastanza frequentemente negli annunci di lavoro per fornire dati affidabili per previsioni accurate.

Per affrontare questo problema, abbiamo esplorato diversi modelli progettati specificamente per gestire queste competenze a bassa frequenza. I risultati hanno mostrato notevoli variazioni nelle prestazioni, indicando che mentre alcuni modelli possono gestire la previsione delle competenze a bassa domanda, altri sono meno efficaci.

Integrazione delle Relazioni di Co-Occorrenza

Per migliorare i nostri modelli di previsione, abbiamo sviluppato un grafo di co-occorrenza delle competenze basato sui dati di addestramento. Questo grafo cattura quanto spesso le competenze sono menzionate insieme negli annunci di lavoro. Incorporando queste informazioni nei nostri modelli, possiamo migliorare l'accuratezza delle previsioni.

Il grafo di co-occorrenza ci consente di comprendere come le competenze interagiscono e dipendono l'una dall'altra. Questa comprensione supporta modelli di previsione più efficaci che tengono conto delle relazioni tra le competenze, piuttosto che trattarle come variabili isolate.

Direzioni Future per la Ricerca sulla Domanda di Competenze

La ricerca nella previsione della domanda di competenze è ancora in evoluzione. Il dataset Job-SDF apre molte strade per ulteriori studi. La ricerca futura può concentrarsi sul perfezionamento dei modelli di previsione, sul miglioramento dei metodi di raccolta dei dati e sull'esplorazione di diverse granularità della domanda di competenze.

Aggiornando e ampliando continuamente dataset come Job-SDF, i ricercatori possono rimanere allineati con il mercato del lavoro in rapido cambiamento. Comprendere queste dinamiche è fondamentale per equipaggiare sia i lavoratori attuali che quelli futuri con le competenze di cui hanno bisogno per prosperare.

Conclusione

Il dataset Job-SDF rappresenta un significativo avanzamento nel campo della previsione della domanda di competenze. Fornendo una visione completa delle richieste di competenze lavorative nel tempo, consente a imprese, educatori e politici di prendere decisioni informate.

Con l'evoluzione continua del mercato del lavoro, la necessità di previsioni accurate sulle richieste di competenze crescerà sempre di più. Le intuizioni ottenute dall'analisi del dataset Job-SDF possono giocare un ruolo fondamentale nel preparare la forza lavoro per le sfide e le opportunità future.

Fonte originale

Titolo: Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking

Estratto: In a rapidly evolving job market, skill demand forecasting is crucial as it enables policymakers and businesses to anticipate and adapt to changes, ensuring that workforce skills align with market needs, thereby enhancing productivity and competitiveness. Additionally, by identifying emerging skill requirements, it directs individuals towards relevant training and education opportunities, promoting continuous self-learning and development. However, the absence of comprehensive datasets presents a significant challenge, impeding research and the advancement of this field. To bridge this gap, we present Job-SDF, a dataset designed to train and benchmark job-skill demand forecasting models. Based on 10.35 million public job advertisements collected from major online recruitment platforms in China between 2021 and 2023, this dataset encompasses monthly recruitment demand for 2,324 types of skills across 521 companies. Our dataset uniquely enables evaluating skill demand forecasting models at various granularities, including occupation, company, and regional levels. We benchmark a range of models on this dataset, evaluating their performance in standard scenarios, in predictions focused on lower value ranges, and in the presence of structural breaks, providing new insights for further research. Our code and dataset are publicly accessible via the https://github.com/Job-SDF/benchmark.

Autori: Xi Chen, Chuan Qin, Chuyu Fang, Chao Wang, Chen Zhu, Fuzhen Zhuang, Hengshu Zhu, Hui Xiong

Ultimo aggiornamento: 2024-11-30 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2406.11920

Fonte PDF: https://arxiv.org/pdf/2406.11920

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili