Caminhos de Carreira: O Futuro da Previsão de Trajetórias Profissionais
Um novo conjunto de dados mudando a forma como a gente prevê movimentos na carreira.
Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank
― 7 min ler
Índice
- O que é o Karrierewege?
- O desafio dos Títulos de Trabalho e currículos
- Por que a previsão de carreira é importante
- Ligação com o ESCO
- Processo de criação do conjunto de dados
- Sintetizando dados
- Medidas de controle de qualidade
- Comparando com outros conjuntos de dados
- Benchmarking e treinamento de modelos
- Próximos passos e possibilidades futuras
- Considerações éticas
- Conclusão
- Fonte original
- Ligações de referência
No mundo da busca de emprego e recrutamento, prever pra onde uma pessoa pode ir na carreira pode ser complicado. É tipo tentar adivinhar o próximo movimento de dança de alguém que manda muito bem-pode te surpreender! A demanda por ferramentas que ajudam a prever mudanças de carreira tá crescendo, mas o problema é que a gente muitas vezes não tem todos os Dados que precisa. Ainda bem que um novo conjunto de dados chamado Karrierewege chegou pra ajudar.
O que é o Karrierewege?
Karrierewege é uma grande coleção de mais de 500.000 Caminhos de Carreira. Isso é muita mudança de carreira! Esse conjunto de dados é bem maior do que muitos outros por aí, tornando-se um recurso valioso pra quem precisa de informações sobre trajetórias de carreira. Os criadores ligaram essa coleção a um sistema de classificação europeu popular chamado ESCO. Fazendo isso, eles facilitam a compreensão e previsão de mudanças de emprego.
Títulos de Trabalho e currículos
O desafio dosUm problema comum no mercado de trabalho é que os currículos muitas vezes têm títulos de trabalho e descrições em texto livre. Pense nos currículos como um buffet; cada um tem um gosto diferente, e nem todo mundo serve o mesmo prato. Pra deixar as previsões mais precisas, os criadores do Karrierewege inventaram uma solução esperta. Eles geraram novos títulos de trabalho e descrições pra ajudar a preencher as lacunas. Isso é chamado de Karrierewege+. Com esses novos títulos e descrições sintéticas, fica muito mais fácil fazer previsões a partir do mix de informações que encontramos nos currículos da vida real.
Por que a previsão de carreira é importante
Prever caminhos de carreira é útil pra muita gente. Quem tá procurando emprego quer saber quais opções pode ter no futuro. Os recrutadores querem encontrar os melhores candidatos pra os empregos. Os departamentos de RH querem acompanhar as tendências da força de trabalho. Professores e treinadores podem procurar maneiras de ajudar os alunos a adquirirem as habilidades certas. Todos esses grupos podem se beneficiar de previsões melhores sobre carreiras.
Porém, o campo tem sido limitado pela disponibilidade de conjuntos de dados que mostrem histórias de carreira detalhadas. A maioria dos conjuntos de dados existentes é menor e não está disponível publicamente. Isso torna o lançamento do Karrierewege especialmente empolgante!
Ligação com o ESCO
A taxonomia do ESCO significa "Habilidades, Competências, Qualificações e Ocupações Europeias." Ela ajuda a padronizar os termos de trabalho e as habilidades no mercado de trabalho europeu. É tipo ter uma língua comum; isso pode tornar as conversas sobre empregos muito mais fáceis. O sistema ESCO inclui milhares de títulos de trabalho e habilidades em 28 idiomas diferentes. Então, quando os criadores do Karrierewege decidiram vincular seu conjunto de dados ao ESCO, eles realmente abriram muitas oportunidades para pesquisa e aplicação.
Processo de criação do conjunto de dados
Criar um conjunto de dados como o Karrierewege não é tarefa fácil! A equipe por trás disso usou currículos anônimos da Agência de Emprego Alemã como ponto de partida. Eles encontraram currículos de pessoas buscando emprego em vários setores. No entanto, como um chef experimentando a sopa, eles notaram que o conjunto de dados pode ter algumas tendências. Por exemplo, ele pode ter mais ênfase em setores com maior desemprego do que em outros, ou o contexto cultural pode estar mais voltado pra Alemanha.
Pra resolver isso, eles mapearam os títulos de trabalho dos currículos pros equivalentes no sistema ESCO. Esse mapeamento cuidadoso ajuda a garantir que os dados coletados sejam úteis e precisos.
Sintetizando dados
Uma das características marcantes do Karrierewege+ é o uso de dados sintéticos. Pra tornar o conjunto de dados mais robusto e útil, eles usaram grandes modelos de linguagem pra gerar novos títulos e descrições de trabalho. Imagine um chef inventando novas versões de receitas clássicas.
Eles usaram duas abordagens:
- Cada título de trabalho poderia ter até sete novas versões criadas. Essa abordagem visava diversificar o conjunto de dados.
- A sequência inteira de títulos de trabalho em um caminho de carreira poderia ser reescrita. Esse método visava contexto e coerência, como contar uma história que faz sentido do começo ao fim.
Usando esses métodos, os criadores buscaram enriquecer seu conjunto de dados, tornando-o ainda mais representativo do mundo real.
Medidas de controle de qualidade
Pra garantir que os novos dados fossem de alta qualidade, os desenvolvedores avaliaram os títulos de trabalho e as descrições com base em vários critérios. Eles analisaram:
- Correção: Os títulos são títulos de emprego reais que as pessoas realmente usam?
- Similaridade semântica: Os novos títulos transmitem um significado semelhante aos originais?
- Diversidade: Existem títulos únicos incluídos, ou é o mesmo título repetido várias vezes?
- Coerência: Os títulos se encaixam bem dentro de um caminho de carreira?
Pra testar essas qualidades, uma equipe de especialistas revisou manualmente amostras, e até uma IA foi chamada pra ajudar. Usar tanto avaliações humanas quanto de IA ajudou a fornecer uma visão completa da qualidade dos dados.
Comparando com outros conjuntos de dados
Já tem muitos conjuntos de dados disponíveis pra previsão de caminhos de carreira, mas a maioria é pequena e privada. Os dados do Karrierewege são muito maiores e oferecem uma chance melhor pros modelos aprenderem. Pense nisso como um grande buffet comparado a um lanchinho pequeno. Quanto mais dados você tem, melhor pode prever o que pode acontecer a seguir.
O Karrierewege tem mais títulos de trabalho únicos do que muitos conjuntos de dados menores. Ele também abrange uma gama mais ampla de setores, desde ocupações elementares até funções de serviço. Esse escopo amplo oferece uma melhor compreensão do mercado de trabalho.
Benchmarking e treinamento de modelos
Pra mostrar a eficácia do Karrierewege, a equipe realizou experimentos usando modelos existentes de última geração. Eles queriam ver quão bem esses modelos poderiam prever caminhos de carreira usando seu conjunto de dados.
Eles ajustaram seus modelos ensinando-os a encontrar conexões entre caminhos de carreira e títulos de trabalho. Os resultados foram promissores! Modelos treinados no Karrierewege superaram aqueles treinados em conjuntos de dados menores. É como correr uma maratona com o tênis certo em vez de tentar fazê-lo de chinelos.
Próximos passos e possibilidades futuras
Agora que o Karrierewege tá disponível, tem muitas oportunidades pra pesquisa futura. O conjunto de dados poderia ser ampliado pra incluir dados de outras regiões e idiomas. Isso tornaria ainda mais útil pra previsões de caminhos de carreira globais. Além disso, desafios como mudanças de carreira entre diferentes setores poderiam ser abordados pra melhorar a precisão.
Considerações éticas
Como em qualquer conjunto de dados, há considerações éticas a serem lembradas. Se o conjunto de dados destacar certos setores de trabalho demais, isso pode levar a previsões tendenciosas. Por isso, é importante monitorar e ajustar continuamente os dados pra garantir a justiça. Implementando medidas pra mitigar viés, os criadores esperam criar ferramentas mais equitativas pra previsões de carreira.
Conclusão
Karrierewege e sua versão aprimorada, Karrierewege+, trazem um ar fresco pro campo da previsão de caminhos de carreira. Ao oferecer um grande conjunto de dados disponível publicamente vinculado a uma taxonomia padronizada, eles abrem caminho pra novas pesquisas e aplicações. À medida que esse conjunto de dados for utilizado, a esperança é ver mais pessoas navegando com sucesso em suas carreiras, como encontrar a melhor rota em um mapa.
No final das contas, seja você um candidato a emprego tentando descobrir seu próximo passo, um recrutador em busca de talentos, ou apenas um curioso, o Karrierewege tem muito potencial pra fazer palpites educados sobre o futuro do trabalho. Então, vamos levantar um brinde virtual pro futuro da previsão de caminhos de carreira-que seja brilhante e cheio de oportunidades!
Título: KARRIEREWEGE: A Large Scale Career Path Prediction Dataset
Resumo: Accurate career path prediction can support many stakeholders, like job seekers, recruiters, HR, and project managers. However, publicly available data and tools for career path prediction are scarce. In this work, we introduce KARRIEREWEGE, a comprehensive, publicly available dataset containing over 500k career paths, significantly surpassing the size of previously available datasets. We link the dataset to the ESCO taxonomy to offer a valuable resource for predicting career trajectories. To tackle the problem of free-text inputs typically found in resumes, we enhance it by synthesizing job titles and descriptions resulting in KARRIEREWEGE+. This allows for accurate predictions from unstructured data, closely aligning with real-world application challenges. We benchmark existing state-of-the-art (SOTA) models on our dataset and a prior benchmark and observe improved performance and robustness, particularly for free-text use cases, due to the synthesized data.
Autores: Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank
Última atualização: 2024-12-19 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2412.14612
Fonte PDF: https://arxiv.org/pdf/2412.14612
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://esco.ec.europa.eu/en/about-esco/what-esco
- https://esco.ec.europa.eu/en/about-esco/esco-stakeholders
- https://huggingface.co/datasets/ElenaSenger/Karrierewege
- https://huggingface.co/datasets/ElenaSenger/Karrierewege_plus
- https://www.arbeitsagentur.de/bewerberboerse/
- https://web.arbeitsagentur.de/berufenet/
- https://esco.ec.europa.eu/en/about-esco/escopedia/escopedia/international-standard-classification-occupations-isco
- https://statistik.arbeitsagentur.de/DE/Statischer-Content/Grundlagen/Klassifikationen/Klassifikation-der-Berufe/KldB2010-Fassung2020/Arbeitsmittel/Umschluesselungstabellen.html
- https://huggingface.co/sentence-transformers/distiluse-base-multilingual-cased-v2
- https://huggingface.co/sentence-transformers/all-mpnet-base-v2