Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computação e linguagem

Caminhos de Carreira: O Futuro da Previsão de Trajetórias Profissionais

Um novo conjunto de dados mudando a forma como a gente prevê movimentos na carreira.

Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank

― 7 min ler


Caminhos de Carreira:Caminhos de Carreira:Previsão de Carreiraspara previsões de carreira.Um conjunto de dados que muda o jogo
Índice

No mundo da busca de emprego e recrutamento, prever pra onde uma pessoa pode ir na carreira pode ser complicado. É tipo tentar adivinhar o próximo movimento de dança de alguém que manda muito bem-pode te surpreender! A demanda por ferramentas que ajudam a prever mudanças de carreira tá crescendo, mas o problema é que a gente muitas vezes não tem todos os Dados que precisa. Ainda bem que um novo conjunto de dados chamado Karrierewege chegou pra ajudar.

O que é o Karrierewege?

Karrierewege é uma grande coleção de mais de 500.000 Caminhos de Carreira. Isso é muita mudança de carreira! Esse conjunto de dados é bem maior do que muitos outros por aí, tornando-se um recurso valioso pra quem precisa de informações sobre trajetórias de carreira. Os criadores ligaram essa coleção a um sistema de classificação europeu popular chamado ESCO. Fazendo isso, eles facilitam a compreensão e previsão de mudanças de emprego.

O desafio dos Títulos de Trabalho e currículos

Um problema comum no mercado de trabalho é que os currículos muitas vezes têm títulos de trabalho e descrições em texto livre. Pense nos currículos como um buffet; cada um tem um gosto diferente, e nem todo mundo serve o mesmo prato. Pra deixar as previsões mais precisas, os criadores do Karrierewege inventaram uma solução esperta. Eles geraram novos títulos de trabalho e descrições pra ajudar a preencher as lacunas. Isso é chamado de Karrierewege+. Com esses novos títulos e descrições sintéticas, fica muito mais fácil fazer previsões a partir do mix de informações que encontramos nos currículos da vida real.

Por que a previsão de carreira é importante

Prever caminhos de carreira é útil pra muita gente. Quem tá procurando emprego quer saber quais opções pode ter no futuro. Os recrutadores querem encontrar os melhores candidatos pra os empregos. Os departamentos de RH querem acompanhar as tendências da força de trabalho. Professores e treinadores podem procurar maneiras de ajudar os alunos a adquirirem as habilidades certas. Todos esses grupos podem se beneficiar de previsões melhores sobre carreiras.

Porém, o campo tem sido limitado pela disponibilidade de conjuntos de dados que mostrem histórias de carreira detalhadas. A maioria dos conjuntos de dados existentes é menor e não está disponível publicamente. Isso torna o lançamento do Karrierewege especialmente empolgante!

Ligação com o ESCO

A taxonomia do ESCO significa "Habilidades, Competências, Qualificações e Ocupações Europeias." Ela ajuda a padronizar os termos de trabalho e as habilidades no mercado de trabalho europeu. É tipo ter uma língua comum; isso pode tornar as conversas sobre empregos muito mais fáceis. O sistema ESCO inclui milhares de títulos de trabalho e habilidades em 28 idiomas diferentes. Então, quando os criadores do Karrierewege decidiram vincular seu conjunto de dados ao ESCO, eles realmente abriram muitas oportunidades para pesquisa e aplicação.

Processo de criação do conjunto de dados

Criar um conjunto de dados como o Karrierewege não é tarefa fácil! A equipe por trás disso usou currículos anônimos da Agência de Emprego Alemã como ponto de partida. Eles encontraram currículos de pessoas buscando emprego em vários setores. No entanto, como um chef experimentando a sopa, eles notaram que o conjunto de dados pode ter algumas tendências. Por exemplo, ele pode ter mais ênfase em setores com maior desemprego do que em outros, ou o contexto cultural pode estar mais voltado pra Alemanha.

Pra resolver isso, eles mapearam os títulos de trabalho dos currículos pros equivalentes no sistema ESCO. Esse mapeamento cuidadoso ajuda a garantir que os dados coletados sejam úteis e precisos.

Sintetizando dados

Uma das características marcantes do Karrierewege+ é o uso de dados sintéticos. Pra tornar o conjunto de dados mais robusto e útil, eles usaram grandes modelos de linguagem pra gerar novos títulos e descrições de trabalho. Imagine um chef inventando novas versões de receitas clássicas.

Eles usaram duas abordagens:

  1. Cada título de trabalho poderia ter até sete novas versões criadas. Essa abordagem visava diversificar o conjunto de dados.
  2. A sequência inteira de títulos de trabalho em um caminho de carreira poderia ser reescrita. Esse método visava contexto e coerência, como contar uma história que faz sentido do começo ao fim.

Usando esses métodos, os criadores buscaram enriquecer seu conjunto de dados, tornando-o ainda mais representativo do mundo real.

Medidas de controle de qualidade

Pra garantir que os novos dados fossem de alta qualidade, os desenvolvedores avaliaram os títulos de trabalho e as descrições com base em vários critérios. Eles analisaram:

  • Correção: Os títulos são títulos de emprego reais que as pessoas realmente usam?
  • Similaridade semântica: Os novos títulos transmitem um significado semelhante aos originais?
  • Diversidade: Existem títulos únicos incluídos, ou é o mesmo título repetido várias vezes?
  • Coerência: Os títulos se encaixam bem dentro de um caminho de carreira?

Pra testar essas qualidades, uma equipe de especialistas revisou manualmente amostras, e até uma IA foi chamada pra ajudar. Usar tanto avaliações humanas quanto de IA ajudou a fornecer uma visão completa da qualidade dos dados.

Comparando com outros conjuntos de dados

Já tem muitos conjuntos de dados disponíveis pra previsão de caminhos de carreira, mas a maioria é pequena e privada. Os dados do Karrierewege são muito maiores e oferecem uma chance melhor pros modelos aprenderem. Pense nisso como um grande buffet comparado a um lanchinho pequeno. Quanto mais dados você tem, melhor pode prever o que pode acontecer a seguir.

O Karrierewege tem mais títulos de trabalho únicos do que muitos conjuntos de dados menores. Ele também abrange uma gama mais ampla de setores, desde ocupações elementares até funções de serviço. Esse escopo amplo oferece uma melhor compreensão do mercado de trabalho.

Benchmarking e treinamento de modelos

Pra mostrar a eficácia do Karrierewege, a equipe realizou experimentos usando modelos existentes de última geração. Eles queriam ver quão bem esses modelos poderiam prever caminhos de carreira usando seu conjunto de dados.

Eles ajustaram seus modelos ensinando-os a encontrar conexões entre caminhos de carreira e títulos de trabalho. Os resultados foram promissores! Modelos treinados no Karrierewege superaram aqueles treinados em conjuntos de dados menores. É como correr uma maratona com o tênis certo em vez de tentar fazê-lo de chinelos.

Próximos passos e possibilidades futuras

Agora que o Karrierewege tá disponível, tem muitas oportunidades pra pesquisa futura. O conjunto de dados poderia ser ampliado pra incluir dados de outras regiões e idiomas. Isso tornaria ainda mais útil pra previsões de caminhos de carreira globais. Além disso, desafios como mudanças de carreira entre diferentes setores poderiam ser abordados pra melhorar a precisão.

Considerações éticas

Como em qualquer conjunto de dados, há considerações éticas a serem lembradas. Se o conjunto de dados destacar certos setores de trabalho demais, isso pode levar a previsões tendenciosas. Por isso, é importante monitorar e ajustar continuamente os dados pra garantir a justiça. Implementando medidas pra mitigar viés, os criadores esperam criar ferramentas mais equitativas pra previsões de carreira.

Conclusão

Karrierewege e sua versão aprimorada, Karrierewege+, trazem um ar fresco pro campo da previsão de caminhos de carreira. Ao oferecer um grande conjunto de dados disponível publicamente vinculado a uma taxonomia padronizada, eles abrem caminho pra novas pesquisas e aplicações. À medida que esse conjunto de dados for utilizado, a esperança é ver mais pessoas navegando com sucesso em suas carreiras, como encontrar a melhor rota em um mapa.

No final das contas, seja você um candidato a emprego tentando descobrir seu próximo passo, um recrutador em busca de talentos, ou apenas um curioso, o Karrierewege tem muito potencial pra fazer palpites educados sobre o futuro do trabalho. Então, vamos levantar um brinde virtual pro futuro da previsão de caminhos de carreira-que seja brilhante e cheio de oportunidades!

Fonte original

Título: KARRIEREWEGE: A Large Scale Career Path Prediction Dataset

Resumo: Accurate career path prediction can support many stakeholders, like job seekers, recruiters, HR, and project managers. However, publicly available data and tools for career path prediction are scarce. In this work, we introduce KARRIEREWEGE, a comprehensive, publicly available dataset containing over 500k career paths, significantly surpassing the size of previously available datasets. We link the dataset to the ESCO taxonomy to offer a valuable resource for predicting career trajectories. To tackle the problem of free-text inputs typically found in resumes, we enhance it by synthesizing job titles and descriptions resulting in KARRIEREWEGE+. This allows for accurate predictions from unstructured data, closely aligning with real-world application challenges. We benchmark existing state-of-the-art (SOTA) models on our dataset and a prior benchmark and observe improved performance and robustness, particularly for free-text use cases, due to the synthesized data.

Autores: Elena Senger, Yuri Campbell, Rob van der Goot, Barbara Plank

Última atualização: 2024-12-19 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2412.14612

Fonte PDF: https://arxiv.org/pdf/2412.14612

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes