機械学習を使った社員の職務変動予測
機械学習を使って社員の職務変更を予測し、より良い人事計画を立てる。
― 1 分で読む
目次
多くの会社は、社員が新しい仕事を探すのか、今の職場に留まるのか知りたいと思ってる。このスキルは人事部門がより良く計画し、才能を維持するのに役立つんだ。この記事では、社員が転職するかどうかを予測するために機械学習(ML)を使うことについて話すよ。
問題の理解
転職することを選ぶのは簡単じゃない。人々は、より良い給料や興味深い役割など、さまざまな理由で新しい機会を探すことがある。良い職の変化は成功したキャリアを築くのを助けることができる。私たちの目標は、機械学習を使って社員が新しい仕事を探すかどうかを正確に予測することだよ。
データの準備
機械学習を使う前に、データを準備する必要がある。これは、データをクリーンにして、機械が使えるフォーマットに変えることを意味する。私たちが使ったデータは公開された人事リソースからのもので、10の重要な特徴がある。これらの特徴には:
- 都市開発指数
- 性別
- 関連する経験
- 入学した大学
- 教育レベル
- 専攻分野
- 総経験年数
- 会社のサイズ
- 目標(誰かが転職したいかどうかを示す)
社員は転職したいグループとしたくないグループの2つに分けられる。
カテゴリ変数の処理
データの中には数値がない特徴もある。例えば、性別はカテゴリーであって数字じゃない。多くの機械学習アルゴリズムは、カテゴリを数字に変えないと利用できない。これをする方法はいくつかある:
ワンホットエンコーディング:この方法では、各カテゴリーを別々のバイナリ(0または1)のカラムに変える。例えば、性別は男性用と女性用の2つのカラムに変えられる。
カテゴリの減少:オプションが多いカテゴリは、似たものをグループ化すると便利。例えば、もし市区町村があったら、それを広い地域にまとめることができる。
インパクトエンコーディング:この方法では、カテゴリと対象変数の関係を使う。結果との関連に基づいて、各カテゴリーの価値を決定する。
埋め込み方法:このテクニックは、ディープラーニングを使ってカテゴリを小さな数値表現に変える。データを管理しやすくしたり、処理しやすくすることができる。
不均衡データの対処
多くの場合、持っているデータは不均衡だ。例えば、転職を望まない人が転職を望む人よりも圧倒的に多いことがある。この不均衡は、機械の予測精度に悪影響を与えることがある。
これを解決するために、次のようなテクニックを使うことができる:
オーバーサンプリング:これは、マイノリティグループ(新しい仕事を探している人)からさらに例を作ることを含む。
アンダーサンプリング:これは、マジョリティグループ(新しい仕事を探していない人)の例を減らすことを含む。
オーバーサンプリングを使うことで機械の予測精度が向上することがあるが、オーバーフィッティングのような問題が起こることもある。
モデルの構築
データの準備ができたら、モデルを作成することができる。いくつかの機械学習アルゴリズムを使うよ:
ロジスティック回帰(LR):このアプローチは、さまざまな変数とターゲット変数の関係を特定の数学的関数を使って調べる。
決定木(DT):これは、特定のルールに基づいてデータを分割しながら予測するシンプルなモデル。
ランダムフォレスト(RF):この方法は、多くの決定木を組み合わせて予測精度を向上させる。
XGBoost:この高度な技術は、ブースティングと呼ばれる手法を使って、データを並行処理しながら予測を改善する。
モデルの評価
モデルがうまく機能しているか確認するために、パフォーマンスを評価する必要がある。いくつかの重要な指標を見ていくつもある:
混同行列:これで、モデルのパフォーマンスを確認し、正確な予測と不正確な予測の数が示される。
適合率と再現率:適合率は選ばれた項目の中でどれだけ関連性があったかを示し、再現率は関連する項目がどれだけ選ばれたかを示す。
精度:これは、モデルが全体的にどれだけ正しい予測をするかを示す。
結果
モデルを実行した後、SMOTE(合成マイノリティオーバーサンプリング技術)という手法を使うことで、予測が大きく改善された。これによりデータセットがバランスされ、私たちのロジスティック回帰モデルがすべてのモデルの中で一番良く機能した。
パフォーマンスは、SMOTE-LRモデルが最高の再現率と精度を持っていることを示した。つまり、転職を希望している人を特に見つけるのが得意だったんだ。
結論
この研究では、機械学習を使って転職を予測することに集中した。データの準備からモデルの構築、評価までいくつかのステップを経てきた。私たちの結果は、機械学習が人事部門が転職を考えている社員を特定するのに有効に役立つことを示した。
今後の作業
将来的には、畳み込みニューラルネットワークのようなディープラーニング技術を使用して、転職予測能力をさらに向上させるつもり。もっと高度なモデルを使うことで、より良い結果を達成し、人事チームに貴重な洞察を提供できることを願っているよ。
タイトル: Let's Predict Who Will Move to a New Job
概要: Any company's human resources department faces the challenge of predicting whether an applicant will search for a new job or stay with the company. In this paper, we discuss how machine learning (ML) is used to predict who will move to a new job. First, the data is pre-processed into a suitable format for ML models. To deal with categorical features, data encoding is applied and several MLA (ML Algorithms) are performed including Random Forest (RF), Logistic Regression (LR), Decision Tree (DT), and eXtreme Gradient Boosting (XGBoost). To improve the performance of ML models, the synthetic minority oversampling technique (SMOTE) is used to retain them. Models are assessed using decision support metrics such as precision, recall, F1-Score, and accuracy.
著者: Rania Mkhinini Gahar, Adel Hidri, Minyar Sassi Hidri
最終更新: 2023-09-15 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2309.08333
ソースPDF: https://arxiv.org/pdf/2309.08333
ライセンス: https://creativecommons.org/publicdomain/zero/1.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。