Simple Science

最先端の科学をわかりやすく解説

# 統計学# 機械学習# アプリケーション# その他の統計学

高校のスキルがイタリアの大学選びにどう影響するか

イタリアの大学入学における学力の影響を調査中。

― 1 分で読む


高校のスキルと大学の選択肢高校のスキルと大学の選択肢る。イタリアの大学入学に対する学術的影響を探
目次

この記事は、イタリアの高校生の数学とイタリア語のスキルが大学入学選択にどう影響するか、特にSTEM(科学、技術、工学、数学)分野について見てるよ。科学的背景を持つ学生と人文学的背景の学生を分けて考えることで、特定の分野を選ぶ理由を見つけるための有益な洞察が得られるんだ。この研究は、教育における性別の違いや、教育経験や選択における性別の違いも調べてる。

私たちは、予測を行うために勾配ブースティングという機械学習の方法を使ってる。これは、データの複雑な関係を理解するのにすごく正確で良いアプローチなんだ。また、様々な社会的・人口統計的要因や、過去の教育での成績も考慮してるんだ。私たちの結果は、過去の学業成績に基づいて明確な入学選択の違いがあることを示してる。学業のスキル、性別、高校の背景が学生の大学選択にどう影響するかを明らかにすることを目指してる。この研究は、教育政策やさらなる研究に影響を与える可能性があるよ。

第二次世界大戦後の教育の状況

第二次世界大戦の終わり以降、教育は世界中で大幅に拡大して、すべてのレベルで教育の機会が増えたんだ。この成長は、民主的な価値を促進し、教育の不平等を減らすのに役立つと期待されてた。でも、進展があったにもかかわらず、異なる社会グループ間で教育の成果にギャップが見られるんだ。

研究の重要な焦点の一つは、性別が教育の選択に与える影響、特に高等教育におけるものだよ。例えば、アメリカの研究では、女の子は男の子よりも読解が得意で、学年を進むのが早く、留年が少ないことが示されてる。女の子はまた、高校で学業プログラムを選び、高等教育を目指す傾向が強いんだ。

女子教育の改善が進んできたにもかかわらず、学習分野での性別の分離を減らす進展はあまり見られない。研究によれば、人文学と科学の分野の間で顕著な違いが見られ、STEM分野では女性が少数派なんだ。2020年の注目すべき統計では、OECD諸国において、新しいSTEM学士プログラムの入学者のうち、女性はわずか31%だった。こうしたパターンは世界中で見られ、教育における性別の分離を続ける構造的な障壁を示してる。

研究は、男の子と女の子の間で異なる教育の選択をもたらす個別の要因や外部の影響を特定することを目指してる。特に、女性のロールモデルが不足していることや、社会的なステレオタイプや教師や仲間からの影響によって女の子がSTEMキャリアに対してプレッシャーを感じることに注目が集まってる。他の研究では、過去の教育の成功が大学での特定の分野を選ぶ決定にどう影響するかに焦点を当ててる。

教育における性別に影響を与える要因には、一次効果と二次効果の2つの主なカテゴリがある。一次効果は、男性と女性が持つ態度から生じるパフォーマンスと成果の違いに関連してる。二次効果は、親、教師、学生が性別に基づいて成功の可能性についてどのように考えたり期待したりしているかに関わる。

イタリアの教育システムからの洞察

イタリアに焦点を当てると、国立統計局のデータが、他の欧州諸国と比較してSTEM分野の参加において重要なギャップを強調してる。2021年には、イタリアの卒業生のうち、STEM卒業生はわずか24.7%で、フランスは26.8%、スペインは27.5%、ドイツは32.2%だった。特に、女性は男性よりもSTEM分野への参加がかなり低い:高等教育を受けた100人の女性のうち、STEMを専攻したのはわずか15人で、男性は33人だった。

国際的な研究は、教育の違いの複雑な構造を考慮したモデルの必要性を強調してる。多くの伝統的な統計モデルがこれらの違いを分析するために使用されてきたが、最近では厳密な仮定なしに複雑で多様なデータを扱える柔軟な機械学習モデルがシフトしてきた。これらのモデルは、大規模なデータセットを処理し、多様なデータのトレンドに適応できる。

研究の目標

私たちの研究は、高校の背景がイタリアにおける大学の入学選択にどう影響するかを調べることを目指してる。特に、過去の教育成績が男女の大学入学や特定の学問分野の選択にどう影響するかに関心があるんだ。また、数学とイタリア語で優れた成績を収めた学生を見て、彼らの学問選択におけるさらなる違いを特定することを目指している。この研究は、学業の成功を駆動する要因を理解する手がかりを提供し、教育における性別の違いを理解するのに貢献できる。

この研究を行うために、私たちはイタリアの2つの行政ソースからデータを使ってる:大学と研究省とINVALSI。この組み合わされたデータセットは、高校最後の年から大学の最初の年までの学生を追跡する。

記事の構造

この記事はいくつかのセクションに分かれてる。最初のセクションは、STEMにおける性別の違いに関する過去の研究をレビューしてる。次のセクションは、研究で使用したデータを説明してる。3番目のセクションでは、適用した方法をアウトラインしてる。4番目のセクションは探索的分析を紹介し、最後のセクションでは勾配ブースティングモデルの結果について議論してる。

文献レビュー

このセクションでは、STEMにおける性別のギャップに関する国際的な文献をレビューしてる、特にイタリアに焦点を当ててる。多くの文献は、数学における学生のパフォーマンスに中心を置いていて、全体的な学業スキルと数学の能力が大学のSTEMプログラムに入るために重要であることを示唆してる。高等教育における性別のギャップは、学生の興味に影響を与える要因から生じるようだ。

最近の文献は、学生の教育の選択が性別の違いによって小学校の早い段階から影響を受けることを示してる。社会的なステレオタイプは、女の子が人文学的でケアに重点を置いた教科に自然に惹かれると示唆してる。さまざまな理論がこれらの教育的な好みを説明するために探求されてる。家庭のダイナミクス、学校の環境、教師の態度が、男性と女性の学生の特定の教科に対する態度を形成し、それによって教育の選択に影響を与えることがわかってる。

さらに、数学に関する暗黙の性別ステレオタイプが調査されてる。学生のSTEMにおけるアイデンティティと、関連するキャリアを追求する意欲との間に正の相関関係が見つかってる。バランスの取れたアイデンティティ理論によると、数学と科学を男性優位の分野と見なす女の子は、これらの分野を追求しないように意識的に避けるかもしれない。

一部の研究者は、数学のパフォーマンスにおける性別の違いが、STEM分野に入る男性と女性の不均衡を完全には説明しないと主張してる。性別と数学に関する文化的信念が、男の子と女の子の教育の選択を異なる方法で形作ることができる。たとえば、女の子が男性が数学で優れていると信じている場合、彼女は自分の能力を疑い、数学関連のキャリアに興味を失うかもしれない。

この研究の多くはアメリカから発信されてるが、欧州の文脈でも同様の傾向が見られる。欧州の研究は、STEMキャリアの選択に影響を与える要因に取り組んでいて、男性と女性が以前の学業成績に異なる重要性を割り当てることを明らかにしてる。例えば、イギリスの男の子は、STEM関連の選択を考える際に英語と数学の能力にもっと影響を受ける傾向があるが、女の子は生物や化学のような科目のパフォーマンスにもっと反応する。

イタリアでは、学位プログラムにリンクされたキャリアの見通しに関する正確な情報が不足しているため、学生は個人的な興味や「夢」の仕事に基づいて選択することが多く、これらはしばしば性別ステレオタイプによって影響を受ける。合理的選択理論は、個人が成功の可能性を高める教育的な道を選ぶことを好むと示唆していて、社会化と合理性が性別に応じた教育の選択を形作っていると言える。

イタリアの高校システムは階層的で、大学の準備のためのアカデミック高校、職業訓練を提供する技術高校、直接職業に入るための職業高校がある。高校のカリキュラムの選択は13歳で行われ、学生自身の決定よりも親の指導に大きく影響されることが多い。

平等な機会の原則があるにもかかわらず、イタリアの教育システムは歴史的に階級や性別に基づいて学生を分離していて、家族は特定の社会的・教育的な規範に沿った学校に子供を入れることを強いられている。学業成績や特定の教育段階での性別特有の好みは、過去の成果や興味を反映してる。

研究によると、女性学生はSTEM分野を選ぶために数学の能力を示す強いサインが必要なんだ。そのため、イタリアの教育経路における性別の分布は不均一になってる。女性は古典高校の学生の約70%を占め、伝統的な科学高校ではほぼ50%、2010年に改革された応用科学ではわずか32%なんだ。

分析のためのデータソース

この研究で使用されるデータセットは、2つの国のソースを組み合わせたもの。1つ目は、イタリアの教育システムの品質を評価するために標準化テストを実施しているINVALSIからのデータ。これらのテストは、さまざまな教育レベルの学生に実施され、数学とイタリア語のスキルが評価されてる。

2つ目のデータソースは、2010年から2020年までのイタリアの大学に enrolled したすべての学生に関する詳細情報を含む国立大学生アーカイブからのデータ。このデータセットをリンクさせることで、高校から大学への移行を追跡し、パフォーマンスの関連を分析できる。

この研究は、人文学と科学の高校路線の学生に焦点を当てていて、異なる学業成績に基づいて伝統的な科学と応用科学の間にさらなる区別を行っている。

考慮された変数

私たちの分析では、いくつかの要因を考慮してる:

  • 高校のマクロ地域: 学生が通った高校の地理的地域。
  • 高校の社会経済的地位 (SES): 学校の全体的なSESで、学生の家庭の経済的および文化的地位を反映してる。
  • 公立/私立学校: 学生が公立または私立の高校に通ったかどうか。
  • 高校のカリキュラム: 特に人文学または科学(伝統的および応用)の高校カリキュラムの種類。
  • INVALSI数学スコア: 学生が高校最終年に受けたINVALSIの数学テストのスコア。
  • INVALSIイタリアンスコア: INVALSIのイタリア語テストのスコア。

勾配ブースティングとモデルの解釈

このセクションでは、選択した要因に基づいて結果を予測するために使用される機械学習モデルとしての勾配ブースティングを説明する。機械学習は、多くの変数を持つ複雑なデータを分析するための強力な方法を提供し、複雑な関係を説明するのに役立つ。

勾配ブースティングは、一般的に決定木と呼ばれる複数の弱いモデルの予測を組み合わせるアンサンブルモデルなんだ。目的は、入力変数に基づいて出力変数に最もよく適合する関数を見つけること。プロセスは、最初にシンプルなモデルが予測を行い、その後、以前の誤りに基づいて訓練された弱いモデルを順次追加することで洗練されていく。

私たちの研究では、人気と信頼性があるため勾配ブースティングマシン(GBM)を使用してる。

解釈方法

モデルがどのように機能するかを理解し、その予測を解釈することは重要なんだ。予測に影響を与える最も重要な要因を明らかにするためのツールがある。私たちは、主に3つの解釈方法を探求してる:予測因子の相対的影響、累積局所効果(ALE)、および多次元部分依存図(PDP)。

予測因子の相対的影響: これは、モデル全体で予測誤差を減少させるために各変数がどれだけ寄与するかを測定する。変数の重要性に基づいて、最後のモデルに向けた変数の選択を導くのに役立つランキングを提供する。

部分依存図(PDP): これらの図は、1つまたは複数の変数がモデルからの予測にどのように影響するかを視覚化する。選択した変数と予測結果の間の関係を明らかにする。

累積局所効果(ALE): ALE図は、予測に対する個々の変数の影響を示す。変数の範囲にわたる予測の違いを分析し、その変数がモデルの結果にどのように影響するかを理解する助けとなる。

探索的分析

このセクションでは、女性と男性の学生が行った大学の入学選択についての探索的分析を提示し、過去の学業成績と大学の経路との関連を強調する。

データは、2018/19学年度にイタリアの高校最終年に在籍していた学生を示していて、性別や社会人口統計的特徴に基づく大学の入学選択の違いを示している。

女性学生は一般的に大学に入学する可能性が高いが、STEMプログラムを選ぶ傾向は低い。北イタリアと南イタリアの入学選択にはギャップが見られ、南の学生の方が非入学の割合が高い。北の学生、特に男性は、南の対照群よりもSTEM分野を好む傾向が強い。

学校の社会経済的地位は大学入学と相関していて、高SESの学校の学生は非STEMプログラムを選ぶ可能性が高い。公立学校の学生は、私立学校の学生よりも大学およびSTEMプログラムへの入学の可能性が高いことが示されている。

人文学的背景の学生では選択に大きな違いが見られないが、科学高校にいる女性は男性よりもSTEMプログラムに入学する可能性が低い傾向がある。高いINVALSI数学およびイタリア語テストのスコアは、大学に入学しない学生の割合が低いことと相関している。

分析の結果

勾配ブースティングモデルを使用した分析からの主要な結果を提示する。最初のモデルは、イタリアの大学への入学の可能性を予測し、2つ目のモデルはSTEMプログラムへの入学を予測することに焦点を当てている。

われわれは、モデルの性能を維持するためにINVALSIテストのいずれかでスコアがゼロの学生は除外した。データセットはトレーニンググループとテストグループに分けられ、モデルの性能を評価するためにROC曲線が使用された。

両方のモデルはバランスの取れたROC曲線を示していて、感度と特異性の効果的なバランスを示している。モデル1のAUCは0.71、モデル2のAUCはやや低い0.69だった。

予測因子の重要性

次に、モデル内の予測因子の重要性を調べた。モデル1では、イタリア語のスコアが大学入学予測で最も影響力のある要因で、数学のスコアがそれに続いて重要だった。学校のSESも重要な役割を果たしており、高校のカリキュラムや性別の要因はあまり影響がなかった。

対照的に、モデル2では、STEM入学の最も重要な予測因子が高校のカリキュラムで、数学のスコアは二次的な役割を果たしていた。これは、STEMの結果を予測する上でカリキュラムの重要性を強調してる。

ALEとPDPを通じた関係の探索

ALEプロットを使用して、予測と入学結果との間の非線形関係を探索した。例えば、より高い社会経済的地位は大学入学に一般的に良い影響を与えたが、STEM入学に対してはより複雑な効果を示していた。

数学のスコアに関しては、両方のモデルで入学に対してプラスの影響が見られた。モデル2では、特に非線形の関係が顕著で、数学のパフォーマンスがSTEMプログラムへの入学の選択に大きく影響することが示された。

多次元部分依存図を計算して、高校のカリキュラム、性別、数学およびイタリア語テストのパフォーマンスが大学およびSTEM入学の推定確率にどのように相互に影響するかを視覚化した。

全体として、大学入学の確率は、両科目での高いスコアとともに増加した。しかし、応用科学の低成績の学生は、他の学生よりも大学に入学する可能性が低かった。

STEMの選択に焦点を当てると、応用科学の学生はこれらのプログラムに入学する傾向が高かった。男性は特に数学が得意な場合、STEMへの傾向が強かった。女性学生は、特に数学の成績が良く、イタリア語の成績が悪いとSTEM入学の確率が低かった。

最後に、科学のカリキュラムを受けている学生は、人文学と応用科学の間の極値の間でSTEMの確率が推定されることがわかった。

結論

この記事は、イタリアの高校生の数学とイタリア語の学業スキル、性別、高校の背景が大学入学の選択にどのように影響するかを調べた。私たちの分析は、これらの要因が相互にどう作用するかについて重要な洞察を明らかにした。

結果は、数学とイタリア語のパフォーマンスが学生の高等教育の選択を形成する上で重要な役割を果たすことを確認している。特に、性別における違いが明らかになって、男性学生が両科目で優れている傾向があり、その結果、STEM分野への関心が高まることが示された。

この研究は、学業パフォーマンス、性別、教育背景が大学入学に影響を与える複雑な関係を理解することの重要性を強調している。数学の優れた成績がSTEMの入学に関連しているが、これは特に科学のカリキュラムにおける男性学生に当てはまる。

ただし、調査された変数は学生の大学入学に対する決定に影響を与える多くの要因の一部に過ぎない。個人の志望、キャリアガイダンス、文化的な文脈は、教育選択の複雑なネットワークに影響を与える可能性が大きい。

この研究はまた、社会経済的地位、性別、学業能力など、様々な要因間の相互関係を考慮する統計的方法の必要性を浮き彫りにしている。

結果は教育政策に重要な意味を持ち、学校での性別の不平等に対処するためのターゲットを絞った介入を作成し、学生の強みや興味を考慮した経路を作成する必要性を強調している。

結論として、この研究は貴重な洞察を提供しているが、国外の大学に入学した学生を考慮できないなどの制限もある。さらなる研究が、この分野の理解を深め、有効な教育戦略を形成するのに役立つかもしれない。

オリジナルソース

タイトル: A machine learning approach to predict university enrolment choices through students' high school background in Italy

概要: This paper explores the influence of Italian high school students' proficiency in mathematics and the Italian language on their university enrolment choices, specifically focusing on STEM (Science, Technology, Engineering, and Mathematics) courses. We distinguish between students from scientific and humanistic backgrounds in high school, providing valuable insights into their enrolment preferences. Furthermore, we investigate potential gender differences in response to similar previous educational choices and achievements. The study employs gradient boosting methodology, known for its high predicting performance and ability to capture non-linear relationships within data, and adjusts for variables related to the socio-demographic characteristics of the students and their previous educational achievements. Our analysis reveals significant differences in the enrolment choices based on previous high school achievements. The findings shed light on the complex interplay of academic proficiency, gender, and high school background in shaping students' choices regarding university education, with implications for educational policy and future research endeavours.

著者: Andrea Priulla, Alessandro Albano, Nicoletta D'Angelo, Massimo Attanasio

最終更新: 2024-02-29 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2403.13819

ソースPDF: https://arxiv.org/pdf/2403.13819

ライセンス: https://creativecommons.org/publicdomain/zero/1.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事