Simple Science

Ciência de ponta explicada de forma simples

# Estatística# Aprendizagem de máquinas# Aplicações# Outras estatísticas

Como as habilidades da escola secundária influenciam as escolhas universitárias na Itália

Analisando o impacto das habilidades acadêmicas na matrícula universitária na Itália.

― 18 min ler


Habilidades do EnsinoHabilidades do EnsinoMédio e EscolhasUniversitáriasmatrícula em universidades italianas.Explorando as influências acadêmicas na
Índice

Este artigo explora como as habilidades dos estudantes de ensino médio italianos em matemática e na língua italiana afetam suas escolhas de matrícula na universidade, especialmente em áreas de STEM (Ciência, Tecnologia, Engenharia e Matemática). A gente diferencia entre alunos que vêm de formações científicas e aqueles de formações humanísticas no ensino médio. Isso nos dá insights úteis sobre por que eles escolhem certos campos. O artigo também examina possíveis diferenças de gênero em suas experiências e escolhas educacionais.

Usamos um método chamado gradient boosting, um tipo de aprendizado de máquina, para fazer nossas previsões. Essa abordagem é conhecida por ser bem precisa e é boa em entender relações complexas nos dados. Também consideramos vários fatores socioeconômicos, assim como o desempenho dos estudantes na educação anterior. Nossas descobertas mostram diferenças claras nas escolhas de matrícula baseadas no Desempenho Acadêmico passado. Nosso objetivo é revelar como habilidades acadêmicas, gênero e formações no ensino médio influenciam as escolhas universitárias dos alunos. Essa pesquisa pode ter implicações para políticas educacionais e estudos futuros.

O Cenário Educacional Pós-Segunda Guerra Mundial

Desde o fim da Segunda Guerra Mundial, a educação se expandiu significativamente pelo mundo, aumentando a demanda por oportunidades educacionais em todos os níveis. Esse crescimento era esperado para ajudar a promover valores democráticos e reduzir desigualdades educacionais. No entanto, apesar desse progresso, ainda vemos lacunas no desempenho educacional entre diferentes grupos sociais.

Um foco importante na pesquisa tem sido o impacto do gênero nas escolhas educacionais, especialmente no ensino superior. Por exemplo, estudos nos EUA mostraram que meninas costumam se sair melhor que os meninos em leitura, completam mais séries e reprovam menos. Elas também são mais propensas a escolher programas acadêmicos no ensino médio e buscar educação superior.

Mesmo com melhorias na educação feminina em níveis secundário e terciário, não houve muito progresso na redução da segregação de gênero em campos de estudo. Estudos mostram diferenças significativas, especialmente entre áreas humanísticas e científicas, com mulheres sub-representadas em áreas de STEM. Uma estatística notável de 2020 indica que nos países da OCDE, as mulheres representaram apenas 31% das novas matrículas em programas de graduação em STEM. Esses padrões são vistos globalmente, indicando barreiras estruturais que continuam a separar os Gêneros na educação.

A pesquisa buscou identificar fatores individuais e influências externas que levam a diferentes escolhas educacionais entre meninos e meninas. A atenção específica foi dada à falta de modelos femininos e às pressões que as garotas podem enfrentar em relação às carreiras de STEM devido a estereótipos sociais e à influência de professores e colegas. Outros estudos analisaram como o sucesso educacional anterior impacta a decisão de seguir certos campos na universidade.

Existem duas categorias principais de fatores que afetam o gênero na educação: efeitos primários e efeitos secundários. Efeitos primários relacionam-se a diferenças de desempenho e conquistas que surgem das atitudes mantidas por homens e mulheres. Efeitos secundários envolvem as percepções e expectativas de pais, professores e alunos sobre a probabilidade de sucesso com base no gênero.

Insights do Sistema Educacional na Itália

Focando na Itália, dados do Instituto Nacional de Estatística destacam uma lacuna significativa na participação em STEM em comparação com outros países europeus. Em 2021, apenas 24,7% dos graduados na Itália eram graduados em STEM, em comparação com 26,8% na França, 27,5% na Espanha e 32,2% na Alemanha. Notavelmente, as mulheres tiveram uma participação muito menor em campos de STEM do que os homens: de cada 100 mulheres com um diploma de nível superior, apenas 15 se especializaram em STEM, em comparação com 33 homens.

Estudos internacionais enfatizam a necessidade de modelos que considerem a estrutura complexa das diferenças educacionais. Muitos modelos estatísticos tradicionais foram usados para analisar essas diferenças, mas houve uma mudança nos últimos anos em direção a modelos flexíveis de aprendizado de máquina que podem gerenciar dados complexos e variados sem suposições rígidas. Esses modelos também podem lidar com grandes conjuntos de dados e se adaptar a tendências de dados diversas.

Objetivos da Pesquisa

Nossa pesquisa tem como objetivo investigar como as formações do ensino médio impactam as escolhas de matrícula na universidade na Itália. Estamos particularmente interessados em como as conquistas educacionais anteriores afetam as decisões de estudantes do sexo masculino e feminino em relação à matrícula universitária e a campos de estudo específicos. Além disso, analisamos alunos que se destacam em matemática e italiano para identificar possíveis diferenças em suas escolhas acadêmicas. Este estudo pode fornecer insights sobre os fatores que impulsionam o sucesso acadêmico e contribuir para a compreensão das diferenças de gênero na educação.

Para conduzir essa pesquisa, usamos dados de duas fontes administrativas italianas: o Ministério da Universidade e Pesquisa e o INVALSI. Esse conjunto de dados combinado acompanha os alunos desde o último ano de ensino médio até o primeiro ano de universidade.

A Estrutura do Artigo

O artigo está organizado em várias seções. A primeira seção revisa estudos anteriores sobre diferenças de gênero em STEM. A segunda seção descreve os dados usados no estudo. A terceira seção delineia os métodos aplicados. A quarta seção apresenta uma análise exploratória, enquanto a seção final discute os resultados do nosso modelo de gradient boosting.

A Revisão da Literatura

Esta seção revisa a literatura internacional sobre as lacunas de gênero em STEM, focando particularmente na Itália. Grande parte da literatura se concentra no desempenho dos alunos em matemática, com descobertas sugerindo que habilidades acadêmicas gerais e proficiência matemática são cruciais para a matrícula em programas de STEM na universidade. A lacuna de gênero no ensino superior parece decorrer de fatores que influenciam os interesses dos alunos mesmo antes de chegarem à universidade.

Literatura recente indicou que as escolhas educacionais dos alunos são influenciadas por diferenças de gênero já no ensino fundamental. Estereótipos sociais sugerem que meninas naturalmente se atraem por disciplinas que enfatizam áreas humanísticas e de cuidado. Várias teorias foram exploradas para explicar essas preferências educacionais. Dinâmicas familiares, ambientes escolares e atitudes de professores são encontradas para moldar as atitudes de alunos do sexo masculino e feminino em relação a matérias específicas, afetando assim suas escolhas educacionais.

Mais estudos examinaram estereótipos de gênero implícitos relacionados à matemática. Uma correlação positiva foi encontrada entre a identidade de um aluno em STEM e sua persistência em seguir carreiras relacionadas. De acordo com a teoria da identidade balanceada, meninas que veem matemática e ciência como dominadas por homens podem conscientemente evitar seguir esses campos, acreditando que não são adequadas para eles.

Alguns pesquisadores argumentam que as diferenças de gênero no desempenho em matemática não explicam totalmente os desequilíbrios entre homens e mulheres entrando em campos de STEM. Crenças culturais sobre gênero e matemática podem moldar as escolhas educacionais de maneira diferente para meninos e meninas. Por exemplo, se uma menina acredita que os homens se destacam em matemática, ela pode duvidar de suas habilidades e perder interesse em carreiras relacionadas à matemática.

Embora grande parte dessa pesquisa tenha origem nos EUA, tendências semelhantes aparecem em contextos europeus. Estudos europeus abordam os fatores que afetam as escolhas de carreira em STEM, revelando que homens e mulheres atribuem diferentes importâncias ao desempenho acadêmico anterior. Por exemplo, meninos no Reino Unido tendem a ser mais influenciados por suas habilidades em inglês e matemática ao considerar escolhas relacionadas a STEM, enquanto meninas respondem mais ao desempenho em disciplinas como biologia e química.

Na Itália, a falta de informações precisas sobre as perspectivas de carreira ligadas a programas de graduação pode fazer com que os estudantes baseiem suas escolhas em interesses pessoais ou "trabalhos dos sonhos", que muitas vezes são influenciados por estereótipos de gênero. A teoria da escolha racional sugere que indivíduos favorecem caminhos educacionais que aumentam suas chances de sucesso, indicando que socialização e racionalidade moldam as escolhas educacionais de gênero.

O sistema de ensino médio italiano é hierárquico, consistindo de liceus acadêmicos que preparam alunos para a universidade, escolas técnicas que oferecem formação profissional e escolas vocacionais voltadas para a entrada direta no mercado de trabalho. A escolha do currículo do ensino médio ocorre aos 13 anos, frequentemente influenciada significativamente pela orientação dos pais, em vez de decisões dos próprios alunos.

Apesar dos princípios de igualdade de oportunidades, os sistemas educacionais italianos historicamente segregam alunos com base em classe e gênero, forçando as famílias a matricularem os filhos em escolas que se alinhem a normas sociais e educacionais específicas. O desempenho acadêmico e preferências específicas de gênero em determinadas etapas educacionais refletem conquistas e interesses anteriores.

Estudos mostraram que as alunas precisam de sinais mais fortes de habilidade matemática para escolher campos de STEM. Como resultado, a distribuição de gênero entre os caminhos educacionais é desigual na Itália. As mulheres representam cerca de 70% dos alunos em liceus clássicos, quase 50% em liceus científicos tradicionais e apenas 32% em ciências aplicadas, que se concentram em estudos científicos e tecnológicos introduzidos em uma reforma em 2010.

Fontes de Dados para Análise

O conjunto de dados usado neste estudo combina duas fontes nacionais. A primeira é proveniente do INVALSI, que realiza testes padronizados para avaliar a qualidade do sistema educacional italiano. Esses testes são aplicados a alunos em vários níveis educacionais para avaliar suas habilidades em matemática e língua italiana.

A segunda fonte é do Arquivo Nacional de Estudantes Universitários, que contém informações detalhadas sobre todos os alunos matriculados em universidades italianas de 2010 a 2020. Ao vincular esses conjuntos de dados, conseguimos acompanhar as transições do ensino médio para a universidade e analisar as conexões de desempenho.

Este estudo foca em alunos nas trajetórias de ensino médio humanístico e científico, fazendo distinções adicionais entre os caminhos científicos tradicionais e aplicados com base em diferentes resultados acadêmicos.

Variáveis Consideradas

Nossa análise considera vários fatores:

  • Macroregião do Ensino Médio: A região geográfica da escola de ensino médio frequentada pelo aluno.
  • Status Socioeconômico da Escola (SES): O SES geral da escola, refletindo o status econômico e cultural das famílias dos alunos.
  • Escola Pública/Privada: Se o aluno frequentou uma escola pública ou privada.
  • Currículo do Ensino Médio: O tipo de currículo do ensino médio, especificamente humanístico ou científico (tradicional e aplicado).
  • Pontuação em Matemática do INVALSI: As pontuações que os alunos receberam no teste de matemática do INVALSI no último ano do ensino médio.
  • Pontuação em Italiano do INVALSI: As pontuações do teste de italiano do INVALSI.

Gradient Boosting e Interpretações do Modelo

Esta seção explica o gradient boosting, um modelo de aprendizado de máquina usado para prever resultados com base nos fatores escolhidos. O aprendizado de máquina oferece uma maneira poderosa de analisar dados complexos com muitas variáveis, ajudando a explicar relações complicadas.

O gradient boosting é um modelo de conjunto que combina as previsões de vários modelos mais fracos, tipicamente árvores de decisão. O objetivo é encontrar uma função que melhor corresponda à variável de saída com base nas variáveis de entrada. O processo começa com um modelo simples fazendo previsões, que são então refinadas pela adição sequencial de modelos mais fracos treinados nos erros anteriores.

Nossa pesquisa utiliza a máquina de gradient boosting (GBM) pela sua popularidade e confiabilidade.

Métodos de Interpretação

Entender como o modelo opera e interpretar suas previsões é crucial. Existem ferramentas para revelar os fatores mais importantes que afetam as previsões. Exploramos três métodos principais de interpretação: influência relativa dos preditores, Efeitos Locais Acumulados (ALE) e Gráficos de Dependência Parcial Multidimensionais (PDP).

Influência Relativa dos Preditores: Isso mede quanto cada variável contribui para reduzir erros de previsão em todo o modelo. Ele fornece uma classificação das variáveis com base em sua importância, ajudando a guiar a seleção de variáveis para os modelos finais.

Gráficos de Dependência Parcial (PDP): Esses gráficos visualizam como uma ou mais variáveis afetam as previsões do modelo. Eles revelam relações entre variáveis selecionadas e resultados previstos.

Efeitos Locais Acumulados (ALE): Os gráficos ALE oferecem insights sobre o impacto de variáveis individuais nas previsões. Eles analisam diferenças nas previsões ao longo do intervalo de uma variável, proporcionando uma compreensão de como a variável influencia os resultados do modelo.

Análise Exploratória

Esta seção apresenta uma análise exploratória das escolhas de matrícula na universidade feitas por alunos e alunas, enfatizando a associação entre conquistas educacionais anteriores e caminhos universitários.

Os dados descrevem os alunos matriculados no último ano do ensino médio na Itália durante o ano letivo de 2018/19, mostrando diferenças nas escolhas de matrícula universitária com base em gênero e características socioeconômicas.

Alunas geralmente têm mais probabilidade de se matricular na universidade, mas são menos inclinadas a escolher programas de STEM. A lacuna entre o norte e o sul da Itália aparece nas escolhas de matrícula, com uma porcentagem maior de alunos não matriculados no sul. Alunos do norte, especialmente homens, mostram uma preferência mais forte por campos de STEM do que seus colegas do sul.

O status socioeconômico da escola correlaciona-se com a matrícula universitária, com alunos de escolas de SES mais alto sendo mais propensos a escolher programas não-STEM. Alunos de escolas públicas mostram uma maior probabilidade de matrícula tanto na universidade quanto em programas de STEM em comparação com alunos de escolas privadas.

Estudantes com formações humanísticas demonstram diferenças mínimas nas escolhas, enquanto mulheres em liceus científicos tendem a ser menos propensas a se matricular em programas de STEM em comparação com os homens. Resultados mais altos nos testes de matemática e italiano do INVALSI correlacionam-se com uma menor porcentagem de alunos não matriculados na universidade.

Resultados da Análise

Apresentamos as principais descobertas da nossa análise usando modelos de gradient boosting. O primeiro modelo prevê a probabilidade de matrícula em uma universidade italiana, enquanto o segundo modelo foca em prever a matrícula em programas de STEM.

Excluímos alunos com pontuação zero em qualquer um dos testes do INVALSI, que representou uma pequena parte do conjunto de dados total, para manter o desempenho do modelo. O conjunto de dados foi dividido em grupos de treinamento e teste, com o modelo avaliado usando curvas ROC para avaliar o desempenho.

Ambos os modelos demonstraram curvas ROC equilibradas, indicando um bom equilíbrio entre sensibilidade e especificidade. O Modelo 1 teve um AUC de 0,71, enquanto o Modelo 2 teve um AUC ligeiramente inferior de 0,69.

Importância dos Preditores

Em seguida, examinamos a importância dos preditores em nossos modelos. No Modelo 1, a pontuação de italiano foi o fator mais influente na previsão de matrícula universitária, seguida de perto pela pontuação de matemática. O SES da escola desempenhou um papel significativo, enquanto fatores como o currículo do ensino médio e gênero foram menos impactantes.

Em contraste, o Modelo 2 revelou o currículo do ensino médio como o preditor mais importante para matrícula em STEM, com a pontuação de matemática ocupando um papel secundário. Isso destaca a importância do currículo na previsão de resultados em STEM.

Explorando Relações Através de ALE e PDP

Usando gráficos ALE, exploramos as relações não lineares entre preditores e resultados de matrícula. Por exemplo, um status socioeconômico mais alto geralmente influenciou positivamente a matrícula universitária, mas mostrou um efeito mais sutil sobre a matrícula em STEM.

Em relação à pontuação de matemática, ambos os modelos exibiram uma influência positiva sobre a matrícula. O Modelo 2 demonstrou uma relação não linear particularmente pronunciada, indicando que o desempenho em matemática impacta significativamente a escolha de matrícula em programas de STEM.

Também calculamos gráficos de Dependência Parcial Multidimensionais para visualizar como o currículo do ensino médio, gênero e desempenho nos testes de italiano e matemática interagem de forma a influenciar as probabilidades estimadas de matrícula universitária e em STEM.

No geral, descobrimos que a probabilidade de matrícula universitária aumentou com pontuações mais altas em ambas as disciplinas. No entanto, alunos com baixo desempenho em ciências aplicadas mostraram menores chances de matrícula em comparação com outros.

Ao focar nas escolhas de STEM, alunos de ciências aplicadas tiveram uma maior tendência a se matricular nesses programas. Os homens mostraram uma maior inclinação para STEM, especialmente se se destacaram em matemática. As alunas exibiram probabilidades mais baixas para matrícula em STEM em comparação com os alunos do sexo masculino, particularmente quando tiveram um bom desempenho em matemática juntamente com baixas pontuações em italiano.

Por fim, alunos de currículos científicos tiveram probabilidades estimadas de STEM que caíram entre os extremos estabelecidos por humanísticas e ciências aplicadas.

Conclusão

Este artigo examinou como as habilidades acadêmicas dos estudantes de ensino médio italianos em matemática e italiano, juntamente com gênero e formação no ensino médio, afetam suas escolhas de matrícula na universidade. Nossa análise revelou insights importantes sobre como esses fatores interagem.

As descobertas afirmam o papel significativo que o desempenho em matemática e italiano desempenha na formação das escolhas dos alunos para a educação superior. Notavelmente, surgiram diferenças de gênero, com alunos do sexo masculino tendendo a se destacar em ambas as disciplinas, levando a uma maior inclinação para áreas de STEM.

O estudo enfatiza a importância de entender as relações complexas entre desempenho acadêmico, gênero e formações educacionais na influência das escolhas de matrícula universitária. Embora um bom desempenho em matemática estivesse relacionado a um aumento na matrícula em STEM, isso era particularmente evidente entre alunos do sexo masculino dentro de currículos científicos.

No entanto, as variáveis investigadas representam apenas uma fração dos muitos fatores que podem influenciar as decisões dos alunos em relação à matrícula universitária. Aspirações individuais, orientação profissional e contextos culturais podem impactar significativamente a intrincada teia de escolhas educacionais.

Essa pesquisa também destaca a necessidade de métodos estatísticos que levem em consideração várias interconexões entre diferentes fatores como status socioeconômico, gênero e habilidade acadêmica.

As descobertas têm implicações importantes para a política educacional, sublinhando a necessidade de intervenções direcionadas nas escolas para lidar com disparidades de gênero e criar caminhos que considerem os pontos fortes e interesses dos alunos.

Em conclusão, enquanto este estudo fornece insights valiosos, existem limitações, como a incapacidade de considerar alunos que podem ter se matriculado em universidades no exterior. Pesquisas futuras poderiam aprimorar a compreensão nesse campo e ajudar a moldar estratégias educacionais eficazes.

Fonte original

Título: A machine learning approach to predict university enrolment choices through students' high school background in Italy

Resumo: This paper explores the influence of Italian high school students' proficiency in mathematics and the Italian language on their university enrolment choices, specifically focusing on STEM (Science, Technology, Engineering, and Mathematics) courses. We distinguish between students from scientific and humanistic backgrounds in high school, providing valuable insights into their enrolment preferences. Furthermore, we investigate potential gender differences in response to similar previous educational choices and achievements. The study employs gradient boosting methodology, known for its high predicting performance and ability to capture non-linear relationships within data, and adjusts for variables related to the socio-demographic characteristics of the students and their previous educational achievements. Our analysis reveals significant differences in the enrolment choices based on previous high school achievements. The findings shed light on the complex interplay of academic proficiency, gender, and high school background in shaping students' choices regarding university education, with implications for educational policy and future research endeavours.

Autores: Andrea Priulla, Alessandro Albano, Nicoletta D'Angelo, Massimo Attanasio

Última atualização: 2024-02-29 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2403.13819

Fonte PDF: https://arxiv.org/pdf/2403.13819

Licença: https://creativecommons.org/publicdomain/zero/1.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes