Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computadores e sociedade# Aprendizagem de máquinas

Prevendo a Evasão Escolar: Uma Abordagem Baseada em Dados

Usando aprendizado de máquina pra identificar alunos em risco de desistir cedo.

― 7 min ler


Insights sobre os riscosInsights sobre os riscosde desistênciaeficaz.de evasão dos estudantes de formaAprendizado de máquina prevê as taxas
Índice

A educação é importante pra ajudar as pessoas a melhorarem suas vidas e comunidades. Mas, muitos estudantes ficam de fora da escola antes de concluir. Esse problema de evasão afeta não só os indivíduos, mas a sociedade como um todo, levando a questões como aumento das taxas de pobreza e maior dependência de ajuda pública. Estudantes que abandonam os estudos geralmente ganham menos, têm dificuldades pra encontrar bons empregos e podem enfrentar desafios com saúde e questões sociais. Esses resultados tornam crucial entender por que os alunos saem da escola e como mantê-los engajados.

As taxas de evasão precoce em muitos países europeus são preocupantes. Na União Europeia, cerca de 9,6% dos jovens entre 18 e 24 anos não estão envolvidos em nenhuma educação ou formação depois de concluir a escola secundária. Na Finlândia, a taxa de evasão durante a escola secundária é de 0,5%, mas esse número aumenta bastante nas escolas secundárias superiores, com 13,3% dos alunos de formação profissional e 3,6% dos alunos de ensino geral abandonando. Reconhecer possíveis evasores cedo pode ajudar a oferecer apoio antes que eles se desliguem da educação.

O aprendizado de máquina é uma área de tecnologia que tá crescendo e pode ajudar em muitos campos, incluindo a educação. Ele usa grandes quantidades de dados e pode encontrar conexões entre diferentes informações. Na educação, poucos estudos usaram aprendizado de máquina pra prever quem pode abandonar a escola. A maioria das pesquisas anteriores focou só em um curto período de tempo, muitas vezes coletando dados de um único ano ou só durante o ensino secundário.

Neste estudo, tomamos uma abordagem diferente. Usamos um grande conjunto de dados cobrindo 13 anos de informações sobre estudantes, desde o jardim de infância até a 9ª série. Isso nos permitiu olhar pra uma ampla gama de fatores que podem influenciar as taxas de evasão, incluindo habilidades acadêmicas, Motivação, comportamento e bem-estar. Nosso objetivo era ver se conseguiríamos prever quais estudantes provavelmente abandonariam a escola secundária usando informações coletadas já no final da escola primária.

A Importância da Intervenção Precoce

Entender por que os alunos abandonam não é só olhar pra um ponto específico no tempo. O processo geralmente começa anos antes de o estudante deixar a escola. Muitos fatores podem afetar essa decisão, e reconhecer esses fatores cedo pode ajudar a criar sistemas de apoio para estudantes em risco. Por exemplo, a gente descobriu que as habilidades acadêmicas em leitura e matemática eram indicadores significativos de se um aluno continuaria ou não na educação.

Nosso estudo foi único porque olhamos pra dados por um período mais longo do que a maioria das pesquisas anteriores. Isso nos permitiu identificar sinais de alerta cedo e fornecer insights sobre quando e como apoiar os alunos. Ligando dados de vários anos, nosso objetivo era criar Modelos Preditivos que pudessem ajudar os educadores a auxiliar melhor os estudantes que estão enfrentando dificuldades.

Metodologia

Analisamos um conjunto de dados abrangente que consistia em informações coletadas ao longo de 13 anos de estudantes na Finlândia. Esse conjunto incluía vários aspectos da vida dos alunos, como desempenho acadêmico, habilidades cognitivas, níveis de motivação, histórico familiar e mais. Focamos em quatro modelos de aprendizado de máquina pra ver qual funcionava melhor na previsão das taxas de evasão. Esses modelos incluíam Balanced Random Forest, Easy Ensemble (AdaBoost), RSBoost (outra forma de AdaBoost) e uma Árvore de Decisão Bagging.

Pra avaliar como nossos modelos se saíram, usamos um método chamado validação cruzada em seis partes. Isso significa que dividimos nossos dados em seis partes, usamos cinco partes pra treinar o modelo e testamos na parte restante. Repetimos esse processo pra garantir que nossos resultados fossem consistentes. Esse método ajuda a evitar o overfitting, onde um modelo funciona bem em um conjunto de dados, mas mal em outros.

Resultados

Nossos achados mostraram que o modelo Balanced Random Forest foi o mais eficaz em prever quais alunos provavelmente abandonariam. Com dados até a 9ª série, ele alcançou uma precisão média equilibrada de 0,61. Isso significa que identificou corretamente uma parte significativa dos alunos que acabariam abandonando, ao mesmo tempo que minimizou os erros.

Quando usamos dados apenas até a 6ª série, o desempenho caiu um pouco pra uma precisão média equilibrada de 0,59, mas ainda assim forneceu previsões úteis. O modelo destacou que as habilidades acadêmicas, especialmente em leitura e matemática, eram fortes indicadores do futuro educacional de um aluno. Recursos como fluência de leitura a partir da 1ª série estavam entre os preditores mais importantes.

Principais Recursos

No nosso estudo, descobrimos que uma combinação de fatores teve um papel crucial na previsão das taxas de evasão. As habilidades acadêmicas tiveram a influência mais significativa, o que alinha com as teorias existentes que sugerem que uma base sólida em leitura e matemática pode levar a resultados educacionais mais positivos.

Além disso, outros fatores como motivação e histórico familiar também contribuíram pras previsões. Por exemplo, alunos cujos pais tinham níveis mais altos de educação tendiam a se sair melhor na escola e eram menos propensos a abandonar.

Implicações para Educadores

Os modelos preditivos que desenvolvemos podem ter um papel importante em apoiar educadores. Identificando alunos em risco de evasão no início da jornada educacional, as escolas podem implementar intervenções direcionadas. Isso pode incluir tutoria adicional, aconselhamento ou até programas de apoio familiar.

A principal lição é que as estratégias de prevenção da evasão são mais eficazes quando aplicadas o mais cedo possível. Usando dados e aprendizado de máquina, os educadores podem tomar medidas proativas em vez de reativas, criando um ambiente educacional melhor pra todos os alunos.

Limitações e Pesquisas Futuras

Embora nosso estudo tenha avançado na compreensão da previsão de evasão, existem várias limitações e áreas pra pesquisas futuras. Um desafio que enfrentamos foi lidar com dados faltantes. Optamos por excluir características com uma alta porcentagem de valores ausentes, o que pode ter limitado o escopo da nossa análise. Estudos futuros deveriam explorar métodos mais robustos pra lidar com dados faltantes pra garantir uma abordagem mais abrangente.

Além disso, nossos dados vieram principalmente da Finlândia. Seria benéfico repetir esse estudo em diferentes países ou culturas pra ver se os mesmos padrões se mantêm. Os sistemas educacionais variam muito, e entender essas diferenças pode ajudar a adaptar intervenções pra atender necessidades específicas.

Conclusão

Em conclusão, nossa pesquisa destacou o potencial de usar aprendizado de máquina pra prever a evasão na escola secundária já desde a escola primária. Analisando um rico conjunto de dados coletados ao longo de 13 anos, identificamos fatores chave que contribuem pra retenção dos alunos. Os achados sugerem que, com as ferramentas e dados certos, educadores podem identificar alunos em risco mais cedo e apoiá-los melhor na sua jornada educacional.

Esses modelos preditivos oferecem uma nova forma de abordar a prevenção da evasão, mudando de soluções reativas pra apoio proativo. À medida que olhamos pro futuro, mais validação e exploração desses modelos serão essenciais pra refinar nossa compreensão das dinâmicas de evasão e melhorar os resultados educacionais pra todos os alunos.

Fonte original

Título: Machine Learning Predicts Upper Secondary Education Dropout as Early as the End of Primary School

Resumo: Education plays a pivotal role in alleviating poverty, driving economic growth, and empowering individuals, thereby significantly influencing societal and personal development. However, the persistent issue of school dropout poses a significant challenge, with its effects extending beyond the individual. While previous research has employed machine learning for dropout classification, these studies often suffer from a short-term focus, relying on data collected only a few years into the study period. This study expanded the modeling horizon by utilizing a 13-year longitudinal dataset, encompassing data from kindergarten to Grade 9. Our methodology incorporated a comprehensive range of parameters, including students' academic and cognitive skills, motivation, behavior, well-being, and officially recorded dropout data. The machine learning models developed in this study demonstrated notable classification ability, achieving a mean area under the curve (AUC) of 0.61 with data up to Grade 6 and an improved AUC of 0.65 with data up to Grade 9. Further data collection and independent correlational and causal analyses are crucial. In future iterations, such models may have the potential to proactively support educators' processes and existing protocols for identifying at-risk students, thereby potentially aiding in the reinvention of student retention and success strategies and ultimately contributing to improved educational outcomes.

Autores: Maria Psyridou, Fabi Prezja, Minna Torppa, Marja-Kristiina Lerkkanen, Anna-Maija Poikkeus, Kati Vasalampi

Última atualização: 2024-03-01 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2403.14663

Fonte PDF: https://arxiv.org/pdf/2403.14663

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes