Vorhersage von Schulabbrechern: Ein datenbasierter Ansatz
Maschinelles Lernen nutzen, um Schüler zu identifizieren, die kurz vor dem Abbrechen sind.
― 7 min Lesedauer
Inhaltsverzeichnis
Bildung ist wichtig, um Menschen zu helfen, ihr Leben und ihre Gemeinschaften zu verbessern. Allerdings brechen viele Schüler die Schule ab, bevor sie fertig sind. Dieses Abbrecherproblem betrifft nicht nur Einzelpersonen, sondern die ganze Gesellschaft und führt zu Problemen wie höheren Armutsraten und mehr Abhängigkeit von staatlicher Hilfe. Schüler, die abbrechen, verdienen oft weniger, haben Schwierigkeiten, gute Jobs zu finden, und könnten mit Gesundheits- und sozialen Problemen zu kämpfen haben. Diese Ergebnisse machen es entscheidend, Wege zu finden, um zu verstehen, warum Schüler die Schule verlassen und wie man sie engagiert hält.
Die frühen Abbrecherquoten in vielen europäischen Ländern sind besorgniserregend. In der Europäischen Union sind etwa 9,6 % der jungen Menschen zwischen 18 und 24 nach dem Abschluss der unteren Sekundarstufe in keine Bildung oder Ausbildung mehr eingebunden. In Finnland liegt die Abbrecherquote in der unteren Sekundarstufe bei 0,5 %, aber der Wert steigt in den oberen Sekundarstufen erheblich an, mit 13,3 % der Berufsbildungsschüler und 3,6 % der allgemeinen obersten Sekundarschüler, die abbrechen. Potenzielle Abbrecher frühzeitig zu erkennen, kann helfen, Unterstützung zu bieten, bevor sie sich von ihrer Bildung abwenden.
Maschinenlernen ist ein wachsendes Gebiet der Technologie, das in vielen Bereichen, einschliesslich Bildung, helfen kann. Es nutzt grosse Datenmengen und kann Verbindungen zwischen verschiedenen Informationen finden. In der Bildung haben nur wenige Studien Maschinenlernen genutzt, um vorherzusagen, wer möglicherweise die Schule abbricht. Die meisten bisherigen Forschungen konzentrierten sich nur auf einen kurzen Zeitraum und sammelten häufig Daten aus nur einem Jahr oder nur während der oberen Sekundarstufe.
In dieser Studie haben wir einen anderen Ansatz gewählt. Wir haben einen grossen Datensatz verwendet, der 13 Jahre Schülerdaten von der Vorschule bis zur 9. Klasse abdeckt. Das ermöglichte uns, eine Vielzahl von Faktoren zu betrachten, die die Abbruchquoten beeinflussen könnten, einschliesslich akademischer Fähigkeiten, Motivation, Verhalten und Wohlbefinden. Unser Ziel war es zu sehen, ob wir vorhersagen können, welche Schüler wahrscheinlich die obere Sekundarstufe abbrechen werden, basierend auf Informationen, die bereits am Ende der Grundschule gesammelt wurden.
Die Bedeutung früher Intervention
Zu verstehen, warum Schüler abbrechen, bedeutet nicht nur, einen bestimmten Zeitpunkt zu betrachten. Der Prozess beginnt in der Regel Jahre, bevor ein Schüler die Schule verlässt. Viele Faktoren können ihre Entscheidung beeinflussen, und diese Faktoren frühzeitig zu erkennen, kann helfen, Unterstützungssysteme für gefährdete Schüler zu schaffen. Zum Beispiel haben wir herausgefunden, dass akademische Fähigkeiten in Lesen und Mathe wichtige Indikatoren dafür sind, ob ein Schüler seine Bildung fortsetzen wird oder nicht.
Unsere Studie war einzigartig, weil wir Daten über einen längeren Zeitraum als die meisten vorherigen Forschungen betrachtet haben. Das ermöglichte es uns, frühzeitig Warnzeichen zu identifizieren und Einblicke zu geben, wann und wie man Schüler unterstützen kann. Indem wir Daten aus mehreren Jahren verbunden haben, wollten wir predictive Modelle erstellen, die Lehrern helfen könnten, Schüler besser zu unterstützen, die möglicherweise Schwierigkeiten haben.
Methodologie
Wir haben einen umfassenden Datensatz analysiert, der Informationen aus 13 Jahren von Schülern in Finnland enthält. Dieser Datensatz umfasste verschiedene Aspekte des Lebens der Schüler, wie ihre akademischen Leistungen, kognitive Fähigkeiten, Motivationsniveaus, familiären Hintergrund und mehr. Wir konzentrierten uns auf vier Maschinenlernmodelle, um zu sehen, welches am besten zur Vorhersage der Abbruchquoten geeignet ist. Diese Modelle umfassten Balanced Random Forest, Easy Ensemble (AdaBoost), RSBoost (eine weitere Form von AdaBoost) und einen Bagging Decision Tree.
Um zu bewerten, wie gut unsere Modelle abgeschnitten haben, verwendeten wir eine Methode namens sechs-fach Kreuzvalidierung. Das bedeutet, dass wir unsere Daten in sechs Teile aufteilten, fünf Teile zum Trainieren des Modells verwendeten und es an dem verbleibenden Teil testeten. Wir haben diesen Prozess wiederholt, um sicherzustellen, dass unsere Ergebnisse konsistent waren. Diese Methode hilft, Overfitting zu vermeiden, wo ein Modell auf einem Datensatz gut funktioniert, aber auf anderen schlecht abschneidet.
Ergebnisse
Unsere Ergebnisse zeigten, dass das Balanced Random Forest-Modell am effektivsten war, um vorherzusagen, welche Schüler wahrscheinlich abbrechen würden. Mit Daten bis zur 9. Klasse erreichte es eine ausgeglichene mittlere Genauigkeit von 0,61. Das bedeutet, dass es einen signifikanten Teil der Schüler korrekt identifizierte, die letztendlich abbrechen würden, während auch Fehler minimiert wurden.
Als wir Daten nur bis zur 6. Klasse verwendeten, sank die Leistung leicht auf eine ausgeglichene mittlere Genauigkeit von 0,59, bot aber immer noch nützliche Vorhersagen. Das Modell hob hervor, dass akademische Fähigkeiten, besonders im Lesen und in Mathe, starke Indikatoren für den zukünftigen Bildungsweg eines Schülers sind. Merkmale wie Leseflüssigkeit ab der 1. Klasse gehörten zu den wichtigsten Prädiktoren.
Schlüsselfaktoren
In unserer Studie haben wir festgestellt, dass eine Kombination von Faktoren eine entscheidende Rolle bei der Vorhersage der Abbruchquoten spielte. Akademische Fähigkeiten hatten den grössten Einfluss, was mit bestehenden Theorien übereinstimmt, die nahelegen, dass eine solide Grundlage in Lesen und Mathe zu positivere Bildungsergebnissen führen kann.
Zusätzlich trugen auch andere Faktoren wie Motivation und familiärer Hintergrund zur Vorhersage bei. Beispielsweise hatten Schüler, deren Eltern höhere Bildungsabschlüsse hatten, tendenziell bessere Leistungen in der Schule und waren weniger wahrscheinlich, abzubrechen.
Implikationen für Pädagogen
Die entwickelten prädiktiven Modelle könnten eine wichtige Rolle bei der Unterstützung von Pädagogen spielen. Indem sie Schüler frühzeitig identifizieren, die gefährdet sind, abzubrechen, können Schulen gezielte Interventionen umsetzen. Dazu könnten zusätzliche Nachhilfe, Beratung oder sogar Familienunterstützungsprogramme gehören.
Die entscheidende Erkenntnis ist, dass Strategien zur Verhinderung des Abbruchs am effektivsten sind, wenn sie so früh wie möglich angewendet werden. Indem sie Daten und Maschinenlernen nutzen, können Lehrer proaktive Schritte unternehmen, anstatt reaktiv zu handeln, und so ein besseres Bildungsumfeld für alle Schüler schaffen.
Einschränkungen und zukünftige Forschung
Obwohl unsere Studie Fortschritte im Verständnis der Abbruchvorhersage gemacht hat, gibt es mehrere Einschränkungen und Bereiche für zukünftige Forschung. Eine Herausforderung, der wir gegenüberstanden, war der Umgang mit fehlenden Daten. Wir haben uns entschieden, Merkmale mit einem hohen Anteil an fehlenden Werten auszuschliessen, was möglicherweise den Umfang unserer Analyse eingeschränkt hat. Zukünftige Studien sollten robuster Methoden zum Umgang mit fehlenden Daten erkunden, um einen umfassenderen Ansatz zu gewährleisten.
Darüber hinaus stammten unsere Daten hauptsächlich aus Finnland. Es wäre vorteilhaft, diese Studie in anderen Ländern oder Kulturen zu wiederholen, um zu sehen, ob dieselben Muster gelten. Bildungssysteme variieren stark, und das Verständnis dieser Unterschiede kann helfen, Interventionen zu entwickeln, die spezifische Bedürfnisse erfüllen.
Fazit
Zusammenfassend hat unsere Forschung das Potenzial aufgezeigt, Maschinenlernen zu nutzen, um den Abbruch in der oberen Sekundarstufe bereits in der Grundschule vorherzusagen. Durch die Analyse eines umfangreichen Datensatzes, der über 13 Jahre gesammelt wurde, identifizierten wir Schlüsselfaktoren, die zur Schülerbindung beitragen. Die Ergebnisse deuten darauf hin, dass mit den richtigen Werkzeugen und Daten Pädagogen gefährdete Schüler früher identifizieren und sie besser auf ihrem Bildungsweg unterstützen können.
Diese prädiktiven Modelle bieten eine neue Möglichkeit, dem Abbruch vorzubeugen und von reaktiven Lösungen proaktive Unterstützung zu schaffen. Wenn wir in die Zukunft blicken, wird eine weitere Validierung und Erforschung dieser Modelle entscheidend sein, um unser Verständnis der Abbruchdynamik zu verfeinern und die Bildungsergebnisse für alle Schüler zu verbessern.
Titel: Machine Learning Predicts Upper Secondary Education Dropout as Early as the End of Primary School
Zusammenfassung: Education plays a pivotal role in alleviating poverty, driving economic growth, and empowering individuals, thereby significantly influencing societal and personal development. However, the persistent issue of school dropout poses a significant challenge, with its effects extending beyond the individual. While previous research has employed machine learning for dropout classification, these studies often suffer from a short-term focus, relying on data collected only a few years into the study period. This study expanded the modeling horizon by utilizing a 13-year longitudinal dataset, encompassing data from kindergarten to Grade 9. Our methodology incorporated a comprehensive range of parameters, including students' academic and cognitive skills, motivation, behavior, well-being, and officially recorded dropout data. The machine learning models developed in this study demonstrated notable classification ability, achieving a mean area under the curve (AUC) of 0.61 with data up to Grade 6 and an improved AUC of 0.65 with data up to Grade 9. Further data collection and independent correlational and causal analyses are crucial. In future iterations, such models may have the potential to proactively support educators' processes and existing protocols for identifying at-risk students, thereby potentially aiding in the reinvention of student retention and success strategies and ultimately contributing to improved educational outcomes.
Autoren: Maria Psyridou, Fabi Prezja, Minna Torppa, Marja-Kristiina Lerkkanen, Anna-Maija Poikkeus, Kati Vasalampi
Letzte Aktualisierung: 2024-03-01 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2403.14663
Quell-PDF: https://arxiv.org/pdf/2403.14663
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.