Mein Wissenschafts-Nachhilfe-Projekt: Eine neue Art zu lernen
MyST zielt darauf ab, das Wissenschaftslernen von Kindern durch virtuelles Tutoring zu verbessern.
― 5 min Lesedauer
Inhaltsverzeichnis
- Hintergrund
- Was ist das MyST-Korpus?
- Zweck des Korpus
- Der virtuelle Tutor
- Datensammlungsprozess
- Transkription der Daten
- Datenqualität und Bereinigung
- Ergebnisse des Projekts
- Struktur des MyST-Korpus
- Bedeutung des MyST-Korpus
- Vergleich mit anderen Sprachkorpora
- Zukünftige Richtungen
- Fazit
- Originalquelle
- Referenz Links
Dieser Artikel beschreibt ein Projekt namens My Science Tutor (MyST), das eine grosse Menge an gesprochenen Gesprächen von Kindern gesammelt hat. Das Ziel dieses Projekts war es, zu verbessern, wie Kinder Wissenschaft lernen. Der Fokus liegt auf Kindern in den Klassen drei bis fünf und es sind etwa 1.300 Schüler beteiligt, wobei rund 400 Stunden ihrer Sprache während Interaktionen mit einem virtuellen Wissenschaftstutor gesammelt wurden.
Hintergrund
Viele Schüler in den USA haben Schwierigkeiten mit Wissenschaft. Ein nationaler Test hat gezeigt, dass eine grosse Anzahl von Viert-, Acht- und Zwölftklässlern nicht kompetent in Wissenschaft ist. Dieses Problem hat sich über die Jahre verschärft, und während der COVID-19-Pandemie gab es erhebliche Herausforderungen, die das Lernen der Schüler weiter beeinträchtigten. Das MyST-Projekt hatte das Ziel, bessere Wege zu finden, um Schüler durch Interaktion mit einem computerbasierten Tutor zu unterstützen.
Was ist das MyST-Korpus?
Das MyST-Korpus ist eine Sammlung von Gesprächen zwischen Grundschülern und einem virtuellen Wissenschaftstutor. Diese Ressource umfasst fast 400 Stunden Dialoge, die aus verschiedenen Interaktionen in mehreren Wissenschaftsbereichen bestehen. Die Gespräche wurden während 10.500 virtuellen Tutorsitzungen gesammelt.
Zweck des Korpus
Das Hauptziel der Sammlung dieser Sprachdaten ist es, Systeme zu entwickeln und zu verbessern, die gesprochene Sprache automatisch erkennen und verstehen können. Das kann nützlich sein, um bessere Bildungswerkzeuge zu schaffen und die Erfahrung der Schüler beim Lernen von Wissenschaft zu verbessern. Das MyST-Korpus kann Forschern und Entwicklern helfen, effektivere Tutoren-Systeme zu erstellen, die das Lernen von Wissenschaft für Kinder spannender und lustiger machen.
Der virtuelle Tutor
Der virtuelle Tutor, namens Marni, wurde entwickelt, um Gespräche mit Schülern zu führen. Das Ziel ist es, die Schüler dazu zu bringen, ihre Gedanken und ihr Verständnis laut zu erklären. Indem er Selbst-Erklärungen fördert, hilft der virtuelle Tutor den Kindern, tiefer über die Wissenschaftsinhalte nachzudenken, die sie lernen. Der Tutor nutzt lebensechte Animationen, die es sich anfühlt, als würde eine echte Person mit den Schülern sprechen.
Datensammlungsprozess
Das MyST-Projekt sammelte Daten in zwei Hauptphasen. In beiden Phasen stimmt der Inhalt mit den etablierten Lehrplänen für Wissenschaft in den Klassenräumen überein. Die Schüler interagierten mit dem virtuellen Tutor, nachdem sie praktische wissenschaftliche Aktivitäten in ihren Klassen abgeschlossen hatten. Jede Interaktion dauerte etwa 15 bis 20 Minuten.
Während dieser Zeit stellte der Tutor Fragen dazu, was die Schüler gelernt hatten, förderte das Nachdenken und forderte die Schüler auf, ihre Antworten zu erklären. Die Schüler trugen Headsets, um zu sprechen, und ihre Antworten wurden als separate Audiodateien aufgezeichnet.
Transkription der Daten
Ein grosser Teil der aufgezeichneten Gespräche wurde transkribiert. In der ersten Phase kamen detaillierte Transkriptionsmethoden zum Einsatz, um so viele Informationen wie möglich genau zu erfassen. In der zweiten Phase wurde eine schnellere Methode verwendet, um effizienter mehr Daten zu transkribieren.
Datenqualität und Bereinigung
Qualität ist entscheidend für die gesammelten Daten, daher wurden mehrere Schritte unternommen, um sicherzustellen, dass die Aufnahmen und Transkriptionen zuverlässig sind. Dazu gehörte die Überprüfung der Audioqualität, die Bereinigung von Fehlern und die Gewährleistung, dass alle identifizierenden Informationen über die Schüler vertraulich blieben.
Ergebnisse des Projekts
Während der Studie wurde festgestellt, dass Schüler, die mit dem virtuellen Tutor interagierten, bedeutende Lernfortschritte in der Wissenschaft erzielt haben. Die Verbesserungen waren ähnlich wie bei Schülern, die mit erfahrenen menschlichen Tutoren lernten. Feedback von Lehrern deutete darauf hin, dass das Programm gut in den bestehenden Lehrplan integriert werden könnte. Viele Schüler äusserten auch eine grössere Begeisterung für das Studium der Wissenschaft.
Struktur des MyST-Korpus
Das MyST-Korpus hat eine spezifische Organisation, damit Forscher die Daten leicht abrufen können. Es umfasst verschiedene Abschnitte für Training, Evaluierung und Testen der Leistung von Spracherkennungssystemen. Jedes Gespräch ist mit einer einzigartigen Kennung verknüpft, die eine einfache Nachverfolgung und Referenz ermöglicht.
Bedeutung des MyST-Korpus
Ein grosses und öffentlich zugängliches Datenbank für die gesprochene Sprache von Kindern wird Forschern und Entwicklern helfen, bessere Systeme zum Verständnis der Sprachmuster von Kindern zu erstellen. Dies kann zu verbesserten Werkzeugen für Lernende und Lehrer führen. Das MyST-Korpus kann neue Forschungen inspirieren, die sich auf die Sprache von Kindern konzentriert, und kann die Bildungstechnologie erheblich beeinflussen.
Vergleich mit anderen Sprachkorpora
Obwohl das MyST-Korpus umfangreich ist, ist es eine von mehreren Datenbanken, die existieren, um die Sprache von Kindern zu analysieren. Andere Sammlungen konzentrieren sich auf Kinder unterschiedlichen Alters und Sprachtypen. Das MyST-Projekt ist jedoch einzigartig, da es sich speziell auf Gespräche über das Lernen von Wissenschaft während echter Tutoring-Sitzungen konzentriert.
Zukünftige Richtungen
Während das Projekt fortschreitet, gibt es Pläne, das Korpus weiter zu verfeinern. Dazu gehört die Bereinigung verbleibender Fehler in den Daten und die Veröffentlichung aktualisierter Versionen, wenn nötig. Das Ziel ist es, sicherzustellen, dass das MyST-Korpus eine wertvolle Ressource für laufende Forschung und Entwicklung im Bereich der automatischen Spracherkennung und Bildungstechnologie bleibt.
Fazit
Das My Science Tutor-Projekt stellt einen bedeutenden Versuch dar, die Wissenschaftsausbildung für junge Lernende zu verbessern. Durch die Sammlung und Analyse von Gesprächen zwischen Schülern und einem virtuellen Tutor zielt das Projekt darauf ab, neue Wege zu schaffen, um das Lernen zu verbessern. Damit bietet es Forschern und Pädagogen wertvolle Ressourcen, die zu verbesserten Lehrmethoden und grösserem Engagement der Schüler in der Wissenschaft führen können.
Titel: My Science Tutor (MyST) -- A Large Corpus of Children's Conversational Speech
Zusammenfassung: This article describes the MyST corpus developed as part of the My Science Tutor project -- one of the largest collections of children's conversational speech comprising approximately 400 hours, spanning some 230K utterances across about 10.5K virtual tutor sessions by around 1.3K third, fourth and fifth grade students. 100K of all utterances have been transcribed thus far. The corpus is freely available (https://myst.cemantix.org) for non-commercial use using a creative commons license. It is also available for commercial use (https://boulderlearning.com/resources/myst-corpus/). To date, ten organizations have licensed the corpus for commercial use, and approximately 40 university and other not-for-profit research groups have downloaded the corpus. It is our hope that the corpus can be used to improve automatic speech recognition algorithms, build and evaluate conversational AI agents for education, and together help accelerate development of multimodal applications to improve children's excitement and learning about science, and help them learn remotely.
Autoren: Sameer S. Pradhan, Ronald A. Cole, Wayne H. Ward
Letzte Aktualisierung: 2023-09-23 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2309.13347
Quell-PDF: https://arxiv.org/pdf/2309.13347
Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.