Korpusanalyse digitaler Schüler*innentexte
Titel des Projekts:
Projektpartner:
Ansprechpartner:
Um den Wissenstransfer über den Einsatz von Data-Science-Techniken, darunter Text Mining, NLP (Natural Language Processing) und maschinelles Lernen, zu fördern, wird gemeinsam ein erster Prototyp eines automatisierten Analysewerkzeugs entwickelt, das in der Lage ist, die von Schüler*innen verfassten Texte zu verarbeiten und bei der explorativen Analyse eines entsprechenden Textkorpus zu unterstützen.
Die Ziele des Prototyps sind unter anderem:
Identifikation typografischer Besonderheiten: Das System wird in die Lage versetzt, spezifische typografische Merkmale in den Texten zu erkennen und zu markieren, wie etwa in Bezug auf den Schriftschnitt und Textfont, also die Verwendung von fettgedrucktem oder farbigem Text, besondere Schriftgrößen oder auch den Einsatz von Großbuchstaben (Versalien als orthographische Abweichungen) und Sonderzeichen.
Identifikation von Interjektionen: Das System wird darauf trainiert, Interjektionen in den Texten zu erkennen und zu markieren. Hierbei können Ausrufe (Symptominterjektionen) wie "Wow!", Responsive wie "Nein!" oder andere Formen erkannt werden.
Die gewonnenen Erkenntnisse können für unterrichtliche Zwecke genutzt werden, um Lehrkräften Einblicke in musterhafte Formulierungsausdrücke und stilistische Präferenzen von Schüler*innen unterschiedlicher Altersstufen zu geben. Die gewonnenen Erkenntnisse tragen dazu bei, empirische, über eine größere Textmenge gestützte Einsichten in die Formulierungsleistungen von Schüler*innen unterschiedlicher Altersstufen zu erfassen. Der Blick auf Phänomene wie Typographie und Interjektion erweitert zudem den bisherigen Diskurs um Schreibkompetenzen von Schüler*innen. Ein vertieftes Verständnis der verwendeten Data-Science-Methoden wird durch die Durchführung gemeinsamer Workshops unterstützt.