Korpusanalyse digitaler Schüler*innentexte

Das Projekt "Korpusanalyse digitaler Schüler*innentexte" zielt darauf ab, mithilfe von Data-Science-Methoden und künstlicher Intelligenz typographische Besonderheiten sowie Auffälligkeiten in Texten von Schüler*innen zu identifizieren und zu analysieren. Der Fokus liegt hierbei zum Beispiel auf der Erfassung von Interjektionen – kurzen Äußerungen wie Ausrufen oder Emotionen – und deren Einfluss auf den Text.

Titel des Projekts:

Projektpartner:

Ansprechpartner:

Korpusanalyse digitaler Schüler*innentexte
Didaktik der deutschen Sprache und Literatur mit Schwerpunkt Sprachdidaktik / Germanistik
Prof.in Dr. Kirsten Schindler (kschindler[at]uni-wuppertal.de)

Um den Wissenstransfer über den Einsatz von Data-Science-Techniken, darunter Text Mining, NLP (Natural Language Processing) und maschinelles Lernen, zu fördern, wird gemeinsam ein erster Prototyp eines automatisierten Analysewerkzeugs entwickelt, das in der Lage ist, die von Schüler*innen verfassten Texte zu verarbeiten und bei der explorativen Analyse eines entsprechenden Textkorpus zu unterstützen.

Die Ziele des Prototyps sind unter anderem:

Identifikation typografischer Besonderheiten: Das System wird in die Lage versetzt, spezifische typografische Merkmale in den Texten zu erkennen und zu markieren, wie etwa in Bezug auf den Schriftschnitt und Textfont, also die Verwendung von fettgedrucktem oder farbigem Text, besondere Schriftgrößen oder auch den Einsatz von Großbuchstaben (Versalien als orthographische Abweichungen) und Sonderzeichen.

Identifikation von Interjektionen: Das System wird darauf trainiert, Interjektionen in den Texten zu erkennen und zu markieren. Hierbei können Ausrufe (Symptominterjektionen) wie "Wow!", Responsive wie "Nein!" oder andere Formen erkannt werden.

Die gewonnenen Erkenntnisse können für unterrichtliche Zwecke genutzt werden, um Lehrkräften Einblicke in musterhafte Formulierungsausdrücke und stilistische Präferenzen von Schüler*innen unterschiedlicher Altersstufen zu geben. Die gewonnenen Erkenntnisse tragen dazu bei, empirische, über eine größere Textmenge gestützte Einsichten in die Formulierungsleistungen von Schüler*innen unterschiedlicher Altersstufen zu erfassen. Der Blick auf Phänomene wie Typographie und Interjektion erweitert zudem den bisherigen Diskurs um Schreibkompetenzen von Schüler*innen. Ein vertieftes Verständnis der verwendeten Data-Science-Methoden wird durch die Durchführung gemeinsamer Workshops unterstützt.

Consent Management Platform von Real Cookie Banner