AISLE: Adaptive Statistical Language Learning

 

Im Zeitalter der Globalisierung muss Bildung international ausgerichtet sein, um im weltweiten Wettbewerb zu bestehen. Das wichtigste Werkzeug dabei ist die Sprache. International gilt Englisch als die Weltsprache: doch Englisch ist nicht gleich Englisch! Die sprachlichen Merkmale und die Aspekte der Sprachkompetenz, die in Bildungskontexten und Wissenschaftskontexten erforderlich sind, gehen über die spontane und typischerweise informelle Sprache hinaus, die im alltäglichen sozialen Leben der meisten Studierenden verwendet wird. Die Komplexität und hohe Informationsdichte von akademischem Englisch erweisen sich dabei als die größten Herausforderungen. Dabei spielt die Größe sowie Komplexität und Diversität des einem Individuum zur Verfügung stehenden Wortschatzes eine wesentliche Rolle.

Generell werden Wortschatzkenntnisse als unverzichtbarer Bestandteil der akademischen Lese- und Schreibfähigkeiten anerkannt, die wiederum direkt mit akademischem Erfolg, wirtschaftlichen Chancen und gesellschaftlichem Wohlergehen gekoppelt sind. Die Abbildung 1 veranschaulicht die Beziehung zwischen Vokabelkenntnissen und Leseverstehen, d.h. die Textabdeckung (text coverage) in Verbindung mit dem Wissen von 2.000, 3.000, 5.000 und 10.000 Wörtern.

  Abbildung 1: Beziehung zwischen Vokabelkenntnissen und Leseverstehen Abb. 1: Beziehung zwischen Vokabelkenntnissen und Leseverstehen: Die Prozentwerte repräsentieren die Textabdeckung (text coverage) mit Wissen von 2.000, 3.000, 5.000 und 10.000 Wörtern.

Ein weit verbreiteter Fehlannahme ist, dass die Schwierigkeit vor allem in der Aneignung von Fachterminologie liegt. Neuere Arbeiten haben jedoch gezeigt, dass die Hauptschwierigkeit sowohl für muttersprachliche als auch für nicht muttersprachliche Sprecher tatsächlich in der hohen Informationsdichte des akademischen Englisch liegt. Die Bewältigung dieser Schwierigkeit erfordert nicht nur die Kenntnis eines großen hochfrequenten akademischen Vokabulars, sondern auch die Beherrschung von Mehrwortsequenzes (n-grams und skip-grams), das heißt kontinuierlichen oder diskontinuierlichen, häufig wiederkehrenden Wortketten unterschiedlicher Größe. Tatsächlich rücken in den aktuellen theoretischen Modellen der Sprach- und Wissenstheorie zunehmend Sequenzen in den Vordergrund, die eine prädiktive Verarbeitung erleichtern und den Spracherwerb fördern.

Frühere Forschungen zum Wortschatzwachstum (insbesondere in der Population der Zweitsprachenlernenden) haben eher niedrige Lernraten festgestellt, das heißt 200 bis 500 Wörter pro Jahr. Solche niedrigen Wachstumsraten sind eher entmutigend angesichts des Zieles des Wortschatzgroße, die für spezifische Leseaufgaben festgelegt wurden (für das akademische Lesen werden circa 10.000 Wortfamilien benötigt). Diese Zielvorgaben erscheinen gigantisch, da ein typischer Lernender 20 Jahre Studium benötigt, um akademische Texte verstehen zu können. Frühere Versuche, die Wachstumsraten durch expliziten Unterricht oder den extensiven Leseansatz zu beschleunigen, haben zu niedrigen Erwerbsquoten geführt, was die Unzulänglichkeit solcher Ansätze beweist.

Angesichts dieser Herausforderungen verfolgte das AISLE-Projekt geleitet von PD Dr. Elma Kerz (FB7) und Professor Tobias Meisen (FB4) (ehemaliger Juniorprofessor und Geschäftsführer des Lehrstuhls Informationsmanagement im Maschinenbau (IMA) an der RWTH Aachen, derzeit die Bergische Universität Wuppertal) ein zweifaches Ziel:

  1. die Entwicklung eines adaptives und personalisiertes Lernsystems, in dem das Erwerb der Sprachkenntnisse im Bereich des wissenschaftliches Englisch verfolgt und beschleunigt werden kann, und
  2. die Nutzung der vom System generierten dichten Längsschnittdaten, um die Dynamik von Wachstumsverläufen zu verstehen und ihren Zusammenhang mit individuellen Unterschieden in einer Reihe von kognitiven Fähigkeiten sowie affektive Faktoren wie Persönlichkeitsmerkmale zu untersuchen.

Innerhalb der Projektlaufzeit gelang es dem Team, einen webbasierten und funktionsfähigen Prototyp des AISLE-Systems mit seinem Back- und Frontend zu entwickeln. Um optimale Wiederholungsintervalle zu garantieren, verfolgte das AISLE-System den individuellen Fortschritt der Lernfortschritte jedes einzelnen Schülers. Für eine Stichprobe von 60 Teilnehmern aus der Bevölkerung der RWTH Aachen wurden erfolgreich individuelle Lernkurven und Lernfortschritte ermittelt.

  Abbildung 2: Präsentation von Items und Performanzrückmeldung an den Benutzer Abb. 2: Präsentation von Items und Performanzrückmeldung an den Benutzer

Diese Population beschäftigte sich mit dem AISLE-System in einer Laborumgebung für mehrere Stunden, verteilt auf drei Sitzungen (siehe Abbildung 2 zur Veranschaulichung der Präsentation von Items und der Rückmeldung individuellen Lernkurven; siehe auch Abbildungen 3 und 4 unten für diagramme der empirischen Lernkurven und und prognostizierten Wachstumsraten sowie für individuelle Unterschiede (IDs) in den Lernraten der Teilnehmer, gemittelt über alle Items). In einem Within-Subjects Design wurde einer Gruppe von Teilnehmern eine Batterie von Aufgaben gestellt unter anderem zur Bewertung des Kurzzeitgedächtnisses und des verbalen Arbeitsgedächtnisses, zur impliziten Lernfähigkeit und inhibitorische Kontrolle.

Das Team nutzte GitLab der RWTH Aachen in erster Linie zum Austausch von Code, Literatur und Daten. Einige der wichtigsten Ergebnisse wurden bereits veröffentlicht.

  Abbildung 3: Diagramme der empirischen Lernkurven, prognostizierte Wachstumskurven und durchschnittlich vorhergesagter Wortschatzzuwachs Abb. 3: Diagramme der empirischen Lernkurven (links), prognostizierte Wachstumskurven (mitte), und durchschnittlich vorhergesagter Wortschatzzuwachs am 10., 25., 50., 75. und 90. Perzentil (rechts).

Die Ergebnisse des Projekts bildeten eine solide Grundlage für ein Folgeprojekt (z.B. DFG oder BMBF), das AISLE so skalieren wird, dass dichte Längsschnittdaten für eine große Anzahl von Lernenden und unterschiedliche Populationen über einen längeren Zeitraum generiert werden können.

  Abbildung 4: Vorhergesagte Lernkurven für Individuen mit höheren oder niedrigeren NFC-Werten und höher und niedrigere Bewertungen auf der Offenheit Persönlichkeitsdimension Abb. 4: Vorhergesagte Lernkurven für Individuen mit höheren oder niedrigeren NFC-Werten (links) und höher und niedrigere Bewertungen auf der Offenheit Persönlichkeitsdimension (mitte). Das Diagramm rechts zeigt die Ergebnisse des endgültigen Modells.

Eine solche Datenbasis hat das Potenzial, unser derzeitiges Verständnis des Wortschatzwachstums zu verändern und wird ein Fenster zu den Mechanismen und Prinzipien bieten, die der kognitiven und sprachlichen Entwicklung im Allgemeinen zugrunde liegen.