AISLE: Adaptive Statistical Language Learning

 

Im Zeitalter der Globalisierung muss Bildung international ausgerichtet sein, um im weltweiten Wettbewerb zu bestehen. Das wichtigste Werkzeug dabei ist die Sprache. International gilt Englisch als die Weltsprache: doch Englisch ist nicht gleich Englisch! Die sprachlichen Merkmale und die Aspekte der Sprachkompetenz, die in Bildungs- und Wissenschaftskontexten erforderlich sind, gehen über die spontane und typischerweise informelle Sprache hinaus, die im alltäglichen sozialen Leben der meisten Studierenden verwendet wird. Die Komplexität und hohe Informationsdichte von akademischem Englisch erweisen sich dabei als die größten Herausforderungen. Dabei spielt die Größe sowie Komplexität und Diversität des einem Individuum zur Verfügung stehenden Wortschatzes eine wesentliche Rolle.

Generell werden Wortschatzkenntnisse als unverzichtbarer Bestandteil der akademischen Lese- und Schreibfähigkeiten anerkannt, die wiederum direkt mit akademischem Erfolg, wirtschaftlichen Chancen und gesellschaftlichem Wohlergehen gekoppelt sind. Die Abbildung 1 veranschaulicht die Beziehung zwischen Vokabelkenntnissen und Leseverstehen, d. h. die Textabdeckung in Verbindung mit dem Wissen von 2.000, 3.000, 5.000 und 10.000 Wörtern.

  Abbildung 1: Beziehung zwischen Vokabelkenntnissen und Leseverstehen Beziehung zwischen Vokabelkenntnissen und Leseverstehen: Die Prozentwerte repräsentieren die Textabdeckung (text coverage) mit Wissen von 2.000, 3.000, 5.000 und 10.000 Wörtern.

Eine weit verbreitete Fehlannahme ist, dass die Schwierigkeit vor allem in der Aneignung von Fachterminologie liegt. Neuere Arbeiten haben gezeigt, dass die Hauptschwierigkeit sowohl für muttersprachliche als auch für nicht muttersprachliche Sprecher tatsächlich in der hohen Informationsdichte des akademischen Englisch liegt. Die Bewältigung dieser Schwierigkeit erfordert nicht nur die Kenntnis eines großen hochfrequenten akademischen Vokabulars, sondern auch die Beherrschung von Mehrwortsequenzen (n-grams und skip-grams), das heißt kontinuierlich oder diskontinuierlich wiederkehrenden Wortketten unterschiedlicher Größe. Tatsächlich rücken in den aktuellen theoretischen Modellen der Sprach- und Wissenstheorie zunehmend Sequenzen in den Vordergrund, die eine prädiktive Verarbeitung erleichtern und den Spracherwerb fördern.

Frühere Forschungen zum Wortschatzwachstum (insbesondere in der Population der Zweitsprachenlernenden) haben eher niedrige Lernraten festgestellt, das heißt 200 bis 500 Wörter pro Jahr. Solch niedrige Wachstumsraten sind eher entmutigend angesichts des Ziels der Wortschatzgröße, die für spezifische Leseaufgaben festgelegt wurden (für das akademische Lesen werden circa 10.000 Wortfamilien benötigt). Diese Zielvorgaben erscheinen gigantisch, da Lernende typischerweise ca. 20 Jahre Studium benötigen um akademische Texte verstehen zu können. Frühere Versuche die Wachstumsraten durch expliziten Unterricht oder den extensiven Leseansatz zu beschleunigen haben eher zu niedrigen Erwerbsquoten geführt, was die Unzulänglichkeit solcher Ansätze beweist.

Angesichts dieser Herausforderungen verfolgte das AISLE-Projekt geleitet von PD Dr. Elma Kerz (FB7) und Professor Tobias Meisen (ehemaliger Juniorprofessor und Geschäftsführer des Lehrstuhls Informationsmanagement im Maschinenbau an der RWTH Aachen; derzeit Bergische Universität Wuppertal) ein zweifaches Ziel:

  1. die Entwicklung eines adaptiven und personalisierten Lernsystems, in dem der Erwerb von Sprachkenntnissen im Bereich des wissenschaftlichen Englisch verfolgt und beschleunigt werden kann sowie
  2. die Nutzung der vom System generierten Daten um die Dynamik von Wachstumsverläufen zu verstehen und ihren Zusammenhang mit individuellen Unterschieden zu untersuchen.

Innerhalb der Projektlaufzeit gelang es dem Team einen webbasierten und funktionsfähigen Prototyp des AISLE-Systems mit einem Back- und Frontend zu entwickeln. Um optimale Wiederholungsintervalle zu garantieren, verfolgte das AISLE-System den individuellen Fortschritt der Lernerfolge jedes einzelnen Schülers bzw. jeder Schülerin. Für eine Stichprobe von 60 Teilnehmern aus dem Umfeld der RWTH Aachen wurden erfolgreich individuelle Lernkurven und Lernfortschritte ermittelt.

  Abbildung 2: Präsentation von Items und Performanzrückmeldung an den Benutzer Abb. 2: Präsentation von Items und Performancerückmeldung an den Benutzer

Diese Population beschäftigte sich mit dem AISLE-System in einer Laborumgebung für mehrere Stunden, verteilt auf drei Sitzungen (siehe Abbildung 2 zur Veranschaulichung der Präsentation von Items und der Rückmeldung individuellen Lernkurven; siehe auch Abbildungen 3 und 4 unten für Diagramme der empirischen Lernkurven und prognostizierten Wachstumsraten sowie für individuelle Unterschiede (IDs) in den Lernraten der Teilnehmer, gemittelt über alle Items). In einem Within-Subjects Design wurde einer Gruppe von Teilnehmern eine Reihe von Aufgaben gestellt unter anderem zur Bewertung des Kurzzeitgedächtnisses und des verbalen Arbeitsgedächtnisses, zur impliziten Lernfähigkeit und inhibitorische Kontrolle.

Das Team nutzte GitLab der RWTH Aachen in erster Linie zum Austausch von Codes, Literatur und Daten. Einige der wichtigsten Ergebnisse wurden bereits veröffentlicht.

  Abb. 3: Diagramme der empirischen Lernkurven (links), prognostizierte Wachstumskurven (mitte), und durchschnittlich vorhergesagter Wortschatzzuwachs am 10., 25., 50., 75. und 90. Perzentil (rechts). Abb. 3: Diagramme der empirischen Lernkurven (links), prognostizierte Wachstumskurven (mitte), und durchschnittlich vorhergesagter Wortschatzzuwachs am 10., 25., 50., 75. und 90. Perzentil (rechts).

Die Ergebnisse des Projekts bildeten eine solide Grundlage für ein Folgeprojekt (z. B. DFG oder BMBF), das AISLE so skalieren wird, dass dichte Längsschnittdaten für eine große Anzahl von Lernenden und unterschiedliche Populationen über einen längeren Zeitraum generiert werden können.

  Abbildung 4: Vorhergesagte Lernkurven für Individuen mit höheren oder niedrigeren NFC-Werten und höher und niedrigere Bewertungen auf der Offenheit Persönlichkeitsdimension Abb. 4: Vorhergesagte Lernkurven für Individuen mit höheren oder niedrigeren NFC-Werten (links) und höher und niedrigere Bewertungen auf der Offenheit Persönlichkeitsdimension (mitte). Das Diagramm rechts zeigt die Ergebnisse des endgültigen Modells.

Eine solche Datenbasis hat das Potenzial, unser derzeitiges Verständnis des Wortschatzwachstums zu verändern und wird ein Fenster zu den Mechanismen und Prinzipien bieten, die der kognitiven und sprachlichen Entwicklung im Allgemeinen zugrunde liegen.