Klett Akademie für Fremdsprachendidaktik

Datengesteuertes Lernen: Lexiko-grammatische Kenntnisse erweitern und sprachliche Zweifelsfälle lösen

von Dirk Siepmann

Sowohl das englischsprachige Internet in seiner Gesamtheit als auch spezifische dort verfügbare Sprachdatenbanken bzw. Korpora können den heutigen Englischunterricht in vielfältiger Weise bereichern. Im Folgenden soll es dabei vorrangig um die direkte Nutzung von Korpora im Rahmen eines entdeckenden Lernens gehen; allerdings soll auch das Ziel verfolgt werden, Lehrende in die Lage zu versetzen, mithilfe von Korpora selbständig reichhaltige Lernmaterialien zu erstellen, die das oben skizzierte ‚konstruktionelle‘ Bild von Sprache fördern.

Die elektronische Verfügbarkeit von Texten in großen Textarchiven, die nach bestimmten soziolinguistischen Prinzipien zusammengestellt werden (üblicherweise ‚Korpora‘ genannt), hat die Sprachwissenschaft und -didaktik über die letzten dreißig Jahre in entscheidender Weise verändert. Man unterscheidet im Allgemeinen zwischen einsprachigen und zwei- oder mehrsprachigen Korpora. Bei letzteren ist eine weitere Unterteilung in Übersetzungs- und Parallelkorpora sinnvoll: Parallelkorpora bestehen aus Paralleltexten in verschiedenen Sprachen, enthalten also gleiche Mengen von Texten der gleichen Textsorte, die im Idealfall zum gleichen Zeitpunkt verfasst wurden und sich an eine ähnliche Leserschaft wenden. Übersetzungskorpora enthalten, wie der Name schon sagt, Originaltexte und deren Übersetzungen in ein oder mehrere Sprachen. Hier soll es in erster Linie um einsprachige Korpora des Englischen gehen.

Die durch die Korpuslinguistik eröffnete Möglichkeit, riesige Mengen von sprachlichen Äußerungen gleichzeitig in den Blick zu nehmen und so Regularitäten im Sprachgebrauch aufzudecken, hat zu einem neuen Bild von Sprache geführt, das erhebliche Relevanz für den Fremdsprachenunterricht hat. In methodischer Hinsicht ist dieses Bild einigen leicht einsichtigen Vorteilen des korpuslinguistischen Ansatzes geschuldet, die auch für seinen Einsatz im Unterricht gelten (vgl. Siepmann 1999):

  • Exhaustivität: problemlose Erfassung aller Erscheinungsformen eines sprachlichen Phänomens
  • Authentizität: alle Belege für ein Phänomen entstammen dem tatsächlichen Sprachgebrauch
  • Neutralität: während introspektiv arbeitende Forschende oder Lehrende u.U. auf stilistisch ungewöhnliche Phänomene fokussieren, lenkt die Korpusanalyse den Blick auch auf das Alltägliche und Banale, welches im Zweitsprachenerwerb vorrangig ist

In der Sprachdidaktik entwickelte sich ein neuer induktiver Zugang zu sprachlichen Phänomenen, der auch als ‚data-driven learning‘ bezeichnet wird. Einer der Hauptvorteile eines datengesteuerten Vorgehens besteht darin, gleichsam die sprachliche Spreu vom Weizen trennen zu können, d.h. dem Korpusnutzer wiederholt vorkommende Konstruktionen in einer Weise vor Augen zu führen, die selbst der muttersprachlichen Intuition häufig verschlossen sind. Dies lässt sich anhand sogenannter Konkordanzen, d.h. einer Sammlung aufeinanderfolgender Textzeilen, die einen gesuchten Ausdruck jeweils zentral aufführen, recht einfach demonstrieren (die Beispiele sind mit der Korpusanalyseplattform Sketchengine erstellt worden, die für Bildungsinstitutionen frei nutzbar ist; s. https://www.sketchengine.co.uk/elexis/):

Auszug Sketchengine 1 (vergrößerte Darstellung s. unten):

Auszu_Sketchengine1_Bild

Quelle: Sketchengine, Korpus des Autors

Aus dieser (hier nur zum Teil abgebildeten) Konkordanz aus einem sprechsprachlichen Korpus geht z.B. hervor, dass

a) die Bedeutung „längere Zeit etwas nicht tun (können)“ im Englischen regelmäßig mit „go + Zeiteinheit + without + V-ing“ ausgedrückt wird und

b) die innerhalb der Konstruktion besonders gebräuchlichen Zeiteinheiten beschränkt sind auf das Spektrum von minute bis year.

Ein solches datenorientiertes Vorgehen speist sich aus der Erkenntnis, dass Formorientierung und Sprachbewusstheit für die Entwicklung fremdsprachlicher Kompetenz unabdingbar sind (vgl. die Metaanalyse von Norri/Ortega 2000) und integraler Bestandteil eines modernen, der konstruktivistischen Lerntheorie verpflichteten Fremdsprachenunterrichts sein sollten. Je stärker Lernende das sprachliche Material bewusst wahrnehmen (sog. ‚noticing‘), desto wahrscheinlicher ist es, dass fremdsprachliches Input, welches ihnen über verschiedene Quellen (Lehrkraft, Medien, Gespräche mit Muttersprachlern etc.) zugeführt wird, tatsächlich zu einem Teil der Lernersprache, also zu Intake wird.


 Auszug Sketchengine 1 (PDF, 176.52 KB)

Für einfache Fragestellungen können Internet-Suchmaschinen genutzt werden. Zu diesen Fragestellungen gehören:

a) Ist Wendung X korrekt? > Wendung in einer Form, die vermutlich häufig auftritt, in Anführungszeichen eingeben (z.B. „achieves an effect“)
b) Welche Varianten einer unterbrochenen Wortfolge lassen sich finden? > Wendung mit einem oder mehreren Sternchen eingeben (z.B. „is very * to use“ führt zu Ergebnissen wie „is very easy / simple / difficult / pleasant to use“ etc.).
c) Wie wird ein bestimmter Satzanfang typischerweise fortgesetzt? > automatische Vervollständigung einschalten; dann Text ohne Anführungszeichen eingeben (z.B. the real reason why > Spaniards eat late, Valerian flopped at the box office, he goes days without talking to you etc.)?

Auf diese Weise lassen sich auch recht komplexe sprachliche Fragen durch einige Überlegung lösen, wie z.B. der Präpositionsgebrauch mit Ereignisnomina des Typs concert oder Ortsnomina des Typs moor. Zunächst gilt es, aus der muttersprachlichen Intuition heraus einen typischen Verwendungskontext zu ermitteln, in dem diese Nomina vorkommen; ein gemeinsames Auftreten mit meet bzw. live ist z.B. sehr wahrscheinlich.  Die Eingabe könnte dann z.B. lauten: „met at a concert“ oder „met during a concert“ oder „met on a concert“ (in Verbindung mit site:co.uk). Eine Durchsicht der Ergebnisse würde zeigen, dass fast nur „at a concert“ und „on the/a moor“ auftreten.

Mit dem Google Ngram Viewer (https://books.google.com/ngrams) lassen sich auch Fragen der zeitlichen Variabilität von Sprache auf eine für linguistische Laien praktikable Weise lösen, wie z.B. die Frage, ob die Form „pleasanter“ grundsätzlich noch akzeptabel ist und wie sich ihre Häufigkeit im Vergleich zu „more pleasant“ im Laufe der letzten 100 Jahre entwickelt hat. Es zeigt sich, dass der Gebrauch der Form in einem kontinuierlichen Rückgang begriffen ist, aber sie in manchen Kontexten durchaus weiterhin als korrekt gelten kann.

Webdienste wie linguee, Babel, Reverso oder Pons bieten kurze Paralleltexte auf der Grundlage von Übersetzungen an. Mithilfe von linguee lassen sich leicht verschiedene Übersetzungslösungen für idiomatische Wendungen ermitteln, die weit über das in zweisprachigen Wörterbüchern Verzeichnete hinausgehen. So findet man z.B. für „move the goalposts“ die folgenden einigermaßen brauchbaren deutschen Äquivalente: „die Regeln mitten im Spiel ändern“, „auf halbem Weg die Richtung ändern“, „die Paradigmen ändern“. Da die Übersetzungslösungen immer nur so gut sind wie die häufig nicht-professionellen Übersetzer, die diese erstellen, ist natürlich immer Vorsicht geboten, vor allem bei der Übersetzung in die Fremdsprache.

Ein echtes korpuslinguistisches Werkzeug, das leicht im Unterricht einzusetzen und mit einem umfangreichen Internetkorpus verbunden ist, liefert die Universität Leeds (http://corpus.leeds.ac.uk/internet.html). Lernende können entweder eine Konkordanz eines Suchwortes abrufen oder eine Kollokationsliste berechnen lassen. Es gibt eine Reihe weiterer Korpora dieser Art, von denen manche eine kostenfreie Registrierung erfordern (z.B. Varitext: http://syrah.uni-koeln.de/varitext/ oder Emobase: http://emolex.u-grenoble3.fr/emoBase/) und die vielfältigere Recherchemöglichkeiten bieten (s. dort). 

Eine Fundgrube für die Wortschatzlehre bietet schließlich die kanadische Webseite Lextutor (https://lextutor.ca/). Hier können Englischlehrende und -lernende z.B. ein Frequenzprofil eines Textes erstellen, der über Copy-And-Paste eingefügt wird (Vocabprofile), Konkordanzen erstellen (Concordance), Tests zur Einschätzung des eigenen Wortschatzniveaus durchführen (Tests), Schlüsselwörter zu einem Text extrahieren (Key Words) und vieles mehr.

Waren die Pioniere des data-driven learning wie Tim Johns häufig noch auf theoriegeleitete Vermutungen über die Effektivität dieser Methodik angewiesen, so liegen inzwischen zahlreiche einschlägige empirische Belege vor, die für den wohldosierten Einsatz korpuslinguistischer Verfahren auch im schulischen Unterricht sprechen (z.B. Geist/Hahn 2012, Schaeffer-Lacroix 2009). Auch die aus der Wörterbuchnutzerforschung bekannte Tatsache, dass Nutzer und Nutzerinnen die eigene Sprachproduktion vor allem auf Beispiele (statt z.B. auf Valenzmuster und Kollokationsangaben) stützen, kann hier ins Feld geführt werden, denn Konkordanzen sind nichts anderes als unbearbeitete authentische Beispiele.

Es liegt in der Natur der Sache, dass die dabei angestrebten Lernziele in erster Linie die Erweiterung der Sprachbewusstheit und der Sprachkompetenz betreffen, einschließlich der Diskurs- und soziolinguistischen Teilkompetenzen und der Lehrwerkkritik; bisherige Studien nehmen z.B. Wortschatz (Cobb et al. 2001), Grammatik (Schmied 2006), Aussprache (Gut 2006), Genres (Varley 2009), diasystematische Variation (Tyne 2009) oder diskursive Aspekte (Charles 2011) in den Blick. In einem methodisch durchdachten Fremdsprachenunterricht sollten derartige Lernziele natürlich nur gelegentlich in Isolation, in der Regel aber eher im Verbund mit anderen Lernzielen und damit auch mit anderen medialen Lernarrangements verfolgt werden (z.B. Besprechung von diasystematischer Variation im Zusammenhang mit der Einführung von Zeitungstexten oder in einer Reihe zum interkulturellen Lernen).

Bei der Arbeit mit authentischen Daten empfiehlt sich, wie auf vielen anderen Gebieten auch, eine Progression von einfachen zu komplexeren Lernarrangements. Zu Beginn dürfte die Vorlage von computergenerierten Materialien in Papierform (siehe zu Beispielen den folgenden Abschnitt) gegenüber der direkten Nutzung von Konkordanzprogrammen vorzuziehen sein; es besteht im Allgemeinen auch eine lernerseitige Präferenz für geschlossene Übungen mit klaren Zielen (Schmied 2006). Stehen genug Computerarbeitsplätze mit Internetanschluss zur Verfügung, kann in einem zweiten Schritt die gelegentliche Nutzung von öffentlich verfügbaren Korpora ebenfalls sinnvoll sein, die mit der Zeit in eine stärkere Individualisierung und schließlich die Konstruktion eigener Korpora durch die Lernenden münden kann (Charles 2011).

Da eine Einführung in die direkte Nutzung von Konkordanzprogrammen einerseits besser am Computer selbst stattfindet, aber andererseits, wie oben bereits erläutert, der Einstieg in das data-driven learning zunächst über gedruckte Konkordanzauszüge erfolgen sollte, seien hier einige Übungstypen für solche Printmaterialien vorgestellt, die auch direkt in den Unterricht transferierbar sind. Das hier Dargestellte dürfte etwa ab dem vierten Lernjahr umsetzbar sein. Zusätzlich findet sich hier ein Worksheet, das Lernende in englischer Sprache in den Gebrauch von Korpora einführt.

Grundsätzlich folgen diese Übungen einem induktiven Dreischritt aus

  1. beobachten (je nach Lerngruppe mit mehr oder weniger offenen Fragestellungen)
  2. identifizieren (z.B. durch Unterstreichung in verschiedenen Farben)
  3. klassifizieren und generalisieren (z.B. in einer Tabelle)

Übung 1: Konstruktionelle Eigenschaften von Wörtern

In diesem ersten Übungstyp sollen die Lernenden konstruktionelle Eigenschaften von Wörtern, d.h. deren Valenz (also die Kombinationen des Wortes mit allgemeinen Platzhaltern wie sb und sth: z.B. envy sb sth) und Kollokativität (also die Kombination des Wortes mit bestimmten anderen Wörtern, z.B. great entertainment), ermitteln. Die Auswahl der Konkordanzzeilen und die Fragestellungen zielen auch darauf ab, den Lernenden den engen Zusammenhang zwischen Valenz und Bedeutung zu verdeutlichen (sth lasts + time period = dauern; sb lasts + time period = durchhalten; sth lasts sb + time period = (aus)reichen, genügen; sth lasts = andauern, sich fortsetzen, bestehen).

“Look at the following concordance of the verb last. What are the typical patterns that last enters into and what meanings do these patterns encode?”

Auszug Sketchengine Übung 1 (vergrößerte Darstellung s. unten):

 Diehr_Siepmann_Step1

Quelle: Sketchengine, Korpus des Autors

Übung 2: Der Subjunctive

Dieser Übungstyp soll das Sprachbewusstsein der Lernenden für den Gebrauch des Subjunctive in der Schriftsprache schärfen. Aufgabe ist es zu ermitteln, welche Typen von Verben jeweils den Subjunctive ‚auslösen‘.

“See if you can spot the verbs that ‘trigger’ the subjunctive in the following example sentences. What meaning component do they have in common?”

Taking this even further, advocates are now pushing that this be changed to a requirement for “equivalent” laws.
The diagnosis requires that the following criteria be met: …
Henry Abalone recently suggested that literary scholars have clung to the idea of companionate marriage, long after historians demanded that Stone’s book be pulped …
The report recommends that all staff be made aware of the importance of intellectual property rights.
The king had given orders that Ruhm be spared after her husband was martyred.

Übung 3: Who, that or which?

Wann und in welchen Kontexten werden welche Relativpronomen präferiert? Hier geht es darum zu zeigen, dass z.B. mit einem Kollektivnomen wie population der Gebrauch des Relativpronomens variiert, je nachdem, ob auf das Relativpronomen ein Singular oder ein Plural folgt.

“Look at the following two sets of concordance lines. What difference can you detect? How would you explain this difference?”
 
 Auszüge Sketchengine Übung 3 (vergrößerte Darstellung s. unten):

Diehr_Siepmann_Step3a

Diehr_Siepmann_Step3b
Quelle: Sketchengine, Korpus des Autors

Übung 4: Synonyme

Die folgende Übung behandelt die distinktive Synonymik an einem relativ einfachen Beispiel: mist und fog. In der linken Tabelle sind die Verben zu sehen, mit denen mist (grün) und fog (rot) als Subjekt auftreten, in der rechten Tabelle die Adjektive, die attributiv mit den beiden Wörtern gebraucht werden.

“The following table shows differences in the types of nouns and adjectives that combine with mist (green), fog (red) and both these nouns (grey). What do the preferences in combinatory behaviour tell us about the difference in meaning between the two nouns?”

Auszüge Sketchengine Übung 4 (vergrößerte Darstellung s. unten):

Diehr_Siepmann_Step4
Quelle: Sketchengine, Korpus des Autors

Die Lernenden sollen zu der Einsicht gelangen, dass mist einen Nebel mittlerer Dichte bezeichnet, während fog (z.B. dense, peasouper, blanket, thicken) einen dicken, undurchsichtigen und potentiell überfrierenden (freezing) Nebel bezeichnet sowie darüber hinaus giftige Dämpfe (noxious). Mist ist im Gebrauch stärker mit bestimmten Tages- und Jahreszeiten verbunden (morning, dawn; fog allerdings auch mit night), ist ‚beweglicher‘ (sweep) und ‚leichter‘ (hover). Fog hat zudem die Eigenschaft, menschliche Tätigkeiten zu behindern (hamper, delay).

Übung 5: Variation

In der folgenden Übung geht es darum zu erkennen, dass der Sprachgebrauch in Abhängigkeit vom Genre variiert. Care als Substantiv wird in der gesprochenen Sprache (erster Auszug) sehr häufig in der Wendung take care (of) sowie in der Bedeutung ‚Sorgfalt‘ verwendet, im akademischen Sprachgebrauch (zweiter Auszug) dagegen meist in der Bedeutung ‚Pflege, Versorgung‘, wobei Komposita dominieren.

“The following two sets of concordances are taken from a) a corpus of spoken language and b) a corpus of academic language. How does the use of care differ between these two corpora?”
 
 Auszüge Sketchengine Übung 5 (vergrößerte Darstellung s. unten):

Diehr_Siepmann_Step5b

Diehr_Siepmann_Step5b

Quelle: Sketchengine, Korpus des Autors

Zum Weiterlesen:

  • Friginal, Eric (2018): Corpus Linguistics for English Teachers. New York/Abingdon: Routledge.
  • Reppen, Randi (2010): Using Corpora in the Language Classroom. Cambridge: Cambridge UP.


 Arbeitsblatt_Data-driven learning (DOCX, 38.91 KB)
 Auszug Sketchengine Übung 1 (PDF, 115.51 KB)
 Auszüge Sketchengine Übung 3 (PDF, 135.56 KB)
 Auszüge Sketchengine Übung 4 (PDF, 79.53 KB)
 Auszüge Sketchengine Übung 5 (PDF, 181.99 KB)