Presse & Kommunikation

Lautwandel im Spracherwerb

von Dr. Thomas Berg

Im Laufe ihrer Sprachentwicklung verändern Kinder ihre zunächst falsche Aussprache in Richtung auf die erwachsenensprachliche Norm. So geht beispielsweise der korrekten Wiedergabe des Worts "gut" die Produktion [du:t] voraus. Hierbei stellt sich die Frage, welche Prozesse im mentalen Lexikon des Kindes bei dem Wandel von [d] zu [g] ablaufen. Die Analyse eines Fallbeispiels deutet darauf hin, daß diese und ähnliche Veränderungen nicht auf der Ebene der sprachlichen Größeneinheiten wie Merkmale, Laute und Wörter, sondern in den Verbindungen zwischen diesen Ebenen zu lokalisieren sind.

Wenn ein Kind in eine Sprachgemeinschaft hineinwächst, steht es vor der Alternative, entweder seine ersten sprachlichen Äußerungen so lange hinauszuzögern, bis es in der Lage ist, diese weitgehend erwachsenengetreu wiederzugeben oder Wörter zu einem früheren Zeitpunkt hervorzubringen, zu dem es die Voraussetzungen für eine korrekte Produktion noch nicht erfüllt. Die Folge ist dann eine von der erwachsenensprachlichen Norm abweichende Äußerung. Trotz nicht unerheblicher individueller Unterschiede bevorzugen Kinder in der Regel die letztere Strategie. Diese ermöglicht es ihnen, durch das Sprechen ihre kognitiven und motorischen Fähigkeiten zu schulen ("learning by doing") und ihr Kommunikationsbedürfnis zu befriedigen - vorausgesetzt, die Diskrepanz zur Erwartung der Erwachsenen steht einer Verständigung nicht im Wege. Allerdings bringt diese Strategie des "Vorpreschens" auch Probleme mit sich. Sie zwingt die Kinder nämlich, die falsche Aussprache irgendwann durch die richtige zu ersetzen. Die Schwierigkeiten, die sich aus dieser Aufgabe ergeben, sind nicht zu unterschätzen, denn die über einen längeren Zeitraum erfolgte falsche Wiedergabe kann sich zu einer Aussprachegewohnheit verfestigen, die nicht leicht zu überwinden ist.

Das Problem der Selbstkorrektur

Wie hat man sich diesen Prozeß der Selbstkorrektur vorzustellen? Nehmen wir als Ausgangspunkt das Wort "gut", das von vielen Kindern zunächst [du:t] gesprochen wird. (Eckige Klammern kennzeichnen die Aussprache, nicht die Schreibung eines Wortes.) Wir können hier unterstellen, daß das Kind beabsichtigte, ein [g] zu sprechen, dieses Ziel aber nicht erreichte und anstelle des Ziellauts den fehlerhaften Laut [d] artikulierte. Der Einfachheit halber spricht man hier von einem Ersetzungsprozeß [g] -> [d].

Nun ist es so, daß Sprache hierarchisch aufgebaut ist und die hierarchisch übergeordneten Einheiten sich aus einer begrenzten Anzahl von hierarchisch untergeordneten Einheiten zusammensetzen. Der Laut [g] findet sich also in unterschiedlichen Wörtern wieder (vgl. "ganz", "gleich", "Hagel" usw.). Die Strukturierung der Sprache in Form von Ebenen bedeutet, daß eine Lauteinheit wie das [g] ausreicht, um alle Wörter, die ein [g] enthalten, zu "versorgen". Ebenso wie Wörter in Laute zerlegbar sind, lassen sich auch Laute in kleinere Einheiten, die sog. Merkmale, aufspalten. Diese können eine artikulatorische Basis haben. So teilen sich sowohl das [g] als auch das [k] das Merkmal [velar], weil in beiden Fällen der für das Lautbild maßgebliche Ort im Mund der weiche Gaumen (Velum) ist. Die sprachliche Hierarchie und das Prinzip der Versorgung größerer Einheiten durch kleinere lassen sich mit Hilfe von Merkmalen, Lauten und Wörtern ebenso wie Verbindungslinien zwischen ihnen, den sog. Leitungen, wie links gezeigt, veranschaulichen.

Das heranreifende Kind hat nun (mindestens) zwei Möglichkeiten, den Korrekturprozeß zu initiieren: Es kann die Reparatur auf der Lautebene vollziehen, indem es den Ersatzlaut [d] durch das korrekte [g] ersetzt. Damit wäre sein Ausspracheproblem durch einen einzigen Eingriff, quasi im Handumdrehen, gelöst. Alternativ dazu kann das Kind den verkehrten Laut in jedem betreffenden Wort einzeln ersetzen. Beide Vorgehensweisen haben deutlich unterschiedliche empirische Konsequenzen. Während die erste bedeutet, daß das [g] nach der Reparatur in allen Wörtern gleich gut beherrscht wird, ist bei der zweiten mit einer lexikalischen Variation zu rechnen, die die korrekte Produktion des [g] in dem einen Wort neben der gleichzeitigen Ersetzung des [g] in einem anderem Wort erwarten läßt.

Dem erwachsenen Beobachter will die erste Methode als die effizientere erscheinen, da sie das Problem als ein einziges Problem identifiziert, während die zweite Methode das Problem in genau so viele Einzelprobleme aufspaltet, wie es korrekturbedürftige Wörter im Lexikon des Kindes gibt. Damit wird dieser Weg erheblich zeitaufwendiger und fordert immer wieder die Aufmerksamkeit des Kindes. Jedoch ist es alles andere als klar, ob diese Argumente für den Lerner irgendein Gewicht haben. Denn es wird dabei implizit angenommen, daß dem Kind beide Wege zur Verfügung stehen und vor allen Dingen gleich leicht zu beschreiten sind. Hier sind sicherlich Zweifel an einer allzu mechanistischen Sichtweise angebracht.

Erhebung der Daten

Um zu klären, wie Kinder tatsächlich das Reparaturproblem angehen, ist eine außerordentlich detaillierte Dokumentation des Spracherwerbsprozesses erforderlich. Sowohl alle relevanten Wörter ("types") als auch ihre möglicherweise unterschiedlichen Realisationsformen ("tokens") müssen erfaßt werden. Eine solche maximale Datendichte läßt sich nur durch ausgiebigen tagtäglichen Kontakt mit dem Lernenden erreichen. Aus dieser Forderung ergab sich nicht nur die Entscheidung für eine Einzelfallstudie, sondern auch für meine Tochter Melanie als (unfreiwillige) Informandin. Natürlich war es nicht möglich, alle ihre Äußerungen aufzuzeichnen. Es mußte daher eine Reihe von Beschränkungen erfolgen. Zum einen wurde ausschließlich die Korrektur von [d] -> [g] und von [t] -> [k] am Wortanfang untersucht. Zum anderen wurden alle Tokens pro Tag nur einmal aufgeschrieben, so daß gegebenenfalls ein und dasselbe Wort, das am gleichen Tag fünfmal richtig und einmal falsch gesprochen wurde, nur zweimal (einmal als korrekte und einmal als inkorrekte Form) verzeichnet wurde. Die dadurch entstehende Verzerrung der Token-Häufigkeiten konnte ansatzweise dadurch aufgefangen werden, daß die Tokens täglich neu notiert wurden. Diese Konzession war aber unvermeidlich, wenn man nicht das Kind den ganzen Tag mit Bleistift und Papier verfolgen wollte (oder konnte). Die Beobachtung erstreckte sich über zwei oder mehr Stunden täglich und erbrachte eine durchschnittliche Anzahl von 30 Äußerungen pro Tag, in denen jeweils unterschiedliche Wörter, die in der Erwachsenensprache mit [k] oder [g] beginnen, vorkamen.

Ergebnisse

Die Untersuchung begann zu einem Zeitpunkt, als Melanie im Alter von 3 Jahren, 4 Monaten und 9 Tagen ihr erstes [k] (in dem Wort "Kinder") korrekt aussprach, nachdem es lange durch [t] ersetzt worden war. Dieser denkwürdige Tag verdient eine genaue Betrachtung. Aufgezeichnet wurden insgesamt 45 Tokens - 30 Wörter, die in der Erwachsenensprache mit [k], und 15 Wörter, die mit [g] anfangen. Von den 30 Wörtern mit [k] wurden 20 korrekt und 10 inkorrekt ausgesprochen, von den 15 Wörtern mit [g] waren 3 richtig und 12 verkehrt. Das [k] hatte also eine Erfolgsquote von 67 %, das [g] eine Quote von 20 %. Bedenkt man, daß für den vorangegangenen Tag keine einzige korrekte Produktion beobachtet wurde, so ist dies ein beachtlicher Lernzuwachs.

Trotz dieses hohen Anfangstempos vergingen bis zur vollständigen Beherrschung des [k] und des [g] immerhin 15 Monate, von denen allerdings nur die ersten 12 in der beschriebenen Weise protokolliert sind. Damit wird bereits ein erstes Ergebnis offenkundig. Melanie war ganz offensichtlich nicht in der Lage, ihr Ausspracheproblem "im Handumdrehen" zu lösen. Das heißt, sie konnte eine Korrektur auf der Lautebene nicht vornehmen. Die Graphik auf S. 26 skizziert den Verlauf des Erwerbsprozesses, wobei der Prozentsatz der korrekten [k]- und [g]-Produktionen in Abhängigkeit von der Zeit (aufgeteilt in Wochen) dargestellt ist. Die Gesamtzahl der kindlichen Äußerungen, die in die Analyse miteingeflossen sind, beträgt 11.224.

Die Erfolgskurven für [k] und [g] verlaufen nicht gradlinig von unten nach oben. Ganz grob lassen sich drei Phasen unterscheiden. In den ersten 4 Wochen steigt der Prozentsatz an korrekten Produktionen im Verhältnis zur Gesamtzahl der Produktionen rapide an (von 0% bis zu 88%). Darauf folgt eine sehr lange Konsolidierungsphase (Woche 5-45), während der das Korrektheitsniveau trotz zahlreicher Schwankungen ungefähr gehalten wird. Schließlich erfolgt in den letzten 5 Wochen der Datenerhebung ein erneuter Anstieg der Kurven, wobei der Zeitpunkt der 100%igen Beherrschung der beiden Laute wie ausgeführt außerhalb des erfaßten Zeitraumes liegt. Es ist unschwer zu erkennen, daß das [g] generell weniger gut abschneidet als das [k], es andererseits aber auch auffällige Parallelen im Verlauf der beiden Kurven gibt.

Die Tatsache, daß sich die Entwicklung von [d, t] zu [g, k] nicht im Nu vollzieht, beinhaltet die Möglichkeit, daß es spezielle Bedingungen gibt, die diese Entwicklung begünstigen und so das Tempo des Lautwandels beeinflussen. Vier Faktoren konnten im wesentlichen nachgewiesen werden:

  • der zu erlernende Laut selbst. Wie bereits erwähnt, weisen Melanies [k]-Produktionen ein höheres Maß an Korrektheit auf als ihre [g]-Produktionen.

  • der lautliche Kontext. Dieser Faktor erweist sich als der bedeutendste. Vor Vokalen werden die Velare mit größerer Wahrscheinlichkeit korrekt gesprochen als vor Konsonanten. Beispielsweise fällt Melanie das [g] in dem Wort "gut" leichter als in dem Wort "gleich".

  • die Betonung. In betonter Silbe werden [k] und [g] häufiger richtig artikuliert als in unbetonter.

  • das Einzelwort. Wie gut ein und derselbe Laut beherrscht wird, hängt auch vom Einzelwort ab, in dem er vorkommt. Dabei können die Wörter sogar eine recht ähnliche Lautstruktur aufweisen. Zum Beispiel hatte Melanie relativ lange Schwierigkeiten mit dem [g] in "ganz", während es in "gut" problemlos erworben wurde.

Lokalisation der Selbstkorrektur

Wenn wir nun zu der Frage zurückkommen, auf welcher Verarbeitungsebene das Kind seine Reparaturstrategie ansetzt, empfiehlt sich ein erneuter Blick auf die Graphik (s. S. 24). Es gibt in diesem Modell fünf mögliche Ansatzpunkte (und damit drei mehr als zunächst angenommen): die Wortebene, die Verbindungen zwischen der Wortebene und der Lautebene, die Lautebene, die Verbindungen zwischen der Lautebene und der Merkmalebene und schließlich die Merkmalebene. Veränderungen auf jeder Ebene nehmen sich in der Empirie sehr unterschiedlich aus: Wenn eine Veränderung auf der Wortebene erfolgt, müssen alle dazugehörigen Laute von ihr in gleichem Maße profitieren, da das Wort eine holistische Einheit ist und mit jedem seiner Laute gleichermaßen verbunden ist (Fall 1). Wenn eine Verbindung zwischen der Wort- und der Lautebene optimiert wird, wird von dem Lernprozeß nur der Laut erfaßt, der am Ende dieser Verbindung steht, da jeder Laut seine eigene Verbindung zu dem ihm übergeordneten Wort hat (Fall 2). Erfolgt die Veränderung auf der Lautebene, so wird diese in allen Wörtern sichtbar, in denen dieser Laut vorkommt (Fall 3). Betrifft der Lernzuwachs eine Leitung zwischen der Laut- und der Merkmalebene, kann auf diese Weise nur die Produktion des jeweiligen Lauts bzw. des jeweiligen Merkmals verbessert werden (Fall 4). Und wenn ein Merkmal zugänglicher gemacht wird, begünstigt dies alle Laute, die mit diesem Merkmal verbunden sind (Fall 5).

Melanies Äußerungen ermöglichen uns nachzuweisen, auf welcher Ebene (oder Ebenen) ihr Lautwandel stattfand. Dazu bietet sich der Rückgriff auf zwei Eckpfeiler ihrer Entwicklung an: die unterschiedliche Veränderung der Velarlaute in verschiedenen Wörtern und die Ereignisse des ersten Tags. Beginnen wir mit letzteren. Ist die Veränderung auf der Merkmalebene anzusiedeln, müssen die beiden velaren Laute ein weitgehend identisches Erwerbsprofil aufweisen. Dies ist jedoch nicht der Fall. Die Laute [k] und [g] besitzen eine gewisse Unabhängigkeit voneinander und entwickeln sich bis zu einem bestimmten Grad eigenständig. Damit scheidet die Merkmalebene als Ort der Veränderung aus. Ebensowenig überzeugend ist, daß sich der Wandel auf der Wortebene vollzogen hat. Dies würde bedeuten, daß Melanie innerhalb von weniger als 24 Stunden mehrere Dutzend Wörter einzeln reparierte. Dieses kann zwar nicht völlig ausgeschlossen werden, ist aber aus dem Grund unwahrscheinlich, daß diese Ebene nur zu Einzelveränderungen führt, während Melanies Entwicklung eher globalen Charakter hat. Da die Verbindungen zwischen der Laut- und der Wortebene ebenfalls individuellen Charakter haben, kommt diese Ebene aus den gleichen Erwägungen heraus nicht in Betracht.

Wenn Melanie eine Veränderung auf der Lautebene vorgenommen hätte, müßten davon viele, wenn auch nicht notwendigerweise alle Wörter profitieren. Diese Vorhersage ist prinzipiell mit ihrem über viele Wörter verteilten Lernzuwachs vereinbar. Man würde aber bei dieser Erklärung ebenfalls erwarten, daß andere Laute von dem Wandel unbeeinflußt bleiben, da ja auf der Lautebene jedes Element eine Eigenständigkeit gegenüber seinen Nachbarn besitzt. Eine solche Eigenständigkeit weisen die beiden Velare in ihrer Entwicklung allerdings nicht auf. Beide beginnen sich am gleichen Tag zu verändern und entwickeln sich über den gesamten Beobachtungszeitraum nicht völlig unabhängig voneinander. Diese tendenzielle Synchronie der Entwicklung von [k] und [g] läßt sich nicht mit der Hypothese in Ein klang bringen, daß der Wandel auf der Lautebene stattgefunden hat.

Übrig bleiben somit die Verbindungen zwischen der Laut- und der Merkmalebene. In der Tat spricht vieles dafür, die Veränderungen, die am ersten Tag stattfanden, auf dieser Zwischenebene anzusiedeln. Insbesondere kann diese Ebene den scheinbaren Widerspruch erfassen, daß die Entwicklung von [k] sowohl eine gewisse Abhängigkeit als auch eine gewisse Unabhängigkeit von der Entwicklung des [g] aufweist. Die Unabhängigkeit erklärt sich dadurch, daß zwei eigenständige Leitungen verändert wurden - die von [velar] zu [k] und die von [velar] zu [g]. Die Abhängigkeit hingegen ergibt sich aus der Tatsache, daß beide Leitungen in demselben Punkt auf der Merkmalebene zusammenlaufen. Dieses weist darauf hin, daß die anfänglichen Veränderungen in Melanies mentalem Lexikon nicht auf der Ebene sprachlicher Größeneinheiten, sondern in den Verbindungen zwischen der Laut- und der Merkmalebene zu lokalisieren sind.

Wenn wir im nächsten Schritt die unterschiedliche Entwicklung des [g] in "gut" und "ganz" ins Blickfeld rücken, wird sofort klar, daß die drei unteren Ebenen (siehe Graphik S. 24) ausscheiden, da sie Effekte vorhersagen, die sich über eine Vielzahl von Wörtern verteilen müßten und genau das ja im vorliegenden Fall nicht gegeben ist. Die beiden verbleibenden Ebenen unterscheiden sich in dem lokalen bzw. globalen Charakter des Lautwandels. Ist die Wortebene betroffen, muß jede Veränderung alle Laute des Worts gleichermaßen erfassen. Sind hingegen die Verbindungen zwischen der Wort- und der Lautebene betroffen, bleibt die Veränderung auf die jeweilige Einzelverbindung beschränkt. Melanies Daten lassen darauf schließen, daß der Wechsel von [t] zu [k] (oder [d] zu [g]) ein isolierter Vorgang ist. Es ist kein Beleg vorhanden, bei dem dieser Wechsel parallel mit einer weiteren Veränderung in demselben Wort erfolgt. Beispielsweise wäre denkbar, daß in dem Wort "komisch", das Melanie zunächst als [to:mis] wiedergab, gleichzeitig zur Artikulation des [k] das "sch" das [s] verdrängen würde. Das Fehlen solcher Fälle legt den Schluß nahe, daß die Veränderung in den Leitungen zwischen dem [g] und der Wortebene stattgefunden hat. In dem vorliegenden Beispiel veränderte Melanie also die Leitung von [g] zu "gut" schneller als die von [g] zu "ganz".

Schlußfolgerungen

Als Ergebnis der Untersuchung läßt sich festhalten, daß Melanie von den fünf skizzierten Ebenen nur zwei in Angriff nahm. Es ist gewiß kein Zufall, daß diese beiden Ebenen Verbindungsebenen sind. Der Lautwandel findet also offenbar nur zwischen, nicht jedoch auf sprachlichen Beschreibungsebenen statt. Die eingangs gestellte Frage, ob Lautwandel ein Phänomen der Lautebene oder der Wortebene ist, muß daher mit einem "Weder-Noch" beantwortet werden.

Wie läßt sich dieser Befund erklären? Zunächst muß wiederholt wer den, daß es sich bei der vorliegenden Untersuchung um die Analyse eines Einzelfalls handelt. Es muß insofern offen bleiben, inwieweit die Ergebnisse verallgemeinerbar sind. Für Melanies Sprachentwicklung bieten sich zumindest folgende Möglichkeiten an: Es kann sein, daß der Erwerb der sprachlichen Größeneinheiten bereits abgeschlossen war, als Melanie sich um eine Lösung ihres Problems mit den Velarlauten bemühte. Man hätte dann davon auszugehen, daß sprachliche Einheiten generell vor den sie verbindenden Leitungen erworben werden. Dies könnte mit einer Asymmetrie zwischen Perzeption und Produktion zusammenhängen, wonach nur das produziert werden kann, was bereits über den perzeptuellen Weg Eingang in das Gedächtnis gefunden hat. So konnte Melanie den Unterschied zwischen "Keller" und "Teller" selbst zu einem Zeitpunkt hören, als [k] und [t] in ihrer Sprachproduktion noch zusammenfielen. Diese sprachlichen Einheiten, die ex hypothesi bereits mental repräsentiert sind, wären demzufolge perzeptuelle Einheiten, die das Kind zu einem späteren Zeitpunkt für die Produktion nutzen kann. Voraussetzung für diese Hypothese ist allerdings, daß für die Sprachwahrnehmung voll funktionsfähige Leitungen nicht erforderlich sind.

Daneben besteht auch die Möglichkeit, daß sprachliche Einheiten nicht in dem Maße erwerbsrelevante Größen wie Leitungen sind. Demnach würden sich die dynamischen Aspekte der Sprache zwischen den sprachlichen Beschreibungsebenen abspielen. Dies wäre eine neue Perspektive für die Linguistik, die traditionellerweise die sprachlichen Größeneinheiten in den Mittelpunkt ihres Interesses stellt. Zentrale sprachwissenschaftliche Bereiche wie Sprachvariation und Sprachwandel würden so in einem neuen Licht erscheinen.

 

Der Autor
Prof. Dr. Thomas Berg (39), anglistischer Sprachwissenschaftler im FB 11 Literatur- und Sprachwissenschaften, studierte Anglistik und Romanistik in Kiel, Braunschweig und Hull, promovierte 1986 über deutsche und englische Versprecher und kam 1990 an die Universität Oldenburg. Er habilitierte sich 1995 in der anglistischen Sprachwissenschaft mit einer Arbeit über den Zusammenhang von Sprachverarbeitung, Sprachstruktur und Sprachwandel. Sein Forschungsschwerpunkt ist die Psycholinguistik. Am 1. April 1997 folgte er dem Ruf auf eine Linguistik-Professur an der Universität Hamburg.