Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-29887
URL: http://www.freidok.uni-freiburg.de/volltexte/2988/


Keibel, Jens-Holger

Distributional patterns in German child-directed speech and their usefulness for acquiring lexical categories : a case study

Distributionelle Muster in deutscher Kind-gerichteter Sprache und ihr Nutzen für den Wortartenerwerb : eine Fallstudie

Dokument1.pdf (2.571 KB) (md5sum: ed9c48b7c719897e06c7d7865b0990bc)

Kurzfassung in Englisch

This thesis is concerned with the question of how children acquire the lexical categories of their first language und how this acquisition is influenced by their linguistic experience. The focus lies on fairly simple distributional regularities that children could detect in their input without any prior syntactic knowledge. The study provides an empirical assessment of these regularities for the particular case of German. The analyses are based on a large corpus that documents the linguistic interaction between a single German learning child and his environment at a very high sampling rate and over a period of three years. The relevant distributional information was derived from this corpus by a particular type of co-occurrence analysis, and several mathematical measures were used to evaluate how well this information reflects the major lexical categories of the German language, and thus how much this information might help the child in acquiring these categories. The results show that overall the German input data contain very useful information: All categories under investigation benefit from this information, most of all interjections, interrogative words and nouns. Adverbs and particles, on the other hand, are virtually indistinguishable from each other by their distributional properties. Further results indicate that the derived distributional information is very robust and therefore allows for fairly reliable conclusions about the linguistic input to this particular child, largely independent of the specific properties of the co-occurrence model used here. This justifies identifying the characteristic distributional properties of each lexical category on the basis of this model. Comparing these category-specific distributional profiles revealed the distributional commonalities and differences between any two categories. For the categories noun and verb, their profiles were analyzed at greater detail: The most important finding was that the verb category is distributionally much more complex than the noun category; and this fundamental difference is argued to be a consequence of syntactic structure along with very pronounced usage preferences. These findings lead to two testable predictions about the course of category development in German. Further analyses suggest that the early learning situation of the child may facilitate the discovery of the noun category, and later that of the categories determiner and preposition. The implications and shortcomings of this study are discussed, and some central characteristics of a possible learning mechanism exploiting the relevant type of distributional regularities are outlined.


Kurzfassung in Deutsch

Diese Arbeit beschäftigt sich mit der Frage, wie Kinder die Wortarten ihrer Muttersprache erwerben und welchen Einfluss dabei ihre Erfahrung mit dieser Sprache hat. Im Mittelpunkt stehen einfache distributionelle Regelmäßigkeiten, die Kinder auch ohne syntaktisches Vorwissen in ihrem Sprachinput vorfinden. Die Studie stellt eine empirische Auswertung dieser Regelmäßigkeiten für den konkreten Fall der deutschen Sprache dar. Die Datengrundlage hierfür liefert ein umfangreiches Korpus, das die sprachliche Interaktion eines deutschsprachig aufwachsenden Kindes mit seiner Umgebung über einen Zeitraum von drei Jahren mit einer außergewöhnlich hohen Stichprobendichte dokumentiert. Aus diesem Korpus wurde die relevante distributionelle Information mithilfe einer bestimmten Form der kookkurrenz-statistischen Analyse gewonnen, und mehrere mathematische Maße wurden benutzt, um zu bewerten, zu welchem Grad diese Information die grundlegenden Wortarten der deutschen Sprache wiederspiegeln, d.h. inwiefern diese Information dem Kind beim Erwerb der einzelnen Wortarten hilfreich sein könnte. Die Ergebnisse zeigen, dass der deutschsprachige Input insgesamt sehr informative distributionelle Regelmäßigkeiten enthält: Alle untersuchten Kategorien profitieren von dieser Information, v.a. jedoch Interjektionen, Fragewörter und Substantive. Adverbien und Partikeln hingegen lassen sich aufgrund ihrer distributionellen Eigenschaften praktisch nicht voneinander unterscheiden. Weitere Ergebnisse belegen, dass die aus dem Korpus hergeleitete Information sehr robust ist und ihre Analyse daher recht zuverlässige Schlussfolgerungen über den Input zumindest dieses einen Kindes zulässt, die nur in geringem Maße von den konkreten Eigenschaften des hier verwendeten Kookkurrenz-Modells abhängen. Somit ist es gerechtfertigt, für jede Wortart ihre charakteristischen distributionellen Eigenschaften auf der Grundlage dieses Modells zu bestimmen. Anhand dieser detaillierten distributionellen Profile wurden die Gemeinsamkeiten und Unterschiede zwischen den einzelnen Wortarten herausgearbeitet. Für Verben und Substantive wurden diese Analysen noch weiter vertieft: Das bedeutendste Resultat hierbei war, dass die Verbkategorie in distributioneller Hinsicht sehr viel komplexer ist als die Substantivkategorie. Es wird skizziert, wie sich dieser grundsätzliche distributionelle Unterschied auf syntaktische Strukturen und stark ausgeprägte Gebrauchspräferenzen zurückführen lässt. Ferner ergeben sich aus dem Befund zwei testbare Vorhersagen über den Verlauf des Wortartenerwerbs im Deutschen. Zwei abschließende Analysen deuten u.a. darauf hin, dass die frühe Lernsituation des Kindes den Erwerb der Substantivkategorie und anschließend der Kategorien Artikelwort und Präposition unterstützt. Abschließend werden Schlussfolgerungen aus dieser Studie sowie ihre Schwächen besprochen, und es werden wesentliche Eigenschaften eines möglichen Lernmechanismus skizziert, mit dessen Hilfe Kinder die hier untersuchte Art distributioneller Information für den Wortartenerwerb erschließen könnten.


SWD-Schlagwörter: Spracherwerb , Wortart , Korpus <Linguistik>
Freie Schlagwörter (deutsch): Kind-gerichtete Sprache (CDS) , distributionelle Information
Freie Schlagwörter (englisch): language acquisition , lexical categories , child-directed speech (CDS) , distributional information , corpus analysis
Institut: Deutsches Sem. 1: Inst. f. Deutsche Sprache u. Ält. Lit.
Fakultät: Philologische Fakultät
DDC-Sachgruppe: Deutsch, germanische Sprachen allgemein
Dokumentart: Dissertation
Erstgutachter: Dittmann, Jürgen (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 24.03.2006
Erstellungsjahr: 2005
Publikationsdatum: 07.05.2007
Indexliste