Bochumer linguistische Arbeitsberichte : BLA
Hrsg.: Stefanie Dipper ; Björn Rothstein
Refine
Year of publication
- 2013 (3) (remove)
Document Type
- Working Paper (3)
Has Fulltext
- yes (3)
Is part of the Bibliography
- no (3)
Keywords
- Annotation (1)
- Deutsch (1)
- Kindersprache (1)
- Korpus <Linguistik> (1)
- Nachfeld (1)
- Numerus (1)
- Spracherwerb (1)
- Substantiv (1)
13
This paper deals with spelling normalization of historical texts with regard to further processing with modern part-of-speech taggers. Different methods for this task are presented and evaluated on a set of historical German texts from the 15th–18th century, and specific problems inherent to the processing of historical data are discussed. A chain combination using word-based and character-based techniques is shown to be best for normalization, while POS tagging of normalized data is shown to benefit from ignoring punctuation marks. Using these techniques, when 500 manually normalized tokens are used as training data for the normalization, the tagging accuracy of a manuscript from the 15th century can be raised from 28.65% to 76.27%.
12
Diese Arbeit hat als übergeordnete und finale Zielsetzung das Bestreben eine systematische, effiziente und nachvollziehbare Bestimmung der lexikalisierten Zählbarkeit deutscher Substantive zu ermöglichen. Ein Unterfangen, das zu meinem Wissen bisher weder für Substantive des Deutschen, noch des Englischen, in einem größeren Maßstab unternommen wurde.
Es gibt zwar einige Lexika, die bereits Einträge für nur im Singular oder nur im Plural auftretende Substantive beinhalten, jedoch ist mir keine Ressource bekannt, die eine qualitativ und quantitativ hochwertige Klassifizierung der lexikalischen Zählbarkeit von Substantiven des Englischen oder des Deutschen bietet. Ein Hinweis auf einen ausschließlich verwendeten Numerus eines Substantivs ist hierbei keineswegs ein zuverlässiges Indiz auf die Zählbarkeit dieses Substantivs, sondern lediglich eines von vielem Merkmalen, dass in Summe das ergibt, was gemeinhin unter dem Begriff Zählbarkeit summiert wird.
Auch die Literatur zur Zählbarkeit selbst beschränkt sich fast durchgängig auf einige wenige Substantive, die wie auch bereits in dieser Einleitung geschehen, immer wieder und wieder diskutiert werden. Die Interpretation der Zählbarkeit von Hunden, Katzen und Kaninchen, sowie von Wein, Reis, Möbeln und Schmuck, wird auch in den Beispielen dieser Arbeit immer wieder von Bedeutung sein. Es ist allerdings offenkundig, dass das Deutsche oder Englische weitaus mehr Wörter als die soeben genannten beinhaltet und somit eine Betrachtung über diese Standardbeispiele hinaus sinnvoll ist.
Es ist daher mein Bestreben, Tests und Richtlinien zur Bestimmung der lexikalischen Zählbarkeit von Substantiven zu entwickeln, diese auf über 1.000 Lemmata des Deutschen anzuwenden und somit erstmals einen Gold-Standard zu etablieren, der neben qualitativen Betrachtungen auch eine quantitative Untersuchung der Zählbarkeit von Wörtern in einer großen deutschsprachigen Tageszeitung erlaubt.
10
In dieser Arbeit untersuchen wir, welche nicht-satzwertigen Einheiten 2- bis 3-jährige Kinder ins Nachfeld stellen und aus welchen Gründen sie dies tun. Kindliche Äußerungen können ab der Phase der 'item'-basierten Konstruktionen, in der sie die Satzklammer erwerben, mit dem topologischen Feldermodell analysiert werden. Wir argumentieren dafür, dass Kinder zunächst ein vorläufiges Nachfeld entwickeln, welches sich hinter infiniten Verben oder Verbpartikeln befindet. Am häufigsten finden sich Adverb-, Präpositional- und Nominalphrasen im Nachfeld. Adverbien zeigen Verfestigungstendenzen, sodass wir diese als Konstruktionen beschreiben mit der Funktion, die Äußerung im Kontext zu verorten und/oder dieser Nachdruck zu verleihen. Präpositional- und Nominalphrasen werden aus Gründen der Zeitlichkeit bzw. nicht ausreichender Planung ins Nachfeld gestellt. Die Häufigkeit der Nominalphrasen im Nachfeld nimmt mit zunehmendem Alter ab.