Bochumer linguistische Arbeitsberichte : BLA
Hrsg.: Stefanie Dipper ; Björn Rothstein
Refine
Document Type
- Working Paper (16)
Has Fulltext
- yes (16)
Is part of the Bibliography
- no (16)
Keywords
- Spracherwerb (2)
- Annotation (1)
- Deutsch (1)
- Französisch (1)
- Fremdsprachenlernen (1)
- Gesprochene Sprache (1)
- Grammatikalisation (1)
- Grammatiktheorie (1)
- Katalanisch (1)
- Kindersprache (1)
Institute
4
Die Grundlagen der heutigen modernen Wortartenklassifikationen gehen bis in die Antike zurück: Bereits zu dieser Zeit hat Dionysius Thrax ein Schema mit acht Wortarten etabliert. Die darin auftretenden Wortarten sind Substantive, Verben, Adjektive, Artikel, Pronomen, Präpositionen, Adverbien und Konjunktionen. Diese Zahl wird wiederum in den unterschiedlichen Grammatikansätzen unserer Zeit variiert. So verwendet der generative Ansatz beispielsweise vier Wortarten – Bergenholtz/Schaeder (1977) verzeichnen dagegen ganze 51 verschiedene Wortarten und zusätzlich 5 Lexemklassen. Allein diese starken Schwankungen in der angenommenen Anzahl der Wortarten verdeutlichen die allgemeinen Schwierigkeiten bei der Abgrenzung der Wortarten in ihren Kriterien.
Das Zitat "Denn sie gliedern sich in Stämme wie die Menschen" aus Érik Orsennas "Die Grammatik ist ein sanftes Lied" leitet den Titel dieser Arbeit ein und markiert gleichzeitig eine Schnittstelle zwischen der Literaturwissenschaft und der Linguistik und speziell der Grammatik. Als metasprachliche Erzählung setzt sich Orsennas Erzählung literarisch mit der Sprache und ihrer Grammatik auseinander. In der vorliegenden Arbeit beschäftige ich mich vorrangig mit der Analyse der Kriterien zur Klassifikation von Wortarten und ihrer literarischen Darstellung und Ausgestaltung in Orsennas Text über die Wörter, die in Stämmen in der Stadt der Wörter zusammenleben und in einer Fabrik miteinander zu Sätzen verbunden werden können. Der Originaltext von Orsenna ist eine Erzählung in französischer Sprache. Die Übersetzerin Caroline Vollmann hat den Text an die Gegebenheiten und speziellen Phänomene der deutschen Sprache angepasst. Aus diesem Grund spreche ich in der Arbeit von Orsenna und Vollmann als Verfassern.
Da die Darstellung der Wortarten bei Orsenna und Vollmann primär durch Metaphern realisiert wird und den Wörtern als "Stämmen" in einer Stadt menschliche Eigenschaften zugewiesen werden, möchte ich besonders auf die Grundlagen der kognitiven Metapherntheorie von Lakoff und Johnson eingehen. Um eine möglichst wissenschaftlich fundierte Grundlage für die Analyse von Kriterien zur Wortartenklassifikation zu gewährleisten, habe ich drei Grammatiken als Vergleichsmedium für die spätere Analyse von Orsennas und Vollmanns Text ausgewählt. Dadurch gewinne ich sowohl eine syntaktisch als auch morphologisch und semantisch orientierte Perspektive auf den Untersuchungsgegenstand. Aus den Grammatiken von Hentschel/Weydt (2003), Helbig/Buscha (2005) und Boettcher (2009) soll im Verlauf der Arbeit ein Kriterienkatalog erstellt werden, der in einem weiteren Schritt auf die Analyse der Wortartenklassifikation des literarischen Textes angewendet werden kann.
13
This paper deals with spelling normalization of historical texts with regard to further processing with modern part-of-speech taggers. Different methods for this task are presented and evaluated on a set of historical German texts from the 15th–18th century, and specific problems inherent to the processing of historical data are discussed. A chain combination using word-based and character-based techniques is shown to be best for normalization, while POS tagging of normalized data is shown to benefit from ignoring punctuation marks. Using these techniques, when 500 manually normalized tokens are used as training data for the normalization, the tagging accuracy of a manuscript from the 15th century can be raised from 28.65% to 76.27%.
3
The article discusses the methodology adopted for a cross-linguistic synchronic and diachronic corpus study on indefinites. The study covered five indefinite expressions, each in a different language. The main goal of the study was to verify the distribution of these indefinites synchronically and to attest their historical development. The methodology we used is a form of functional labeling which combines both context (syntax) and meaning (semantics) using as a starting point Haspelmath’s (1997) functional map. In the article we identify Haspelmath’s functions with logico-semantic interpretations and propose a binary branching decision tree assigning each instance of an indefinite exactly one function in the map.
9
The comprehension and production of single words involve a variety of processing stages. Which stages need to be accessed differs depending on whether objects (pictures in an experimental environment) or words are supposed to be named. Naming tasks are often employed in psycholinguistic studies in order to provide an insight into the function of mental processes during word production. Differences in naming latencies and naming accuracy between words suggest that the retrieval of some lexical items is easier or more difficult in contrast to others. The relative ease of word retrieval has been found to be strongly influenced by properties of these words, such as familiarity and written or spoken frequency.
Exploring which variables affect naming speed and accuracy will allow gaining more information about the storage and processing of words in general. If a variable has a discernable effect on a specific experimental task, the localization of this effect is of interest for psycholinguistic research. This is because finding the locus of the effect can help specify models of speech production with respect to what processes occur at which stage of lexical retrieval. Additionally, identifying which variables influence language processing is inevitable in order to control for these variables when necessary. Otherwise variance in naming latencies could not be explained by the variable that was to be tested because other, uncontrolled variables could have altered the results.
7
The 'de-allative'-pattern (Heine/ Kuteva 2008: 103) gives rise to the French grammaticalized periphrasis aller + INF and the Spanish grammaticalized periphrasis ir a + INF. This construction (anar + INF) also consists in Catalan, but here, however, with the periphrasis expressing a past tense. Concerning the grammaticalization path ir a + INF and aller + INF were formerly used to express a past (historical present), whereas anar + INF also expressed a future (and can still take on this function). This paper discusses possible reasons for the development and the thus exceptional position of the Catalan past-periphrasis. In addition to morphological and normative explanations, language contact between Catalan and Spanish/ French as well as sociolinguistic circumstances are factors which may possibly account for the development of the Catalan construction. After a separate presentation of the development and the former and actual use(s) and forms of the three periphrasis, the cognitive processes which took place during the grammaticalization are presented. Afterward the three periphrasis are compared using the parameters of Lehmann. The second part of this paper consists of a corpus which verifies and illustrates the results of the previous part.