Linguistik
Refine
Year of publication
Document Type
- Article (1213)
- Part of a Book (784)
- Working Paper (254)
- Review (181)
- Conference Proceeding (166)
- Preprint (122)
- Book (108)
- Part of Periodical (64)
- Report (58)
- Doctoral Thesis (23)
Language
- English (1395)
- German (1054)
- Croatian (298)
- Portuguese (120)
- Turkish (43)
- Multiple languages (24)
- French (21)
- mis (16)
- Spanish (7)
- Polish (4)
Has Fulltext
- yes (2991) (remove)
Keywords
- Deutsch (436)
- Syntax (151)
- Linguistik (126)
- Englisch (123)
- Semantik (112)
- Spracherwerb (96)
- Phonologie (85)
- Rezension (77)
- Kroatisch (68)
- Fremdsprachenlernen (67)
Institute
- Extern (438)
- Institut für Deutsche Sprache (IDS) Mannheim (113)
- Neuere Philologien (43)
- Sprachwissenschaften (43)
- Universitätsbibliothek (4)
- Sprach- und Kulturwissenschaften (3)
- Gesellschaftswissenschaften (2)
- Medizin (2)
- Präsidium (2)
- SFB 268 (2)
A series of production and perception experiments investigating the prosody and well-formedness of special sentences, called Wide Focus Partial Fronting (WFPF), which consist of only one prosodic phrase and a unique initial accented argument, are reported on here. The results help us to decide between different models of German prosody. The absence of pitch height difference on the accent of the sentence speaks in favor of a relative model of prosody, in which accents are scaled relative to each other, and against models in which pitch accents are scaled in an absolute way. The results also speak for a model in which syntax, but not information structure, influences the prosodic phrasing. Finally, perception experiments show that the prosodic structure of sentences with a marked word order needs to be presented for grammaticality judgments. Presentation of written material only is not enough, and falsifies the results.
The semantics of ellipsis
(2005)
There are four phenomena that are particularly troublesome for theories of ellipsis: the existence of sloppy readings when the relevant pronouns cannot possibly be bound; an ellipsis being resolved in such a way that an ellipsis site in the antecedent is not understood in the way it was there; an ellipsis site drawing material from two or more separate antecedents; and ellipsis with no linguistic antecedent. These cases are accounted for by means of a new theory that involves copying syntactically incomplete antecedent material and an analysis of silent VPs and NPs that makes them into higher order definite descriptions that can be bound into.
This paper discusses the use of XSLT stylesheets as a filtering mechanism for refining the results of user queries on treebanks. The discussion is within the context of the TIGER treebank, the associated search engine and query language, but the general ideas can apply to any search engine for XML-encoded treebanks. It will be shown that important classes of linguistic phenomena can be accessed by applying relatively simple XSLT templates to the output of a query, effectively simulating the universal quantifier for a subset of the query language.
In order to investigate the empirical properties of focus, it is necessary to diagnose focus (or: “what is focused”) in particular linguistic examples. It is often taken for granted that the application of one single diagnostic tool, the so-called question-answer test, which roughly says that whatever a question asks for is focused in the answer, is a fool-proof test for focus. This paper investigates one example class where such uncritical belief in the question-answer test has led to the assumption of rather complex focus projection rules: in these examples, pitch accent placement has been claimed to depend on certain parts of the focused constituents being given or not. It is demonstrated that such focus projection rules are unnecessarily complex and in turn require the assumption of unnecessarily complicated meaning rules, not to speak of the difficulties to give a precise semantic/pragmatic definition of the allegedly involved givenness property. For the sake of the argument, an alternative analysis is put forward which relies solely on alternative sets following Mats Rooth´s work, and avoids any recourse to givenness. As it turns out, this alternative analysis is not only simpler but also makes in a critical case the better predictions.
In this paper we compare the behaviour of adverbs of frequency (de Swart 1993) like usually with the behaviour of adverbs of quantity like for the most part in sentences that contain plural definites. We show that sentences containing the former type of Q-adverb evidence that Quantificational Variability Effects (Berman 1991) come about as an indirect effect of quantification over situations: in order for quantificational variability readings to arise, these sentences have to obey two newly observed constraints that clearly set them apart from sentences containing corresponding quantificational DPs, and that can plausibly be explained under the assumption that quantification over (the atomic parts of) complex situations is involved. Concerning sentences with the latter type of Q-adverb, on the other hand, such evidence is lacking: with respect to the constraints just mentioned, they behave like sentences that contain corresponding quantificational DPs. We take this as evidence that Q-adverbs like for the most part do not quantify over the atomic parts of sum eventualities in the cases under discussion (as claimed by Nakanishi and Romero (2004)), but rather over the atomic parts of the respective sum individuals.
Japanese wh-questions always exhibit focus intonation (FI). Furthermore, the domain of FI exhibits a correspondence to the wh-scope. I propose that this phonology-semantics correspondence is a result of the cyclic computation of FI, which is explained under the notion of Multiple Spell-Out in the recent Minimalist framework. The proposed analysis makes two predictions: (1) embedding of an FI into another is possible; (2) (overt) movement of a wh-phrase to a phase edge position causes a mismatch between FI and wh-scope. Both predictions are tested experimentally, and shown to be borne out.
Prosodic focus in Vietnamese
(2007)
This paper reports on pilot work on the expression of Information Structure in Vietnamese and argues that Focus in Vietnamese is exclusively expressed prosodically: there are no specific focus markers, and the language uses phonology to express intonational emphasis in similar ways to languages like English or German. The exploratory data indicates that (i) focus is prosodically expressed while word order remains constant, (ii) listeners show good recoverability of the intended focus structure, and (iii) that there is a trading relationship between several phonetic parameters (duration, f0, amplitude) involved to signal prosodic (acoustic) emphasis.
Phonology and intonation
(2007)
The encoding standards for phonology and intonation are designed to facilitate consistent annotation of the phonological and intonational aspects of information structure, in languages across a range ofprosodic types. The guidelines are designed with the aim that a nonspecialist in phonology can both implement and interpret the resulting annotation.
This paper investigates the structural properties of morphosyntactically marked focus constructions, focussing on the often neglected non-focal sentence part in African tone languages. Based on new empirical evidence from five Gur and Kwa languages, we claim that these focus expressions have to be analysed as biclausal constructions even though they do not represent clefts containing restrictive relative clauses. First, we relativize the partly overgeneralized assumptions about structural correspondences between the out-of-focus part and relative clauses, and second, we show that our data do in fact support the hypothesis of a clause coordinating pattern as present in clause sequences in narration. It is argued that we deal with a non-accidental, systematic feature and that grammaticalization may conceal such basic narrative structures.
This article presents an analysis of German nicht...sondern... (contrastive not...but...) which departs from the commonly held view that this construction should be explained by appeal to its alleged corrective function. It will be demonstrated that in nicht A sondern B (not A but B), A and B just behave like stand-alone unmarked answers to a common question Q, and that this property of sondern is presuppositional in character. It is shown that from this general observation many interesting properties of nicht...sondern... follow, among them distributional differences between German "sondern" and German "aber" (contrastive but, concessive but), intonational requirements and exhaustivity effect sondern presupposition is furthermore argued to be the result of the conventionalization of conversational implicatures.
Three dimensions can be distinguished in a cross-linguistic account of information structure. First, there is the definition of the focus constituent, the part of the linguistic expression which is subject to some focus meaning. Second and third, there are the focus meanings and the array of structural devices that encode them. In a given language, the expression of focus is facilitated as well as constrained by the grammar within which the focus devices operate. The prevalence of focus ambiguity, the structural inability to make focus distinctions, will thus vary across languages, and within a language, across focus meanings.
In this paper, we present the Multiple Annotation approach, which solves two problems: the problem of annotating overlapping structures, and the problem that occurs when documents should be annotated according to different, possibly heterogeneous tag sets. This approach has many advantages: it is based on XML, the modeling of alternative annotations is possible, each level can be viewed separately, and new levels can be added at any time. The files can be regarded as an interrelated unit, with the text serving as the implicit link. Two representations of the information contained in the multiple files (one in Prolog and one in XML) are described. These representations serve as a base for several applications.
The paper presents an in-depth study of focus marking in Gùrùntùm, a West Ch adic language spoken in Bauchi Province of Northern Nigeria. Focus in Gùrùntùm is marked morphologically by means of a focus marker a, which typically precedes the focus constituent. Even though the morphological focus-marking system of Gùrùntùm allows for a lot of fine-grained distinctions in information structure (IS) in principle, the language is not entirely free of focus ambiguities that arise as the result of conflicting IS- and syntactic requirements that govern the placement of focus markers. We show that morphological focus marking with a applies across different types of focus, such as newinformation, contrastive, selective and corrective focus, and that a does not have a second function as a perfectivity marker, as is assumed in the literature. In contrast, we show at the end of the paper that a can also function as a foregrounding device at the level of discourse structure.
This paper presents the results of a production experiment on the intonation of sentences containing a negative polarity item (NPI) in Tokyo Japanese. The results show that NPI sentences exhibit a focus intonation: the F0-peak of the word to which an NPI is attached is raised, while the pitch contour after the NPI-attached word is compressed until the negation. This intonation pattern is parallel to that of wh-question, in which the F0 of the wh-phrase is raised while the post-wh-contour is compressed until the question particle.
This paper surveys a range of constructions in which prosody affects discourse function and discourse structure.We discuss English tag questions, negative polar questions, and what we call “focus” questions. We postulate that these question types are complex speech acts and outline an analysis in Segmented Discourse Representation Theory (SDRT) to account for the interactions between prosody and discourse.
The aim of this paper is to validate a dataset collected by means of production experiments which are part of the Questionnaire on Information Structure. The experiments generate a range of information structure contexts that have been observed in the literature to induce specific constructions. This paper compares the speech production results from a subset of these experiments with specific claims about the reflexes of information structure in four different languages. The results allow us to evaluate and in most cases validate the efficacy of our elicitation paradigms, to identify potentially fruitful avenues of future research, and to highlight issues involved in interpreting speech production data of this kind.
While the Information Structure (IS) is most naturally interpreted as "structure of information", some may argue that it is structure of something else, and others may object to the use of the word "structure". This paper focuses on the question of whether the informational component can have structural properties such that it can be called "structure". The preliminary conclusion is that, althoughthere are some vague indications of structurehood in it, it is perhaps better understood to be a representation that encodes a finite set of information-based partitions, rather than structure.
In a first step, definitions of the irreducible information structural categories are given, and in a second step, it is shown that there are no invariant phonological or otherwise grammatical correlates of these categories. In other words, the phonology, syntax or morphology are unable to define information structure. It is a common mistake that information structural categories are expressed by invariant grammatical correlates, be they syntactic, morphological or phonological. It is rather the case that grammatical cues help speaker and hearer to sort out which element carries which information structural role, and only in this sense are the grammatical correlates of information structure important. Languages display variation as to the role of grammar in enhancing categories of information structure, and this variation reflects the variation found in the ‘normal’ syntax and phonology of languages.
We argue that there is a crucial difference between determiner and adverbial quantification. Following Herburger [2000] and von Fintel [1994], we assume that determiner quantifiers quantify over individuals and adverbial quantifiers over eventualities. While it is usually assumed that the semantics of sentences with determiner quantifiers and those with adverbial quantifiers basically come out the same, we will show by way of new data that quantification over events is more restricted than quantification over individuals. This is because eventualities in contrast to individuals have to be located in time which is done using contextual information according to a pragmatic resolution strategy. If the contextual information and the tense information given in the respective sentence contradict each other, the sentence is uninterpretable. We conclude that this is the reason why in these cases adverbial quantification, i.e. quantification over eventualities, is impossible whereas quantification over individuals is fine.
Heterogeneity and standardization in data, use, and annotation : a diachronic corpus of German
(2005)
This paper describes the standardization problems that come up in a diachronic corpus: it has to cope with differing standards with regard to diplomaticity, annotation, and header information. Such highly heterogeneous texts must be standardized to allow for comparative research without (too much) loss of information.
Results of a production experiment on the placement of sentence accent in German are reported. The hypothesis that German fulfills some of the most widely accepted rules of accent assignment— predicting focus domain integration—was only partly confirmed. Adjacency between argument and verb induces a single accent on the argument, as recognized in the literature, but interruption of this sequence by a modifier often induces remodeling of the accent pattern with a single accent on the modifier. The verb is rarely stressed. All models based on linear alignment or adjacency between elements belonging to a single accent domain fail to account for this result. A cyclic analysis of prosodic domain formation is proposed in an optimality-theoretic framework that can explain the accent pattern.
Human manual action exhibits a differential use of a non-dominant (typically, left) and a dominant (typically, right) hand. Human communication exhibits a pervasive structuring of utterances into topic and comment. I will point out striking similarities between the coordination of hands in bimanual actions, and the structuring of utterances in topics and comments. I will also show how principles of bimanual coordination influence the expression of topic/comment structure in sign languages and in gestures accompanying spoken language, and suggest that bimanual coordination might have been a preadaptation of the development of information structure in human communication.
We argue that the standard focus theories reach their limits when confronted with the focus systems of the Chadic languages. The backbone of the standard focus theories consists of two assumptions, both called into question by the languages under consideration. Firstly, it is standardly assumed that focus is generally marked by stress. The Chadic languages, however, exhibit a variety of different devices for focus marking. Secondly, it is assumed that focus is always marked. In Tangale, at least, focus is not marked consistently on all types of constituents. The paper offers two possible solutions to this dilemma.
Focus presuppositions
(2007)
This paper reviews notions related to focus and presupposition and addresses the hypothesis that focus triggers an existential presupposition. Presupposition projection behavior in certain examples appears to favor a presuppositional analysis of focus. It is argued that these examples are open to a different analysis using givenness theory. Overall, the analysis favors a weak semantics for focus not including an existential presupposition.
Focus expressions in Foodo
(2007)
This paper aims at presenting different ways of expressing focus in Foodo, a Guang language. We can differentiate between marked and unmarked focus strategies. The marked focus expressions are first syntactically characterized: the focused constituent is in sentence-initial position and is second always marked obligatorily by a focus marker, which is [...] for non-subjects and N for subjects. Complementary to these structures, Foodo knows an elliptic form consisting of the focused constituent and a predication marker [...]. It will be shown that the two focus markers can be analyzed as having developed out of the homophone conjunction n[...] and that the constraints on the use of the focus markers can be best explained by this fact.
Focus asymmetries in Bura
(2008)
This article presents the central aspects of the focus system of Bura (Chadic), which exhibits a number of asymmetries: Grammatical focus marking is obligatory only with focused subjects, where focus is marked by the particle án following the subject. Focused subjects remain in situ and the complement of án is a regular VP. With nonsubject foci, án appears in a cleft-structure between the fronted focus constituent and a relative clause. We present a semantically unified analysis of focus marking in Bura that treats the particle as a focusmarking copula in T that takes a property-denoting expression (the background) and an individual-denoting expression (the focus) as arguments. The article also investigates the realization of predicate and polarity focus, which are almost never marked. The upshot of the discussion is that Bura shares many characteristic traits of focus marking with other Chadic languages, but it crucially differs in exhibiting a structural difference in the marking of focus on subjects and non-subject constituents.
Focus and tone
(2006)
Tone is a distinctive feature of the lexemes in tone languages. The information-structural category focus is usually marked by syntactic and morphological means in these languages, but sometimes also by intonation strategies. In intonation languages, focus is marked by pitch movements, which are also perceived as tone. The present article discusses prosodic focus marking in these two language types.
This paper discusses how focus change s prosodic structure in Tokyo Japanese. It is generally believed that focus blocks the intonational process of downstep and causes a pitch reset. This paper presents experimental evidence against this traditional view by looking at the prosodic behavior of Wh words, which receive focus lexically in Japanese as in other languages. It is demonstrated, specifically, that the focused Wh element does not block downstep although it receives a much higher pitch than its preceding element. This suggests that presence of lexical focus does not trigger pitch reset in Japanese.
The present study examines native and nonnative perceptual processing of semantic information conveyed by prosodic prominence. Five groups of German learners of English each listened to one of 5 experimental conditions. Three conditions differed in place of focus accent in the sentence and two conditions were with spliced stimuli. The experiment condition was presented first in the learners’ L1 (German) and then in a similar set in the L2 (English). The effect of the accent condition and of the length and position of the target in the sentence was evaluated in a probe recognition task. In both the L1 and L2 tasks there was no significant effect in any of the five focus conditions. Target position and target word length had an effect in the L1 task. Word length did not affect accuracy rates in the L2 task. For probe recognition in the L2, word length and the position of the target interacted with the focus condition.
We present a system for the linguistic exploration and analysis of lexical cohesion in English texts. Using an electronic thesaurus-like resource, Princeton WordNet, and the Brown Corpus of English, we have implemented a process of annotating text with lexical chains and a graphical user interface for inspection of the annotated text. We describe the system and report on some sample linguistic analyses carried out using the combined thesaurus-corpus resource.
In diesem Aufsatz geht es um die Datenbank ‚Mehrsprachigkeit’ und das System EXMARaLDA, die am SFB 538 ‚Mehrsprachigkeit’ der Universität Hamburg entwickelt werden. Da deren konzeptuelle und technische Details bereits an anderer Stelle ausführlich dargestellt worden sind (z.B. Schmidt 2004), soll der Schwerpunkt hier einerseits auf solchen Aspekten liegen, die – gemäß dem Thema des Workshops – mit allgemeineren Fragen zum Umgang mit computerverwertbaren, heterogenen linguistischen Datenbeständen zu tun haben. Andererseits soll versucht werden, aus den praktischen Erfahrungen der nunmehr vierjährigen Projektarbeit einige Erkenntnisse abzuleiten, die über den konkreten Projektzusammenhang hinaus für die weitere Arbeit auf diesem Gebiet interessant sein könnten.
The aim of this paper is to outline the means for encoding information structure in Yucatec Maya. Yucatec Maya is a tone language, displaying a three-fold opposition in the tonal realization of syllables. From the morpho-syntactic point of view, the grammar of Yucatec Maya contains morphological (topic affixes, morphological marking of out-of-focus predicates) and syntactic (designated positions) means to uniquely specify syntactic constructions for their information structure. After a descriptive overview of these phenomena, we present experimental evidence which reveals the impact of the nonavailability of prosodic alternatives on the choice of syntactic constructions in language production.
Diskurspragmatische Faktoren für Topikalität und Verbstellung in der ahd. Tatianübersetzung (9. Jh.)
(2005)
The paper presents work in progress on the interaction between information structure and word order in Old High German based on data from the Tatian translation (9th century). The examination of the position of the finite verb in correspondence with the pragmatic status of discourse referents reveals an overall tendency for verb-initial order in thetic/all-focus sentences, whereas in categorical / topic-comment sentences verb-second placement with an initial topic constituent is preferred. This conclusion provides support for the hypothesis stated in Donhauser & Hinterhölzl (2003) that the finite verb form in Early Germanic serves to distinguish the information-structural domains of Topic and Focus. Finally, the investigation sheds light on the process of language change that led to the overall spread of verb-second in main clauses of modern German.
In this paper we review the current state of research on the issue of discourse structure (DS) / information structure (IS) interface. This field has received a lot of attention from discourse semanticists and pragmatists, and has made substantial progress in recent years. In this paper we summarize the relevant studies. In addition, we look at the issue of DS/ISinteraction at a different level—that of phonetics. It is known that both information structure and discourse structure can be realized prosodically, but the issue of phonetic interaction between the prosodic devices they employ has hardly ever been discussed in this context. We think that a proper consideration of this aspect of DS/IS-interaction would enrich our understanding of the phenomenon, and hence we formulate some related research-programmatic positions.
This paper investigates the nature of the attraction of XPs to clauseinitial position in German (and other languages). It argues that there are two different types of preposing. First, an XP can move when it is attracted by an EPP-like feature of Comp. Comp can, however, also attract elements that bear the formal marker of some semantic or pragmatic (information theoretic) function. This second type of movement is driven by the attraction of a formal property of the moved element. It has often been misanalysed as “operator” movement in the past.
Contrastive focus
(2007)
The article puts forward a discourse-pragmatic approach to the notoriously evasive phenomena of contrastivity and emphasis. It is argued that occurrences of focus that are treated in terms of "contrastive focus", "kontrast" (Vallduví & Vilkuna 1998) or "identificational focus" (É. Kiss 1998) in the literature should not be analyzed in familiar semantic terms like introduction of alternatives or exhaustivity. Rather, an adequate analysis must take into account discourse-pragmatic notions like hearer expectation or discourse expectability of the focused content in a given discourse situation. The less expected a given content is judged to be for the hearer, relative to the Common Ground, the more likely a speaker is to mark this content by means of special grammatical devices, giving rise to emphasis.
New evidence is provided for a grammatical principle that singles out contrastive focus (Rooth 1996; Truckenbrodt 1995) and distinguishes it from discourse-new “informational” focus. Since the prosody of discourse-given constituents may also be distinguished from discourse-new, a three-way distinction in representation is motivated. It is assumed that an F-feature marks just contrastive focus (Jackendoff 1972, Rooth 1992), and that a G-feature marks discoursegiven constituents (Féry and Samek-Lodovici 2006), while discoursenew is unmarked. A crucial argument for G-marking comes from second occurrence focus (SOF) prosody, which arguably derives from a syntactic representation where SOF is both F-marked and G-marked. This analysis relies on a new G-Marking Condition specifying that a contrastive focus may be G-marked only if the focus semantic value of its scope is discourse-given, i.e. only if the contrast itself is given.
This article takes stock of the basic notions of Information Structure (IS). It first provides a general characterization of IS — following Chafe (1976) — within a communicative model of Common Ground (CG), which distinguishes between CG content and CG management. IS is concerned with those features of language that concern the local CG. Second, this paper defines and discusses the notions of Focus (as indicating alternatives) and its various uses, Givenness (as indicating that a denotation is already present in the CG), and Topic (as specifying what a statement is about). It also proposes a new notion, Delimitation, which comprises contrastive topics and frame setters, and indicates that the current conversational move does not entirely satisfy the local communicative needs. It also points out that rhetorical structuring partly belongs to IS.
The material reported on in this paper is part of a set of experiments in which the role of Information Structure on L2 processing of words is tested. Pitch and duration of 4 sets of experimental material in German and English are measured and analyzed in this paper. The well-known finding that accent boosts duration and pitch is confirmed. Syntactic and lexical means of marking focus, however, do not give the duration and the pitch of a word an extra boost.
In this paper, we discuss the design and implementation of our first version of the database "ANNIS" (ANNotation of Information Structure). For research based on empirical data, ANNIS provides a uniform environment for storing this data together with its linguistic annotations. A central database promotes standardized annotation, which facilitates interpretation and comparison of the data. ANNIS is used through a standard web browser and offers tier-based visualization of data and annotations, as well as search facilities that allow for cross-level and cross-sentential queries. The paper motivates the design of the system, characterizes its user interface, and provides an initial technical evaluation of ANNIS with respect to data size and query processing.
The paper presents a novel approach to explaining word order variation in the early Germanic languages. Initial observations about verb placement as a device marking types of rhetorical relations made on data from Old High German (cf. Hinterhölzl & Petrova 2005) are now reconsidered on a larger scale and compared with evidence from other early Germanic languages. The paper claims that the identification of information-structural domains in a sentence is best achieved by taking into account the interaction between the pragmatic features of discourse referents and properties of discourse organization.
Die Erstellung eines Großwörterbuchs ist ein umfagreiches Vorhaben – nicht nur in quantitativem Sinne. So ist es mir eine Ehre, dass ich – als Mitherausgeber der kürzlich erschienenen Großwörterbücher Deutsch-Ungarisch und Ungarisch-Deutsch – im Rahmen dieser Tagung die derzeit laufende lexikographische Arbeit an einem deutsch-finnischen Großwörterbuch unter der Leitung von Professor Jarmo Korhonen näher kennen lernen kann. Über dieses Projekt schreibt Lenk (1998: 87) in einem Tagungsbericht: „Das [...] geplante neue Großwörterbuch begnügt sich mit einer voraussichtlichen Stichwortzahl von 100.000.“ Nun erhebt sich die Frage, was hier wohl mit der Formulierung „begnügt sich“ gemeint war: Wie „groß“ muss eigentlich ein „Großwörterbuch“ sein, um diesen Namen führen zu dürfen? Unter diesem Aspekt möchte sich der vorliegende Beitrag mit der Problematik der Größenklassen bzw. -bezeichnungen von Wörterbüchern auseinander setzen, da diese Fragestellung in mehrfacher Hinsicht aktuell ist, sowohl für die metalexikographische Theorie als auch für die Praxis der Wörterbucharbeit. Zur Verdeutlichung sei zunächst exemplarisch auf die ungarische Wörterbuchwirklichkeit hingewiesen: Es sind vor kurzem fast zeitgleich – allerdings für unterschiedliche Sprachenpaare – so genannte „Großwörterbücher“ einerseits mit lediglich 30.000 (z.B. Radácsy 1997) und andererseits mit mehr als 200.000 Lemmata (z.B. Halász/Földes/Uzonyi 1998a) herausgegeben worden. Ebenfalls in Ungarn erscheinen jetzt – sogar für dieselbe Sprachrichtung – zwei Wörterbücher mit im Wesentlichen gleicher Lemmaanzahl, wobei sich das eine „Kleinwörterbuch“ (Halász/Földes/Uzonyi 2000a), das andere aber schon „Handwörterbuch“ (Hessky 2000) nennt. Mit anderen Worten: Sprachlexika mit etwas über 30.000 Lemmata nennt man mal Klein-, mal Hand-, mal Großwörterbuch. Von dieser empirischen Beobachtung ausgehend soll im Weiteren an einer größeren Zahl zweisprachiger Wörterbücher, in denen eine der beteiligten Sprachen das Deutsche ist, untersucht werden, ob die Bezeichnungen als einigermaßen verlässliche Indikatoren für die Größe des lexikographisch erfassten Sprachmaterials angesehen werden können. Ebenfalls soll der Frage nachgegangen werden, ob die immer zahlreicher werdenden Attribuierungen und Bestimmungswörter wie großes Wörterbuch oder Global-, Universal-, Kompaktwörterbücher etc. mit dem tatsächlichen Umfang der Wörterbücher korrelieren und ob bzw. inwieweit die diesbezüglich verwendeten Terminologien der einzelnen lexikographischen Werkstätten bzw. der Verlage miteinander kompatibel sind. Hier besteht erheblicher Klärungsbedarf. Vor diesem Hintergrund sollen generell die Probleme der Größenbezeichnungen bzw. -klassen – oder wie der Heidelberger Metalexikograph Wiegand (1990: 2127) besonders fachkundig formuliert: „die Zahlen zur Mächtigkeit der Trägermenge der Makrostruktur“ – angesprochen werden. Dabei muss man sich natürlich klar vor Augen halten, dass die Lemmaanzahl nur eines der Kriterien zur Bestimmung des Volumens, d.h. der Größenklasse ist (vgl. Wiegand 1990: 2129). Bei der Lemmaselektion ergeben sich daher für die Lexikographen gleich zwei grundsätzliche Dilemmas: (a) in quantitativer Hinsicht wie viel und (b) in qualitativer Hinsicht welche Lemmata Aufnahme finden sollen. Denn nur bei einem geschlossenen Korpus – wie etwa bei einem historischen Wörterbuch – liegt eine idealtypische Lemmaselektion vor, indem die Quellen vollständig ausgewertet werden können: Beispielsweise war es Hannig (1995: VII) möglich, in seinem „Handwörterbuch Ägyptisch- Deutsch. Die Sprache der Pharaonen (2800-950 v.Chr.)“ relativ ruhigen Gewissens zu äußern: „Das Handwörterbuch ist eine möglichst vollständige Sammlung aller bekannten Wörter der zweiten/dritten bis inklusive einundzwanzigsten Dynastie“. Die Probleme der Größenklassen scheinen in den einschlägigen Fachdiskursen kaum eine Rolle zu spielen. In einer Monographie erwähnt zwar Schaeder (1987: 84) im Zusammenhang mit einsprachigen Spezialwörterbüchern am Rande: „Geteilt dürften die Ansichten darüber sein, was ein großes und was ein kleines Wörterbuch ist“. Gleichwohl finden sich in den sonst erschöpfenden HSK-Bänden „Wörterbücher“ von Hausmann/Reichmann/Wiegand/Zgusta (1990/1991) recht sporadisch und zugleich ziemlich rudimentäre Hinweise auf eine Phänomenologie der Größenordnung von Wörterbüchern.
In der sog. Edo-Zeit (1603–1867) durften sich in Japan von den Europäern nur Niederländer (Holländer) aufhalten und Handel treiben. Folglich mussten Deutsche manchmal als „Bergholländer“ ausgegeben werden und ihre Sprache dementsprechend als „Bergholländisch“ (vgl. GAD 1996: 3). Vor dem Hintergrund dieses nicht unspektakulären Beispiels erhält nun die als Überschrift des vorliegenden Beitrags dienende Fragestellung auch eine historisch-interkulturelle Legitimation. CIRKO (2004: 131 ff.) ging kürzlich dem Fundamentalproblem nach, was überhaupt Sprache sei; mein Aufsatz will spezifizierend die Vielschichtigkeit des Begriffs "deutsche Sprache" reflektieren, genauer: wie ihr Konzept und ihre Architektur sind, insbesondere angesichts ihrer weitgehenden Regionalität, Variation und Heterogenität. So soll der vorliegende Beitrag das Phänomenfeld der arealen Varianz im Ensemble der deutschen Gegenwartssprache hinterfragen, differenzieren und interpretieren. Dabei geht es vorrangig darum, die Binnenverhältnisse des Deutschen in diesem Argumentationszusammenhang zu modellieren und eine Systematik der Regionalität am Beispiel des Deutschen zu erarbeiten.
Der Beitrag greift zwei recht kontaktsensitive und dennoch wenig erforschte sprachlichkommunikative Sonderbereiche auf, und zwar die Verwendung von (a) Eigennamen und von (b) Schelt- bzw. Schimpfausdrücken sowie Flüchen. All diese Phänomene sind offenbar universale Komponenten von Sprachen (vgl. auch Haspelmath 2002: 277; Geier-Leisch 1998: 7 f.). An diesem empirischen Material will der Beitrag im Einzelnen ermitteln, wie Kontaktund Interaktionsphänomene in gemischtsprachigen Diskursen unter Bedingungen einer transkulturellen Mehrsprachigkeit auftreten, wobei ihre Realisationsstrukturen, -typen und -klassen erschlossen sowie ihr Funktionieren hinterfragt werden. Letzten Endes soll anhand der Auseinandersetzung mit einer vitalen und hochkomplexen Kontaktsituation von Sprachen bzw. Varietäten der sprachkommunikative Umgang mit Eigennamen und Sonderlexik aus der Perspektive der deutschen Sprache im Kräftefeld zwischen typologischer Tradition und sukzessiver Innovation beschrieben werden, um damit gleichzeitig relevante Bausteine zur Modellierung des Kontaktprozesses zu erarbeiten.
Deutsche Rundfunksprache in mehrsprachiger Umwelt : am Beispiel der Verwendung von Phraseologismen
(1995)
Der Beitrag geht davon aus, dass es von den Anfängen bis heute eigentlich keine deutsche Einheitssprache gegeben hat, sondern nur regionale Varietäten. Auch wenn Regionalität bei den Sprachen eine universale Kategorie zu sein scheint, zählt das Deutsche aus einer Reihe soziokultureller und sprachhistorischer Gründe zu den Sprachen, in denen den Varietäten eine besondere Bedeutung zukommt: Deutsch ließe sich wohl als ein Prototyp für die Heterogenität innerhalb einer Sprache ansehen. Der Aufsatz spricht von einer „mehrfachen Regionalität“ der deutschen Gegenwartssprache, die sich zugleich in mehreren diatopischen Variationsdimensionen manifestiert. Gemäß der variationslinguistischen Dialektologie – die primär den Aufbau und den Wandel des gesamten Spektrums regionaler Sprachvariation zwischen den Extremen Standardsprache und Basisdialekt erforscht – handelt es sich im vorliegenden Beitrag nicht um Schichten bzw. Strata, sondern um Oppositionen, d.h. um eine Art „Skala“ mit den beiden Polen („Standardsprache“ vs. andere Varietät), in deren Spannungsfeld sich die Kulturrealität Variation abspielt. In diesem Sinne werden der Standardsprache folgende Oppositionsdimensionen gegenübergestellt: (a) (z.B. groß- und kleinräumige bzw. lokale) Basisdialekte, (b) regionale Umgangssprachen, (c) nationale Standardvarietäten des Deutschen im Rahmen des Konzepts „Deutsch als plurizentrische Sprache“ und (d) Deutsch als Minderheitensprache im Sinne einer dialektalen Kontaktvarietät.
Der Beitrag geht davon aus, dass Phraseologismen zum einen als prototypische Verkörperung des ,,kulturellen Gedächtnisses" einer Diskursgemeinschaft, zum anderen als ein universelles, jeder Sprachkultur immanentes Kulturphänomen angesehen werden können. In diesem Zusammenhang setzt er sieh zum Ziel, das Spannungsfeld der Verflochtenheit von ,Kultur" und "Sprache" mit ihren Ausprägungen und Konsequenzen am Material der Phraseologie im Hinblick auf das Deutsche und das Ungarische analytisch herauszuarbeiten und mehrperspektivisch zu hinterfragen. Denn die - im Titel der Tagung hervorgehobene - Kulturgeschichte und die Phraseologie stellen eine äußerst facettenreiche Thematik dar, die eine Reihe kulturphilosophischer, kultursemiotischer, interkultureller, kognitiv-linguistischer u. a. Fragen aufwirft und sowohl einen synchronen als auch einen diachronen Betrachtungsrahmen effordert. Der vorliegende Aufsatz kann sich jedoch auf lediglich einige aktuelle theoretische, methodologische und empirische Aspekte konzentrieren und möchte in disziplinärer Hinsicht kontrastiv und kontaktlinguistisch - dabei methodologisch phänomen- bzw. belegorientiert und problernbezogen - vorgehen.
Der vorliegende Aufsatz setzt sich mit einigen Aspekten der didaktisch-methodischen Umsetzung der am 1. August 1998 in Kraft getretenen Neuregelung der deutschen Rechtschreibung im DaF-Unterricht und in der sog. Auslandsgermanistik auseinander. Es wird vor allem auf Fragen der Umstellung unter dem Gesichtspunkt des Lehrens und Lernens von DaF fokussiert und für eine stärkere Berücksichtigung der Rechtschreibdidaktik plädiert.
Ein Gespenst geht um im deutschen Sprachraum - das Gespenst der Rechtschreibreform. In dieser Situation möchte dieser Aufsatz aus der speziellen Sicht des Lehrens und Lernens von DaF zur Reformdiskussion beitragen - vor allem mit Blick auf Grundkonzept, Werdegang und Rezeption der Reform sowie ganz besonders hinsichtlich der neuen Regeln und Einzelfestlegungen. Es ist erwiesen, dass DaF-Lernende mit bestimmten Schwerpunkten der deutschen Rechtschreibung (einschließlich der Zeichensetzung) weniger Schwierigkeiten als Muttersprachler haben, während sie in anderen Bereichen genauso anfällig für Fehler sind (vgl. BOHN/SCHREITER 1996: 176).1 Deshalb ist m.E. der folgende Standpunkt von SITTA (1992: 115) etwas zu relativieren: "Die Schreibung (Orthographie, Interpunktion) muß natürlich gelernt werden, dies bereitet aber im Normalfall denen kaum Schwierigkeiten, die in ihrer Muttersprache keine Schwierigkeit auf diesem Gebiet haben." Dementsprechend soll die Lehr-, Lern- und Benutzbarkeit der reformierten Orthographie für Nicht-Deutschsprachige - und zwar im Vergleich zur bisherigen Rechtschreibung - im Mittelpunkt dieses Beitrags stehen.
Der Aufsatz setzt sich mit Möglichkeiten und Grenzen der sog. neuen Medien (mit besonderer Berücksichtigung von Hypermedia) im Hinblick auf ihren Einsatz bei der universitären Linguistik-Vermittlung auseinander. Es werden sowohl allgemeine Überlegungen zur sinnvollen Anwendung der neueren technischen Errungenschaften in der linguistischen Lehre angestellt als auch spezielle Erfahrungen und Einsichten anhand der Konzipierung und Erstellung einer 1999 erschienenen CD-ROM zum Thema "Linguistik und Gesellschaft" - die erste hypermediale ausgesprochen linguistische CD-ROM in Ungarn - dargelegt. Zudem erörtert der Beitrag Arbeitsaspekte für die demnächst erscheinende CD-ROM "Sprachwissenschaftliche Grundfragen".
Die Problematik des sprachkommunikativen Umgangs mit dem Kulturphänomen "Phraseologie" ist im Falle zwei- bzw. mehrsprachiger Diskursgemeinschaften bisher kaum ins Blickfeld der Forschung geraten. Daher konzentriert sich der vorliegende Aufsatz auf Aspekte phraseologischer Sprachverwendung in einem komplexen Konrakt-, Konvergenz- und Integrationsraum von mehreren Sprachen und Kulturen und möchte zur Modelierung bi- bzw. multilingualen Diskursverhaltens im Hinblick auf die Phraseologie beitragen, indem er ein breites Spektrum von enmpirischen Manifestationsklassen bzw. -typen kommunikativen Synkretismus und sprachlicher Hybridität erfasst, systematisiert, beschreibt und evaluiert. Diese Forschungsfrage erlangt auch insofern eine besondere Bedeutung, als sich die Mehrschichtigkeit bilingualer Variationsdimensionen gerade anhand der Phraseologieverwendung aspektreich eruieren Iässt.
Die vorliegende Arbeit setzt sich mit einer spezifischen Sprach- und Sprachensituation auseinander, die besondere Ausformungen sowie Strukturierungen des Deutschen aufweist und für die ein umfassender und durchdringender soziokultureller sowie sprachlicher Austausch – und als deren Folge Mehrsprachigkeit und Inter- bzw. Transkulturalität – den Bezugsrahmen darstellen. In dieser inter- bzw. transkulturellen „Fugen-Position“ ist das Deutsche weder Mutter- noch Fremdsprache im herkömmlichen Sinne des Wortes. Es handelt sich um Deutsch als Minderheitensprache (nach einer anderen Terminologie: Nationalitätensprache) in Ungarn. Die Sprach(en)verhältnisse der Ungarndeutschen werden seit über 250 Jahren grundlegend durch immer intensiver werdende „Außenkontakte“ mit dem Ungarischen und mit anderen Umgebungssprachen bzw. -varietäten gekennzeichnet: Ungarisch übt seit der zweiten Hälfte des 19. Jahrhunderts einen sukzessiv erstarkenden Einfluss auf das kommunikative Handeln und dadurch auf das Sprachrepertoire der Ungarndeutschen aus, wohingegen nach 1945 die Einwirkung des Ungarischen besonders massiv wurde. Im Hinblick auf den sog. „geschlossenen“ (m.E. besser: zusammenhängenden) deutschen Sprachraum hat Mattheier (1980: 160) ausgeführt, dass Veränderungen in den Sprachgebrauchsstrukturen eng mit Veränderungen in den sprachlichen Strukturen verbunden sind und dass beide Prozesse gewöhnlich gleichzeitig vor sich gehen. Unter Bedingungen der Mehrsprachigkeit und der Inter- bzw. Transkulturalität gilt dies, wie mir scheint, verstärkt. Denn die Sprachgebrauchsstrukturen der Ungarndeutschen haben sich zugleich aus zweierlei Hauptgründen mehrfach geändert: (a) Zum einen haben die erwähnten lange andauernden und tief greifenden (alle sozialen Domänen erfassenden) sozio- bzw. interkulturellen und sprachlichen Kontakte und die sich aus ihnen ergebenden kommunikativen Muster erhebliche Konsequenzen für die Sprache. Denn Sprachenkontakte lösen „von Haus aus“ nicht unwichtige Veränderungen in den interagierenden Sprachvarietäten aus. Dies betrifft sowohl die sprachlichen Formen, Strukturen und Modelle als auch die Sprach- bzw. Diskursgewohnheiten und darüber hinaus – wie ich meine – sogar das Weltmodell der miteinander in Berührung befindlichen ethnischen Gruppen bzw. Kommunikationsgemeinschaften. (b) Zum anderen erfolgte die sprachliche Bewältigung der Umwelt – auch abgesehen von der Mehrsprachigkeitssituation – auf andere Art und Weise als im zusammenhängenden deutschen Sprachraum, unterscheidet sich doch der soziokulturelle Referenzrahmen für die deutsche Minderheit in Ungarn fundamental im auf dem deutschen Sprachgebiet. Diese beiden Aspekte (a und b) üben ihre sprachgestaltende Wirkung auf das Deutsche als Minderheitensprache im Kulturraum Ungarn auch heute aus. Somit werden im vorliegenden Beitrag Elemente, Strukturen, Modelle und Gesetzmäßigkeiten im Mikrokosmos einer spezifischen Kontaktvarietät des Deutschen beschrieben und exemplifiziert, die sich von der binnendeutschen Standardsprache, aber auch von den binnendeutschen regionalen Varietäten grundlegend unterscheidet. Anhand ausgewerteter oraler Sprachproben, die ich im Rahmen eines kontaktlinguistischen Feldforschungsprojekts in der ungarndeutschen („donauschwäbischen“) Ortschaft Hajosch (auf Ungarisch: Hajós) in der nördlichen Batschka erhoben habe, sollen Aspekte der Varianz und Kontaktlinguistik der Sprachinnovation ermittelt und dokumentiert werden.
Der Aufsatz diskutiert grammatische Aspekte von authentischen Sprachgebrauchsstrukturen in einem komplexen Kontakt- und Integrationsraum von mehreren Sprachen und Kulturen. Als empirisches Illustrationsmaterial dient ein umfangreiches kontaktlinguistisches Feldforschungsprojekt im ungarndeutschen Ort Hajosch/Hajós (Komitat Batsch-Kleinkumanien / Bács-Kiskun). Anhand von dort ermittelten Sprechprodukten zwei- bzw. mehrsprachiger Sprecher werden vielgestaltige sprachlich-kommunikative Kontakt-, Konvergenz- und Interaktionsphänomene grammatischer Natur identifiziert. Ihre Analyse ergab, dass die exemplarisch untersuchte Diskursgemeinschaft beim Umgang mit morphosyntaktischen Phänomenen zahlreiche und vor allem mannigfaltige Formen von Hybridität hervorbringt. Die erschlossenen Phänomenklassen und -typen scheinen für transkulturelle Zusammenhänge generell verallgemeinerbar zu sein.
Mit dem vorliegenden Beitrag sollte gezeigt werden, dass Untersuchungen zur Sprache von Minderheitenblättern nicht nur die Forschungen zur Pressesprache bereichern können, sondern gleichermaßen den Erkenntnisstand über verschiedene andere Sondersprachen. Infolge des besonderen sprachlich-kommunikativen Kontextes der lebensweltlichen Mehrsprachigkeit und des spezifischen soziokulturellen Umfelds der erlebten Interkulturalität vermögen solche Forschungen - die künftig in größerer Zahl und auf breiterer Basis wünschenswert wären - Blickwinkel, Instrumentarien und Ergebnisse der traditionellen Forschungsaktivitäten im binnendeutschen Sprachraum durch qualitativ neue Aspekte zu ergänzen und dadurch auch in vielerlei Hinsicht zu relativieren.
Kaum hatte Finnland am 1. Juli 1999 den Vorsitz im EU-Ministerrat übernommen, waren für die informellen Treffen der EU-Minister - erstmalig beim Treffen der Industrieminister am 3. Juli in Oulu - neben der Gastgebersprache Finnisch nur noch Englisch und Französisch als Arbeitssprachen vorgesehen. Deutschland und daraufhin auch Österreich wollten jedoch auf ihre Sprache - die Muttersprache der größten Sprachgemeinschaft der EU - nicht verzichten und bestanden (unter Berufung auf das Gewohnheitsrecht unter den vorausgehenden EU-Präsidentschaften Frankreichs, Großbritanniens, Luxemburgs, der Niederlande und Irlands) auf der zusätzlichen Zulassung des Deutschen als Arbeitssprache. Da der finnische Ministerpräsident Lipponen auf frühere Usancen verwies, als nur Englisch und Französisch als Arbeitssprache fungierten und auf seiner restriktiven Entscheidung beharrte, verweigerten Deutschland und Österreich ihre Teilnahme und kündigten an, unter diesen Bedingungen alle informellen Ministertreffen unter finnischer Präsidentschaft zu boykottieren. So blieben sie am 18. Juli dem Treffen der Kultusminister fern. Finnland lenkte daraufhin ein und stellt nun auch für Deutsch Dolmetscherkabinen zur Verfügung (vgl. etwa FAZ vom 01.07.1999, S. 1; vom 03.07.1999, S. 1 und vom 09.07.1999, S. 12). Dieser auch in den Medien intensiv thematisierte Fall zeigt sehr deutlich, dass sich augenscheinlich hinsichtlich der Wertsetzung der deutschen Sprache in der letzten Zeit einiges geändert hat. Dennoch ist es um die Attraktivität und das Ansehen der deutschen Sprache weder bei den Deutschsprachigen selbst noch international im globalen Bereich der "Weltsprachen", der menschlichen Kulturformen und Mentalitäten gut bestellt. Es scheint daher von höchstem Interesse zu sein, einmal einen handlungsorientierten, zeitgemäßen und umfassenden Überblick über die Werthaltungen zur deutschen Sprache zu erarbeiten. Ziel der vorliegenden Ausführungen kann allerdings lediglich die Exponierung jener vom Verfasser als wichtig und aktuell erachteten Aspekte dieser hochbrisanten Thematik sein, die im Zusammenhang mit dem Nutz- bzw. Verkehrswert sowie mit dem Image und der Förderung der deutschen Sprache eine Rolle spielen könnten. Dabei lässt sich die "Güte" einer Sprache - in Anlehnung an ICKLER (1993: 202) - (a) im Hinblick auf ihren Status und (b) auf ihr System (bzw. Korpus) beurteilen. Mein Aufsatz strebt keine linguistische Systembewertung an, sondern konzentriert sich zum einen auf die Einschätzung des Systems der Sprache durch mutter- und fremdsprachliche Sprecher des Deutschen, zum anderen auf aktuelle Fragen ihres Status. Zunächst werden - als eine Art Problemübersicht - Elemente einer Bestandsaufnahme skizziert, um daraus anschließend mögliche Handlungskonsequenzen und -möglichkeiten abzuleiten und aufzuzeigen.
Die moderne Gesellschaft ist von Veränderungen epistemischer und institutioneller Strukturmerkmale der Wissenschaft geprägt, die ihrerseits einen Wandel in anderen Bereichen der Gesellschaft auslösen. In diesem Zusammenhang – wie auch in der neuzeitlichen Wissenschaftsentwicklung überhaupt – kommt der Sprachlichkeit, dem Kulturphänomen "Wissenschaftssprache", eine eminente Rolle zu, etablierte sich doch in den letzten Jahrzehnten eine „linguistische Teildisziplin der Wissenschaftssprachforschung“ (vgl. KRETZENBACHER 1992: 1; HESS-LÜTTICH 1998). "Wissenschaft" scheint mir jedoch ein (interkultureller) Problembegriff zu sein, beispielsweise auch schon deswegen, da dieses Wort (samt seinen Ableitungen wie Wissenschaftler, wissenschaftlich, Wissenschaftlichkeit) stark kulturbedingt ist (vgl. CLYNE/KREUTZ 2003: 60); so korreliert etwa der deutsche Terminus Wissenschaft nicht mit dem englischen science etc. Das Englische kann zweifellos auf eine konkurrenzlose Karriere als wissenschaftliche Universalsprache zurückblicken: Wissenschaftler – auch deutschsprachige – bedienen sich bei der Veröffentlichung wichtiger Forschungsergebnisse zunehmend der englischen Sprache. Der Anteil der wissenschaftlichen Publikationen auf Englisch beträgt heute weltweit über 90 Prozent, während nur noch wenige Prozent des wissenschaftlichen Publikationsaufkommens deutschsprachig sind. Auch die Zahl der wissenschaftlichen Tagungen (selbst im deutschen Sprach- und Kulturraum), die ausschließlich Englisch als Konferenzsprache zulassen, nimmt stetig zu. Außerdem werden immer mehr Vorlesungen bzw. ganze Studiengänge an sonst deutschsprachigen Universitäten in Englisch angeboten. „Die Spitzenforschung spricht englisch“ – stellte der spätere Präsident der Max-Planck-Gesellschaft, Hubert Markl, bereits vor zwanzig Jahren lapidar fest (Quelle: DUZ, 22/2002, S. 12). Gleichwohl wird immer wieder – oft etwas euphorisch – auf Ostmittel-, Ost- und Südosteuropa verwiesen, die traditionell als ein Refugium des Deutschen u.a. auch als Wissenschaftssprache galten bzw. auf weiten Strecken nach wie vor gelten. So kann exemplarisch die „Physikalische Zeitschrift der Sowjetunion“ erwähnt werden, die von 1932 bis 1937 auf Deutsch erschien. In diesem interessanten und zugleich äußerst komplexen Spannungsfeld soll es sich im vorliegenden Beitrag um das Thema ‘Sprachen in den Wissenschaften’ als Denk- und Darstellungsmedia handeln. Dabei soll zum einen die Problematik der Mehrsprachigkeit der Wissenschaften (mit besonderer Berücksichtigung des Deutschen) im mehrsprachigen, multikulturellen und kultursensiblen Kontaktraum Mittel- und Osteuropa angesprochen werden, zum anderen – weil ja auf unserer Tagung auch andere Teilareale, wie z.B. Rumänien, vertreten sind – soll der besondere Schwerpunkt auf Ungarn liegen. Hauptziel der Erörterungen besteht darin, die Entwicklung der in dieser Region wirksamen Wissenschaftssprachen diachron herauszuarbeiten, den derzeitigen Stand für die Bereiche Sprachen in der akademischen Lehre, Forschungssprachen (d.h. Sprachen der Forschungskommunikation) und Publikationssprachen – auch mit Hilfe empirischer Daten – mehrperspektivisch zu dokumentieren und aktuelle Tendenzen reflektorisch aufzuzeigen.
Der vorliegende Beitrag prüft, ob der „Sprachinsel“-Ansatz wirklich geeignet ist, das Problem „Realitätsbereich Deutsch als Minderheitensprache“ sachangemessen zu erkennen, zu erfassen, zu thematisieren, zu beschreiben, zu interpretieren und zu bewerten, indem er verdeutlicht, dass die Metapher der ‘Sprachinsel’ heute mindestens in zweifacher Hinsicht keinen optimalen Ordnungs- und Erklärungsansatz bereitstellen kann. Erstens, weil das derzeitige Kommunikationsprofil von Minderheitengemeinschaften und das aktuelle Gesicht dieser Sprachvarietäten nicht mehr durch eine insulare Abgeschiedenheit, sondern vielmehr durch Zwei- und Mehrsprachigkeit und Sprachen- bzw. Kulturenkontakte bestimmt werden. Zweitens, weil die sog. metaphorischen Konzepte bei der wissenschaftlichen Erkenntnis eine wesentliche Rolle spielen. Daher wäre ein Untersuchungsansatz produktiv, welcher der besonderen aktuellen Dynamik der für die Minderheiten meist charakteristischen mehrsprachigen bzw. mehrkulturigen Konfigurationen und den sprachlichen bzw. kulturellen Austauschprozessen explizit Rechnung trägt. In diesem Zusammenhang wird hier eine interkulturelle (oder transkulturelle) Linguistik als mögliches Paradigma vorgeschlagen.
Der vorliegende kurze Beitrag [hat] das Ziel, im diskutierten Problemrahmen konstitutive Aspekte der Horizonte, Konturen und Fluchtlinien einer dezidiert inter- bzw. transkulturellen Ausrichtung der Sprachwissenschaft anzudeuten und zu hinterfragen, ihre disziplinären Wege und Blickfelder anzulegen sowie über ein inter- bzw.transkulturelles ,,Paradigma" als "interkulturelle Linguistik" im Hinblick auf Profil, Tragfähigkeit und Reichweite zu reflektieren. All das soll dann zu einer extensionalen und intensionalen Bestimmung einer "interkulturellen Linguistik" hinführen.
"Kultur" und "Interkulturalität" sind von zunehmender wissenschaftlicher und politisch-gesellschaftlicher Bedeutung, sie verkörpern Kodeworte des Zeitgeistes. Ihre Thematik hat in der gegenwärtigen Forschung mindestens in fünffacher Hinsicht eine herausragende Rolle erworben: (1) als „kulturalistische Wende" in der Geschichtswissenschaft und in anderen Gesellschaftswissenschaften, (2) in der Hinwendung der Gennanistik zu kulturellen Fragestellungen (z.B. bei der Einbeziehung von Identitätsproblemen), (3) bei der Identifizierung von Unterschieden interkultureller Verflechtungen, (4) für die Forschungstendenzen im Bereich der Wechselbeziehungen zwischen Sprache und Kultur und (5) im Hinblick auf Sprache und Kommunikation. Allerdings handelt es sich bei der Begegnung, der Überlagerung oder der eventuellen Fusion von Kulturen und Sprachen, d.h. beim "interkulturellen" sprachlichen Austausch um eindeutig komplexere Vorgänge als es Termini bzw. Beschreibungskategorien wie z.B. ,,Begegnung" bisher anzudeuten vermögen. Im wissenschaftlichen Diskurs ist dementsprechend auch die Erkenntnis gereift, dass die Schlüsselkategorien selbst, mit denen auf diesem Feld üblicherweise gearbeitet wird, der Reflexion nicht weniger bedürfen als die Phänomene, die man mit ihnen zu erschließen sucht. Werden doch mit Leitbegriffen wie ,,Kultur", „Interkulturalität", ,,fremd" und ,,eigenartig" - um nur einige zu nennen - offenkundig keine festen Größen angegeben. Was sie bezeichnen, erscheint aus der Sicht neuerer Forschungen vielmehr weitgehend „konstruiert", d.h. afs prinzipiell variable Resultate fortwährender Abgrenzungs-, Vermittlungs-, Vermischungs- oder auch Überlagerungsprozesse. Daher wäre es ein vordringliches multi-, inter- oder eher: transdisziplinäres Forschungsdesiderat, diese Prozesse und ihre Veränderungsdynamik zu beschreiben und zu evaluieren. Auch Voraussetzungen, Rahmenbedingungen, Strukturen und Wirkungen müssten sowohl theoretisch als auch empirisch und mit dem nötigen historischen Tiefgang auf breiter Basis systematisch analysiert sowie problemorientiert aufgedeckt werden. Mein Beitrag will und kann diesem umfassenden Anspruch natürlich nicht voll gerecht werden. Statt einer kompletten - und abstrakten - Prograrnmbeschreibung nach dem Muster eines ,,Theorien-, Methoden- und Themenhandbuchs" geht es mir vielmehr darum, in diesem Problemrahmen konstitutive Aspekte des Horizonts, der Konturen und Abgrenzungen einer dezidiert inter- bzw. transkulturellen Ausrichtung der Sprachwissenschaft zu skizzieren und zu hinterfragen, ihre disziplinären Richtungen zu bestimmen sowie über ein inter- bzw. transkulturelles "Paradigma" der Linguistik im Hinblick auf Profil, Tragfähigkeit und Reichweite zu reflektieren.
Ein aktuelles Handbuch der empirischen Sozialforschung stellt fest: „Die meisten Theorien in den Sozialwissenschaften sind relativ ungenau formuliert und beziehen sich auf nicht exakt definierte Begriffe“ (SCHNELL/HILL/ESSER 2005: 11). Die Linguistik – so auch die Sprachgermanistik – sollte aus dieser Kritik produktive Konsequenzen ziehen und dezidierte Anstöße für eine theoretisch fundierte und empiriegestützte Begriffs- und Konzeptbildung von IKK erarbeiten. Nicht zuletzt mit der Intention, dass die IKK als Phänomentyp kein „weicher“ Forschungsgegenstand mehr bleiben darf und dementsprechend die IKK-Forschung nicht mehr als „weiche“ Wissenschaft gelten sollte.
Das im Jahre 1952 von Elöd Halász herausgegebene Deutsch-ungarische Großwörterbuch und sein 1957 erschienenes ungarisch-deutsches Pendant sind im Laufe der Jahrzehnte beinahe zu einer Legende geworden und fungierten bis vor kurzem als die einzigen Wörterbücher für dieses Sprachenpaar sowohl im ungarischen als auch im deutschen Sprachraum. Entsprechend verlangten diese mittlerweile mehr als 45 bzw. 40 Jahre alten Sprachlexika nach einer grundlegenden Modernisierung. Die beiden Nachfolgewörterbücher sind nun unter der Herausgeberschaft von Csaba Földes und Pál Uzonyi im Verlag der Ungarischen Akademie der Wissenschaften in Budapest erarbeitet worden. Die vorliegende Studie beschäftigt sich mit dem metalexikographischen Konzept der Neubearbeitung, geht dabei auf allgemein-theoretische Fragen der bilingualen Lexikographie ein und beschreibt die einzelnen Etappen des Projekts.
Der Balkan hält Europa - und andere Kontinente - seit einiger Zeit erneut in Atem. Diese politischen Erschütterungen und die Diskurse darüber haben auch sprachliche Ungereimtheiten und grammatische Zweifels- bzw. Problemfälle deutlich werden lassen, auf die man ohne diese Ereignisse wohl kaum aufmerksam geworden wäre. Der Kosovo-Konflikt scheint also offensichtlich auch im Kontext der deutschen Grammatik - und umfassender der Sprache schlechthin - ein vielschichtiges und subtiles Problem von einiger Brisanz darzustellen.
Die Untersuchung von Eigennamen (EN) im Kontext der Kontaktlinguistik stellt ein besonders aktuelles und informatives Forschungsfeld dar: Beispielsweise hat Eichler (1976: 128) bereits vor zweieinhalb Jahrzehnten erkannt, dass "gerade Sprachkontaktforschung heute ohne die onomastische Komponente nicht mehr gut denkbar ist". Beim gegenwärtigen Wissensstand kann auch von der anderen Seite her festgestellt werden, dass – insbesondere in Kulturräumen, in denen mehrere Sprachen miteinander in Berührung kommen – die Namenforschung eines kontaktlinguistischen Blickwinkels bedarf. Denn die EN verkörpern wohl den deutlichsten Nachweis für langfristige Vorgänge und Ergebnisse von Sprachenkontakten. So können diesbezüglich etwa hinsichtlich des "Namenstransfers" (Terminus nach Eichhoff 1991: 264) in mehr oder weniger multilinguale Regionen vor allem die Familien- und Ortsnamen lehrreiche linguistische wie auch interkulturelle Aufschlüsse liefern. Die onomastische Forschung verhält sich in diesem Problembereich unterschiedlich. Die kontaktlinguistischen Implikationen des direkten Transfers von Personennamen (mit phonematischer Anpassung) wurden in angelsächsischer Relation (norwegische, jiddische und ungarische Namen in den USA) bereits von einer Reihe bekannter Linguisten wie Kimmerle (1941: 1ff.; 1942: 158ff.), Haugen (1953: 201ff.), Mencken (1949: 474ff. sowie Supplement II, 1952: 396ff.), Weinreich (1968: 53), Bartha (1993: 41 ff.) und Kontra (1988: 58ff.) angesprochen. Hingegen würdigen nicht wenige Veröffentlichungen mit germanistischer Ausrichtung, auch wenn sie deutsche Nachnamen am Rande oder außerhalb des sog. "geschlossenen deutschen Sprachraums" ausführlich behandeln, diese Sprachenkontaktphänomene keines Hinweises (z. B. Breza 1986, Grünspanová 1975). Einige Arbeiten schneiden zwar die Einwirkung der Kontaktsprache(n) auf die deutschen Familiennamen (FaN) an, machen dies allerdings nicht zu ihrem primären Untersuchungsobjekt (z. B. Čučka/Melika 1979, Hellfritzsch 1990, Matejčík 1993[3] und Mori 1993). Lediglich in deutsch-tschechischer (Knappová 1990) und stärker in deutsch-angloamerikanischer sowie deutsch-costaricanischer Relation liegen einschlägig ertragreiche Beiträge vor, die verschiedene Integrationserscheinungen am Beispiel deutscher FaN in der englischsprachigen Umwelt der USA bzw. dem spanischsprachigen Milieu von Costa Rica thematisieren (Jones 1991 und besonders Eichhoff 1991 bzw. Boving 1986). Vor diesem Hintergrund zielt die vorliegende Studie darauf ab, deutschsprachige FaN in Südungarn einer kontaktlinguistischen Analyse zu unterziehen. Dies verspricht insofern ein besonders reizvolles Untersuchungsfeld, als in den Anthroponymen – dank lang anhaltender intensiver und mannigfacher Sprachen- und Kulturenkontakte trotz ihrer amtlich festgelegten Schreibformen – deutsche und ungarische Sprachelemente miteinander verschmelzen und in enger Symbiose existieren. Die Wechselwirkungen der flektierenden, indogermanischen deutschen Sprache und der agglutinierenden, finnisch-ugrischen ungarischen Sprache sind auch im Hinblick auf die Sprachtypologie besonders interessant.
This paper is concerned with the cultural reality characterised by the cmmunication within bi- or multilingual groups, in comparison to monolingual comniunication. In other words, such groups use their varieties of language differently. In this respect the paper deals with a culture of multilingualisrn, with a primary aim of highlighting subtly the characteristics end structure of the bi- or multilingual way of speaking. In particular, the predominant goal of this study is to emphasize respects of the "mixed" speech behaviour (the bilingual inode of discourse); and of innovations in speech and communication of transcultural bi- or multilingualism utilizing the example of the German as a minority language in Hungary. On the basis of the research it has become clear that linguistic variations and differentes should not be viewed automatically as individual mistakes but as a reaction to a new conununicative challenge. The conclusions for the discipline of "applird lingusitics" encompass that: all outcornes of communicative dynamic processes on the system of language concerning monolingual as well as bilingual language behaviour (inclusive of both "natural" and "artificial" bi- or multilingualism), should be considered more subtly both in theory and practice. In addition these outcomes must be analysed and heuristically described within an integrated frame.
Wo es auch immer um die Stellung der deutschen Sprache geht, kann ein Hinweis auf Ostmittel-, Ost- und Südosteuropa, einschließlich der GUS kaum fehlen. Zumeist wird dieses Areal (im Weiteren bediene ich mich des im deutschen Sprachraum zunehmend verwendeten Kürzels MOE) fast als Synonym für eine Hochburg des Deutschen apostrophiert. Deutsch als MOE-Sprache? - kann man sich fragen. Die Daten, die Wahrnehmungen und die Einstellungen sind allerdings nicht ganz einheitlich und nicht restlos eindeutig. Die Situation etwa der Hochschulgermanistik in der östlichen Hälfte Europas hat Kalmán in der Deutschen Universitäts-Zeitung wie folgt beschrieben: „Mangelnde Strukturierung des Fachbereiches, fehlende Differenzierung von Abschlüssen, Frontalunterricht und die Didaktik des kritiklosen Auswendiglernens - nach nun fast sechs Jahren hat sich an den ostmittel- und osteuropäischen Hochschulen nichts Grundlegendes geändert. […] Denn: ´Die Wandlungsunfähigkeit in diesen Ländern ist keine Frage des Systems mehr, sie ist eine Frage der Bequemlichkeit´“. Im Gegensatz zu diesem vernichtenden Verdikt meine ich als „betroffener“ Hochschulgermanist aus Ungarn, dass es bei uns doch nicht so schlecht aussieht. So möchte ich in diesem Beitrag die aktuelle Situation der deutschen Sprache in den Bereichen Schule und Universität vorstellen und einige Entwicklungstendenzen herausarbeiten. Dabei sei zwar der ganze MOE-Horizont im Blick behalten, es soll aber Ungarn besondere Aufmerksamkeit geschenkt werden.
Vorliegender Beitrag geht davon aus, dass das Kulturphänomen "Deutsche Sprache" in Form und Gebrauch eine weitgehend regionale (areale) Inhomogenität aufweist. Im Argumentationsrahmen einer variationslinguistischen Dialektologie wird versucht, die diatopische Variationsbreite der deutschen Sprache zu umreißen und vor diesem Hintergrund eine spezifische bilinguale dialektale Kontaktvarietät des Deutschen (nämlich das sog. ,,Kontaktdeutsch") in ihrer synchron wie auch diachron überaus dynamischen Ausprägungsstruktur zu beschreiben und in das gegenwärtige Varietätenspektrum des Deutschen - sowohl hinsichtlich seiner Vetonung als auch seiner Dignität - einzuordnen. Somit soll auch zur Erforschung der inneren Dynamik der Varietätenvielfalt beigetragent werden.
Trotz einer allmählichen Hinwendung zu mehrsprachigen und multikulturellen Kontexten in den letzten Jahren gilt nach wie vor, dass den Paradigmen, Terminologien, Beschreibungsansätzen und Instrumentarien der Linguistik der meist unreflektierte Blickwinkel einsprachig und monokulturell sozialisierter Sprecher zugrunde liegt. So wurden z.B. die Sprachnormen bislang allenfalls aus der Sicht der Einsprachigkeit definiert, beschrieben und interpretiert. Die Perspektive bi- bzw. multilingualer Sprecher – einschließlich aller kulturellen Implikationen – wird in der Regel von den sprachwissenschaftlichen Auseinandersetzungen mit der Normen-Thematik ausgeschlossen. So hat auch Juhász, der bekannte ungarische Sprachgermanist, den bilingualen Diskursmodus zweisprachiger Personen als „einen Sprachgebrauch“ bezeichnet, „der sich nicht klassifizieren und noch weniger bewerten lässt“ (1986: 200). Meine Untersuchung beabsichtigt jedoch, die „prototypische“ Sprechweise und den kommunikativen Habitus4 bi- bzw. multilingualer Sprecher unter den Bedingungen gesellschaftlicher Zwei- bzw. Mehrsprachigkeit – ausgehend von der der Ingroup-Kommunikation bei Spontangesprächen unter Gruppenmitgliedern in verschiedenen Alltagssituationen – unter dem Gesichtspunkt der (sprachlichen und kommunikativen) Normen-Problematik zu beschreiben und zu hinterfragen sowie Aspekte ihrer Bewertung zu diskutieren. Damit soll ein Beitrag zur Modellierung bi- bzw. multilingualer und bi- bzw. transkultureller Sprachverhaltenssysteme – im Hinblick auf ihre Struktur, Hierarchie und Dynamik – geleistet werden. Als Exemplifikationsbereich dienen Belege aus dem sprachkommunikativen Verhalten von Ungarndeutschen.
Als eine der markantesten Schwierigkeiten der Zwei- bzw. Mehrsprachigkeitsforschung und der Kontaktlinguistik dürfte m.E. die Uneinheitlichkeit der in der einschlägigen Literatur verwendeten Terminologie und Begrifflichkeit gelten. So hat z.B. BRADEAN-EBINGER (1991: 54) in seiner Dissertation aus dem Jahre 1985 die wichtigste Ursache für den "Mangel an theoretischen Grundlagen" in der Kontaktlinguistik im "Fehlen einer relativ einheitlichen Terminologie" erblickt. Daher möchte die vorliegende Arbeit durch eine systematisierende Zusammenschau und Bewertung einer Zahl unterschiedlicher theoretisch-terminologischer Positionen der internationalen Zwei- bzw. Mehrsprachigkeitsforschung zu einer transparenteren Sicht beitragen und darauf aufbauend einen von mir erarbeiteten terminologisch-begrifflichen Apparat vorstellen, der das Gerüst eines aktuellen einschlägigen empirisch ausgerichteten Forschungsprojekts bildet. Um bei Grundlegendem zu beginnen: Sogar steht - trotz langjähriger vielfältiger Beschäftigung mit diesem Komplex - eine adäquate und einhellig akzeptierte Definition des Bibzw. Multilingualismus noch aus. Allerdings sehen manche, darunter auch jüngere, Publikationen das Phänomen der Zwei- bzw. Mehrsprachigkeit etwas simplifiziert. So geht z.B. OHRT (1998: 5) davon aus, daß dieser Begriff völlig eindeutig sei, und zwar in diesem Sinne: "Ein Individuum soll mehr als eine Sprache beherrschen, also außer seiner Muttersprache mindestens noch eine Fremdsprache. […] [M]an kann auch feststellen, daß es weltweit kaum eine andere Meinung gibt […]." In Kenntnis des aktuellen Literaturstandes wäre meiner Meinung nach zu konstatieren, daß dies der Komplexität und dem Facettenreichtum der Problematik nicht gerecht wird. Es liegt noch nicht einmal eine adäquate und einhellig akzeptierte Definition des Bi- bzw. Multilingualismus vor. Bereits vor mehr als zweieinhalb Jahrzehnten führte OVERBEKE (1972: 112 ff.) bei seiner Auseinandersetzung mit dem Terminus nicht weniger als 21 Definitionen der Zweisprachigkeit an, die er aus der Fachliteratur unter drei Gesichtspunkten - normativ, beschreibend und methodologisch - ermittelt hat. Trotz der stürmischen Entwicklung und vieler beachtenswerter Leistungen auf dem Gebiet der Bi- und Multilingualismusforschung bleibt nach wie vor festzustellen, daß die Skala der zur Verfügung stehenden Arbeitsdefinitionen ziemlich breit ist: Auf der einen Seite befinden sich die Forscher, die nur die "muttersprachähnliche Kontrolle über zwei Sprachen" (BLOOMFIELD 1933: 56) als Zweisprachigkeit anerkennen. Diese Position hält sich teilweise bis in die Gegenwart. Entsprechend hat BRADEAN-EBINGER kürzlich die "allgemeine Definition" so formuliert: "Zwei- und Mehrsprachigkeit ist die muttersprachähnliche Beherrschung, der aktive und passive Gebrauch von zwei oder mehreren Sprache [sic!], die Fähigkeit, diese Sprachen je nach Sprechsituation und -partner zu wechseln" (1997: 42). Am anderen Endpol liegen Minimaldefinitionen, wie etwa die von HAUGEN (1953: 7), "Die Zweisprachigkeit beginnt dort, wo der Sprecher einer Sprache komplette, inhalttragende Äußerungen in der anderen Sprache erzeugen kann." Für Anliegen und Charakter meines im weiteren vorzustellenden Projekts dürfte sich wohl die funktionale Herangehensweise von OKSAAR (1992: 24) am ehesten eignen, derzufolge Mehrsprachigkeit die Fähigkeit einer Person ist, zwei oder mehr Sprachen als Kommunikationsmittel zu verwenden und von einer Sprache in die andere hinüberzuwechseln, wenn die Situation es erfordert.
Der traditionsreiche Kultur-, Kontakt- und Integrationsraum Schlesien stellt eine Region im Überlappungs- und Durchdringungsbereich von Kulturen, Religionen, Sprachen und Nationen dar, wo sich im historischen Verlauf eine spezielle Sensibilität für Probleme und Chancen kultureller und sprachlicher Pluralität sowie für die Geschichtlichkeit und Dynamik multikultureller Zusammenhänge entwickeln konnte. Daher verkörpert er ein besonders wertvolles Erinnerungsgut (vgl. zur Thematik Engel/Honsza 2001 und Lasatowicz 2004). Solche Regionen werden nun mit Blick auf ihre Ressourcen des multikulturellen Gedächtnisses im Zuge von gesamteuropäischen Prozessen – auch im Sinne einer neuen „mentalen Welt“ – zunehmend aufgewertet. Die kulturelle und sprachliche Situation, einschließlich der Sprach gebrauchsstrukturen, ist in derartigen multi-ethnischen Arealen im Spannungsfeld von mehreren Sprachen, Kulturen und Identitäten naturgemäß äußerst vielschichtig. Entsprechend dieser komplexen sprachkommunikativen Realität in Mehrsprachigkeits-Kulturen setzt ihre wissenschaftlich adäquate Erfassung, Beschreibung und Explizierung ein mehrperspektivisches multi-, inter- und transdisziplinäres Herangehen voraus. Denn die Bearbeitung der entsprechend weiten Fragestellungen erfordert einen relevanten Betrachtungsrahmen und eine angepasste Methodologie, die sowohl dem komplexen Gegenstand als auch den Erkenntnisinteressen der Praxis gerecht werden. Müssen doch die Linguisten mit der mannigfaltigen sprachkommunikativen Realität mindestens (a) systemorientiert, (b) soziologisch und (c) „technologisch“ umgehen und sie entsprechend reflektieren können. Da aber die Gesamtthematik – wie sie auch im Titel der Tagung zum Ausdruck kommt – einen etwas sperrigen Gegenstand bildet, konzentriert sich der vorliegende Beitrag lediglich auf einen besonders wichtigen Aspekt. Mithin lautet die erkenntnisleitende Forschungsfrage: Wie kann man inter- bzw. transkulturelle,4 bi- bzw. multilinguale Kommunikationsräume im Kontakt der Kulturen mit den für sie charakteristischen zweisprachigen Diskursmodi (die oft durch verschiedene Ausprägungen von Hybridität gekennzeichnet sind) in disziplinärer Hinsicht sinnvoll analysieren? Also in welchem generellen Verstehensrahmen bzw. unter welchem "Blickwinkel", im Kompetenzbereich welcher linguistischen Teildisziplin, mit welcher Methodologie lassen sich die im Blickpunkt stehenden sprachkommunikativen Konstellationen, bilingualen Sprechhandlungen und entsprechenden Kontakt-, Interaktions-, Überblendungs- und Konvergenzphänomene sachangemessen untersuchen und heuristisch interpretieren? Solche Fragen erlangen m.E. angesichts der aktuellen Fachentwicklung der Sprachwissenschaft zunehmend Relevanz. War doch im Rahmen der kartesischen Sicht noch eine Einheit von Rationalität und Wissenschaft gegeben, ist spätestens seit Thomas Kuhn (1996) klar geworden, dass man es heute mit einem Nach- und Nebeneinander verschiedener (z.T. sogar inkommensurabler) „Paradigmen“ (Kuhn 1996), „Denkstile“ (vgl. Fleck 2002), „disziplinärer Matrizes“ (Kuhn 1977, 392 f.) oder Wissenschaftskulturen als diskursive Terrains zu tun hat.
We adopt Markert and Nissim (2005)’s approach of using the World Wide Web to resolve cases of coreferent bridging for German and discuss the strength and weaknesses of this approach. As the general approach of using surface patterns to get information on ontological relations between lexical items has only been tried on English, it is also interesting to see whether the approach works for German as well as it does for English and what differences between these languages need to be accounted for. We also present a novel approach for combining several patterns that yields an ensemble that outperforms the best-performing single patterns in terms of both precision and recall.
Tagging kausaler Relationen
(2005)
In dieser Diplomarbeit geht es um kausale Beziehungen zwischen Ereignissen und Erklärungsbeziehungen zwischen Ereignissen, bei denen kausale Relationen eine wichtige Rolle spielen. Nachdem zeitliche Relationen einerseits ihrer einfacheren Formalisierbarkeit und andererseits ihrer gut sichtbaren Rolle in der Grammatik (Tempus und Aspekt, zeitliche Konjunktionen) wegen in jüngerer Zeit stärker im Mittelpunkt des Interesses standen, soll hier argumentiert werden, dass kausale Beziehungen und die Erklärungen, die sie ermöglichen, eine wichtigere Rolle im Kohärenzgefüge des Textes spielen. Im Gegensatz zu “tiefen” Verfahren, die auf einer detaillierten semantischen Repr¨asentation des Textes aufsetzen und infolgedessen für unrestringierten Text m. E. nicht geeignet sind, wird hier untersucht, wie man dieses Ziel erreichen kann, ohne sich auf eine aufwändig konstruierte Wissensbasis verlassen zu müssen.
When a statistical parser is trained on one treebank, one usually tests it on another portion of the same treebank, partly due to the fact that a comparable annotation format is needed for testing. But the user of a parser may not be interested in parsing sentences from the same newspaper all over, or even wants syntactic annotations for a slightly different text type. Gildea (2001) for instance found that a parser trained on the WSJ portion of the Penn Treebank performs less well on the Brown corpus (the subset that is available in the PTB bracketing format) than a parser that has been trained only on the Brown corpus, although the latter one has only half as many sentences as the former. Additionally, a parser trained on both the WSJ and Brown corpora performs less well on the Brown corpus than on the WSJ one. This leads us to the following questions that we would like to address in this paper: - Is there a difference in usefulness of techniques that are used to improve parser performance between the same-corpus and the different-corpus case? - Are different types of parsers (rule-based and statistical) equally sensitive to corpus variation? To achieve this, we compared the quality of the parses of a hand-crafted constraint-based parser and a statistical PCFG-based parser that was trained on a treebank of German newspaper text.
In the past, a divide could be seen between ’deep’ parsers on the one hand, which construct a semantic representation out of their input, but usually have significant coverage problems, and more robust parsers on the other hand, which are usually based on a (statistical) model derived from a treebank and have larger coverage, but leave the problem of semantic interpretation to the user. More recently, approaches have emerged that combine the robustness of datadriven (statistical) models with more detailed linguistic interpretation such that the output could be used for deeper semantic analysis. Cahill et al. (2002) use a PCFG-based parsing model in combination with a set of principles and heuristics to derive functional (f-)structures of Lexical-Functional Grammar (LFG). They show that the derived functional structures have a better quality than those generated by a parser based on a state-of-the-art hand-crafted LFG grammar. Advocates of Dependency Grammar usually point out that dependencies already are a semantically meaningful representation (cf. Menzel, 2003). However, parsers based on dependency grammar normally create underspecified representations with respect to certain phenomena such as coordination, apposition and control structures. In these areas they are too "shallow" to be directly used for semantic interpretation. In this paper, we adopt a similar approach to Cahill et al. (2002) using a dependency-based analysis to derive functional structure, and demonstrate the feasibility of this approach using German data. A major focus of our discussion is on the treatment of coordination and other potentially underspecified structures of the dependency data input. F-structure is one of the two core levels of syntactic representation in LFG (Bresnan, 2001). Independently of surface order, it encodes abstract syntactic functions that constitute predicate argument structure and other dependency relations such as subject, predicate, adjunct, but also further semantic information such as the semantic type of an adjunct (e.g. directional). Normally f-structure is captured as a recursive attribute value matrix, which is isomorphic to a directed graph representation. Figure 5 depicts an example target f-structure. As mentioned earlier, these deeper-level dependency relations can be used to construct logical forms as in the approaches of van Genabith and Crouch (1996), who construct underspecified discourse representations (UDRSs), and Spreyer and Frank (2005), who have robust minimal recursion semantics (RMRS) as their target representation. We therefore think that f-structures are a suitable target representation for automatic syntactic analysis in a larger pipeline of mapping text to interpretation. In this paper, we report on the conversion from dependency structures to fstructure. Firstly, we evaluate the f-structure conversion in isolation, starting from hand-corrected dependencies based on the TüBa-D/Z treebank and Versley (2005)´s conversion. Secondly, we start from tokenized text to evaluate the combined process of automatic parsing (using Foth and Menzel (2006)´s parser) and f-structure conversion. As a test set, we randomly selected 100 sentences from TüBa-D/Z which we annotated using a scheme very close to that of the TiGer Dependency Bank (Forst et al., 2004). In the next section, we sketch dependency analysis, the underlying theory of our input representations, and introduce four different representations of coordination. We also describe Weighted Constraint Dependency Grammar (WCDG), the dependency parsing formalism that we use in our experiments. Section 3 characterises the conversion of dependencies to f-structures. Our evaluation is presented in section 4, and finally, section 5 summarises our results and gives an overview of problems remaining to be solved.
This paper is concerned with the tagging of spatial expressions in German newspaper articles, assigning a meaning to the expression and classifying the usages of the spatial expression and linking the derived referent to an event description. In our system, we implemented the activation of concepts in a very simple fashion, a concept is activated once (with a cost depending on the item that activated it) and is left activated thereafter. As an example, a city also activates the nodes for the region and the country it is part of, so that cities from one country are chosen over cities from different countries. A test corpus of 12 German newspaper articles was tested regarding several disambiguation strategies. Disambiguation was carried out via a beam search to find an approximately cost-optimal solution for the conflict set of potential grounding candidates for the tagged spatial expression. Test showed that the disambiguation strategies improved accuracy significantly.
Using a qualitative analysis of disagreements from a referentially annotated newspaper corpus, we show that, in coreference annotation, vague referents are prone to greater disagreement. We show how potentially problematic cases can be dealt with in a way that is practical even for larger-scale annotation, considering a real-world example from newspaper text.
We investigate methods to improve the recall in coreference resolution by also trying to resolve those definite descriptions where no earlier mention of the referent shares the same lexical head (coreferent bridging). The problem, which is notably harder than identifying coreference relations among mentions which have the same lexical head, has been tackled with several rather different approaches, and we attempt to provide a meaningful classification along with a quantitative comparison. Based on the different merits of the methods, we discuss possibilities to improve them and show how they can be effectively combined.
In this paper, we investigate the usefulness of a wide range of features for their usefulness in the resolution of nominal coreference, both as hard constraints (i.e. completely removing elements from the list of possible candidates) as well as soft constraints (where a cumulation of violations of soft constraints will make it less likely that a candidate is chosen as the antecedent). We present a state of the art system based on such constraints and weights estimated with a maximum entropy model, using lexical information to resolve cases of coreferent bridging.
Im Fokus dieser Magisterarbeit stehen Präpositionalphrasen (PP), deren Komplement eine unikale Komponente ist. Es handelt sich bei diesen Komplementen um Nomen, die außerhalb einer PP nicht vorkommen bzw. in anderen Umgebungen nicht die selbe Bedeutung haben. Um dieses Phänomen zu beschreiben wird eine Analyse innerhalb der Head-Driven Phrase Structure Grammar (HPSG) entwickelt. Grundkenntnisse über Struktur und Begrifflichkeiten der HPSG werden in dieser Arbeit vorausgesetzt, als Referenz siehe [PS94]. Die Gliederung gestaltet sich wie folgt: Zunächst werden die zu untersuchenden Daten im Detail dargestellt. Anschließend werden verschiedene Analysemöglichkeiten innerhalb der Theorie der HPSG in Betracht gezogen, nämlich Selektion, Konstruktion und Kollokation. Dabei muss festgestellt werden, dass die existierenden Ansätze den Daten nicht oder nur unbefriedigend gerecht werden können. Der Ansatz, der letztendlich verfolgt wird, besteht darin, den bereits existierenden Selektionsmechanismus über SPEC zu generalisieren. Dieses Vorgehen erlaubt dann der unikalen NP, die Präposition, mit welcher sie einhergeht, zu selegieren. Hierzu werden einige, jedoch vertretbare Änderungen in der HPSG-Architektur vorgenommen und es wird gezeigt, wie mit dem generalisierten Mechanismus die Daten behandelt werden können. Daran anschließend folgt eine Erweiterung des Phänomenbereichs auf Paarformeln. Ferner wird ein Einwand im Zusammenhang mit der Analyse des Komplements als NP bzw. DP diskutiert und zur weiteren Motivation des Ansatzes wird noch ein weiteres lokales Phänomen,die Distribution der Spur, mit der hier vorgestellten Herangehensweise modelliert. Darüberhinaus wird die Frage untersucht, ob man nicht auch PPs mit festen Verben geschickt analysieren kann. Dazu wird ein Weg, Lexeme zu selegieren, eingeführt und der entwickelte Mechanismus erweitert. Diese Erweiterung findet Anwendung bei der Modellierung der lokalen Distribution einer Partikel. Eine Zusammenfassung, sowie ein Ausblick auf weiterführende Fragestellungen schließen die Arbeit ab.
Freeze (1992) argued on the basis of data from several different languages that there is a close relationship between existential sentences (stating the existence of an entity) and locative sentences (stating the location of an entity). Freeze (1992) proposes that they are both derived from the same base structure and that the surface differences are rather due to the distinct information structures.This paper argues against this position with the data from Serbian existentials, which show clear syntactic differences from the locatives. Thus, the close relationship between existential and locative sentences that Freeze (1992) observes is conceptual, but not (necessarily) part of the syntax of the language. In order to account for the data, we propose that existential sentences originate from a different syntactic predication structure than the locative ones. The existential meaning arises, as we will show, from the interaction of this predication structure with the structure and meaning of the noun phrase.
In this paper I will discuss the formation of different types of yes/no questions in Serbian (examples in (1)), focusing on the syntactically and semantically puzzling example (1d), which involves the negative auxiliary inversion. Although there is a negative marker on the fronted auxiliary, the construction does not involve sentential negation. This coincides with the fact that the negative quantifying NPIs cannot be licensed. The question formation and sentential negation have similar syntactic effects cross-linguistically. This has led to various attempts to formulate a unifying syntactic account of the phenomena (ever since Klima 1964). One striking fact about the two syntactic contexts is that both license weak NPIs (Negative Polarity Items). It has been suggested (cf. Laka 1990, Culicover 1991) that the derivation of both interrogatives and negatives involves the same type of functional projection PolP (polarity phrase). One such account of the formation of negative interrogatives in Serbo- Croatian is offered by Progovac (2005). She proposes that there are two PolPs optionally cooccurring in the same clause, in which both positive and negative polarity items check their positive or negative features (following Haegeman and Zanuttini (1991) feature-checking account of negative structures, and the insights of Brown(1999) on the negation in Russian). On her account, the negative auxiliary question in (1d), is the case when both polarity phrases are present. The higher has [-pos +neg] features, and the lower one (below TP) is [-pos -neg]. Although her account correctly predicts the ungrammaticality of (2a) in contrast with (1c), it wrongly predicts the (2b) to be grammatical. I will argue that Progovac’s theory regarding the nature of the PolP is wrong. It employs both the binary feature valuation on the polarity head and the hierarchical ordering of the two polarity phrases, which eventually leads to overgeneration. On the account presented here the nature of the question marker (li vs zar) is highly relevant. Notice that (1b) and (1d) express presuppositions regarding the truth value of the propositions. In this way they contrast with (1a) and (1c). In addition, the type (1b) (with the question particle zar) can introduce both the positive and negative presupposition as shown in (3), which, semantically, makes this construction compatible with negative auxiliary questions in English (4a). The polarity items licensed in the relevant structures are also of the same type in both languages. The fronted-negative-auxiliary questions (1d) in Serbian are only possible with the particle li. In this case the presupposition is exclusively positive. The peculiar question/focus marking function of li (in Bulgarian and Russian) is well known. However, it is always assumed that its focus marking role is not relevant for the formation of yes/no questions. This I believe is not correct. The syntactic explanation of the interpretational facts points to the following: A) The possibility of the separate lexical encoding (particle zar) of the ‘rhetorical’ yes/no questions in Serbian allows the embedding of both positive and negated sentences, in which case the (weak) NPIs can remain in local relation with the negated verb. B) Recall that Serbian is an NC language, which requires local/c-command relation between the verbal negative marker and the NPI. With the negative inverted auxiliary questions this condition is not met, and the licensing of an n-word is not possible. C) The impossibility of licensing a weak NPI (i-words in the examples below) is due to the nature of the question marker li. (1) a. Da li je Vera videla ikoga / nekoga / *nikoga? DA Q aux Vera see.part.F.Sg anyone someone noone “Did Vera see anyone/someone/noone?” b. Zar je Vera videla ikoga / nekoga / *nikoga? ZAR aux Vera see.part.F.Sg anyone someone noone “Is it really the fact that Vera saw anyone/someone?” c. Je li Vera videla ikoga / nekoga /*nikoga? aux Q Vera see.part.F.Sg anyone someone noone “Did Vera see anyone/someone/noone?” d. Nije li Vera videla *ikoga / nekoga / *nikoga? neg+aux Q Vera see.part.F.Sg anyone someone noone “Didn’t Vera see someone?”/ “Vera saw someone, didn’t she?” (2) a. *Nije li Vera videla nikoga? neg+aux Q Vera see.part.F.Sg noone b. *Nije li Vera videla ikoga? neg+aux Q Vera see.part.F.Sg anyone (3) a. Zar je Vera videla nekoga / ikoga? ZAR aux Vera see.part.F.Sg someone/anyone b. Zar Vera nije videla nekoga/nikoga? ZAR Vera neg+aux see.part.F.Sg someone/anyone (4) a. Didn’t Vera (NOT) see someone/anyone? b. Vera saw someone, didn’t she?
The renowned Grimm Dictionary (1854-1961) makes the statement that the German copula sein (to be) is “the most general and colourless of all verbal concepts” (der allgemeinste und farbloseste aller verbalbegriffe). A more concise summary of the linguistic issues surrounding the copula is hardly possible. These two properties (and the latent tension between them!) make copulas a particularly interesting and vexing subject of linguistic research. Copulas appear to be almost colourless, i.e., devoid of any concrete meaning, thus leading to the question of why such expressions exist at all, not only in German but in the majority of the world’s languages. And at the same time copulas presumably provide the best window into the core of verbal concepts thereby telling us what it actually means to be a verb – at least in a language like German or English. While there is a rather rich body of research on copulas in philosophical and formal semantics including several in-depth studies on the copular systems of individual languages, copulas have received comparably little attention from a typological perspective. The monograph of Regina Pustet sets out to fill this gap. She presents an extensive cross-linguistic study of copula usage based on a sample of 154 languages drawn from the language families of the world. The analysis is embedded in the theoretical framework of functional typology. The study aims at uncovering universal principles that govern the distribution of copulas in nominal, adjectival, and verbal predications. Its major objective is the development of a “semantically-based model of copula distribution” (p.62) by means of which the presence vs. absence of copulas can be motivated through the inherent meaning of the lexical items they potentially combine with. Drawing mainly on the work by Givón (1979, 1984) and Croft (1991, 2001), who provide a functional foundation of the traditional parts of speech, Pustet identifies four semantic parameters which, if taken together, are claimed to support substantial generalisations on copula distribution – within a given language as well as crosslinguistically. These parameters are DYNAMICITY, TRANSIENCE, TRANSITIVITY, and DEPENDENCY. Pustet goes on to argue – and this is in fact the driving force behind the overall monograph – that the distributional behaviour of copulas, in turn, yields a useful methodology for developing a general approach to lexical categorization. Thus, in the long run Pustet aims at contributing to a better understanding of the traditional parts of speech, noun, adjective, and verb by defining them in terms of “semantic feature bundles, which can be arranged in [a] coherent semantic similarity space” (p.193).
Since Donald Davidson’s seminal work “The Logical Form of Action Sentences” (1967) event arguments have become an integral component of virtually every semantic theory. Over the past years Davidson´s proposal has been continuously extended such that nowadays event(uality) arguments are generally associated not only with action verbs but with predicates of all sorts. The reasons for such an extension are seldom explicitly justified. Most problematical in this respect is the case of stative expressions. By taking a closer look at copula sentences the present study assesses the legitimacy of stretching the Davidsonian notion of events and discusses its consequences. A careful application of some standard eventuality diagnostics (perception reports, combination with locative modifiers and manner adverbials) as well as some new diagnostics (behavior of certain degree adverbials) reveals that copular expressions do not behave as expected under a Davidsonian perspective: they fail all eventuality tests, regardless of whether they represent stage-level or individual-level predicates. In this respect, copular expressions pattern with stative verbs like know, hate, and resemble, which in turn differ sharply from state verbs like stand, sit, and sleep. The latter pass all of the eventuality tests and therefore qualify as true “Davidsonian state” expressions. On the basis of these empirical observations and taking up ideas of Kim (1969, 1976) and Asher (1993, 2000), an alternative account of copular expressions (and stative verbs) is provided, according to which the copula introduces a referential argument for a temporally bound property exemplification (= “Kimian state”). Considerations on some logical properties, viz. closure conditions and the latent infinite regress of eventualities, suggest that supplementing Davidsonian eventualities with Kimian states may yield not only a more adequate analysis of copula sentences but also a better understanding of eventualities in general.
Davidsonian event semantics has an impressive track record as a framework for natural language analysis. In recent years it has become popular to assume that not only action verbs but predicates of all sorts have an additional event argument. Yet, this hypothesis is not without controversy in particular wrt the particularly challenging case of statives. Maienborn (2003a, 2004) argues that there is a need for distinguishing two kinds of states. While verbs such as sit, stand, sleep refer to eventualities in the sense of Davidson (= Davidsonian states), the states denoted by such stative verbs like know, weigh,and own, as well as any combination of copula plus predicate are of a different ontological type (= Kimian states). Against this background, the present study assesses the two main arguments that have been raised in favour of a Davidsonian approach for statives. These are the combination with certain manner adverbials and Parsons (2000) so-called time travel argument. It will be argued that the manner data which, at first sight, seem to provide evidence for a Davidsonian approach to statives are better analysed as non-compositional reinterpretations triggered by the lack of a regular Davidsonian event argument. As for Parsons´s time travel argument, it turns out that the original version does not supply the kind of support for the Davidsonian approach that Parsons supposed. However, properly adapted, the time travel argument may provide additional evidence for the need of reifying the denotatum of statives, as suggested by the assumption of Kimian states.
One aspect of the progress being made is that the focus of attention has widened. Adverbials, though still the heart of the matter, now form part of a much larger set of constituent types subsumed under the general syntactic label of adjunct; while modifier has become the semantic counterpart on the same level of generality. So one of the readings of Modifying Adjuncts stands for the focus on this intersection. Moreover, recent years have seen a number of studies which attest an increasing interest in adjunct issues. There is an impressive number of monographs, e.g. Alexiadou (1997), Laenzlinger (1998), Cinque (1999), Pittner (1999), Ernst (2002), which, by presenting in-depth analyses of the syntax of adjuncts, have sharpened the debate on syntactic theorizing. Serious attempts to gain a broader view on adjuncts are witnessed by several collections, see Alexiadou and Svenonius (2000), Austin, Engelberg and Rauh (in progress); of particular importance are the contributions to vol. 12.1 of the Italian Journal of Linguistics (2000), a special issue on adverbs, the Introductions to which by Corver and Delfitto (2000) and Delfitto (2000) may be seen as the best state-of-the-art article on adverbs and adverbial modification currently on the market. To try and test a fresh view on adjuncts was the leitmotif of the Oslo Conference “Approaching the Grammar of Adjuncts” (Sept 22–25, 1999), which provided the initial forum for the papers contained in this volume and initiated a period of discussion and continuing interaction among the contributors, from which the versions published here have greatly profited. The aim of the Oslo conference, and hence the focus of the present volume, was to encourage syntacticians and semanticists to open their minds to a more integrative approach to adjuncts, thereby paying attention to, and attempting to account for, the various interfaces that the grammar of adjuncts crucially embodies. From this perspective, the present volume is to be conceived of as an interim balance of current trends in modifying the views on adjuncts. In introducing the papers, we will refrain from rephrasing the abstracts, but will instead offer a guided tour through the major problem areas they are tackling. Assessed by thematic convergence and mutual reference, the contributions form four groups, which led us to arrange them into subparts of the book. Our commenting on these is intended (i) to provide a first glance at the contents, (ii) to reveal some of the reasons why adjuncts indeed are, and certainly will remain, a challenging issue, and thereby (iii) to show some facets of what we consider novel and promising approaches.
“Comments are very welcome!” This basic attitude and the many ways of implementing it contribute immensely to the fascination of engaging in scientific research. I am grateful to Theoretical Linguistics for providing a public platform for this kind of scholarly exchange and I thank all commentators for their thoughtful, stimulating, and often challenging contributions to my target article. My response will address two main issues that are raised by the commentaries. The first issue is shaped by a cluster of questions relating to ontology. The second issue concerns questions of methodology pertaining in particular to the problem of judging data.
The article offers evidence that there are two variants of adverbial modification that differ with respect to the way in which a modifier is linked to the verbs eventuality argument. So-called event-external modifiers relate to the full eventuality, whereas event-internal modifiers relate to some integral part of it. The choice between external and internal modification is shown to be dependent on the modifiers syntactic base position. Event-external modifiers are base-generated at the VP periphery, whereas event-internal modifiers are base-generated at the V periphery. These observations are accounted for by a refined version of the standard Davidsonian approach to adverbial modification according to which modification is mediated by a free variable. In the case of external modification, the grammar takes responsibility for identifying the free variable with the verbs eventuality argument, whereas in the case of internal modification, a value for the free variable is determined by the conceptual system on the basis of contextually salient world knowledge. For the intriguing problem that certain locative modifiers occasionally seem to have nonlocative (instrumental, positional, or manner) readings, the advocated approach can provide a rather simple solution.
Das Zustandspassiv : grammatische Einordnung – Bildungsbeschränkungen – Interpretationsspielraum
(2005)
Semantic research over the past three decades has provided impressive confirmation of Donald Davidsons famous claim that “there is a lot of language we can make systematic sense of if we suppose events exist” (Davidson 1980:137). Nowadays, Davidsonian event arguments are no longer reserved only for action verbs (as Davidson originally proposed) or even only for the category of verbs, but instead are widely assumed to be associated with any kind of predicate (e.g. Higginbotham 2000, Parsons 2000).1 The following quotation from Higginbotham and Ramchand (1997) illustrates the reasoning that motivates this move: "Once we assume that predicates (or their verbal, etc. heads) have a position for events, taking the many consequences that stem therefrom, as outlined in publications originating with Donald Davidson (1967), and further applied in Higginbotham (1985, 1989), and Terence Parsons (1990), we are not in a position to deny an event-position to any predicate; for the evidence for, and applications of, the assumption are the same for all predicates. (Higginbotham and Ramchand 1997:54)" In fact, since Davidson’s original proposal the burden of proof for postulating event arguments seems to have shifted completely, leading Raposo and Uriagereka (1995), for example, to the following verdict: "it is unclear what it means for a predicate not to have a Davidsonian argument (Raposo and Uriagereka 1995:182)" That is, Davidsonian eventuality arguments apparently have become something like a trademark for predicates in general. The goal of the present paper is to subject this view of the relationship between predicates and events to real scrutiny. By taking a closer look at the simplest independent predicational structure – viz. copula sentences – I will argue that current Davidsonian approaches tend to stretch the notion of events too far, thereby giving up much of its linguistic and ontological usefulness. More specifically, the paper will tackle the following three questions: 1. Do copula sentences support the current view of the inherent event-relatedness of predicates? 2. If not, what is a possible alternative to an event-based analysis of copula sentences? 3. What does this tell us about Davidsonian events? The paper is organized as follows: Section 2 first reviews current event-based analyses of copula sentences and then gives a brief summary of the Davidsonian notion of events. Section 3 examines the behavior of copula sentences with respect to some standard (as well as some new) eventuality diagnostics. Copula expressions will turn out to fail all eventuality tests. They differ sharply from state verbs like stand, sit, sleep in this respect. (The latter pass all eventuality tests and therefore qualify as true “Davidsonian state” expressions.) On the basis of these observations, section 4 provides an alternative account of copula sentences that combines Kim’s (1969, 1976) notion of property exemplifications with Ashers (1993, 2000) conception of abstract objects. Specifically, I will argue that the copula introduces a referential argument for a temporally bound property exemplification (= “Kimian state”). The proposal is implemented within a DRT framework. Finally, section 5 offers some concluding remarks and suggests that supplementing Davidsonian eventualities by Kimian states not only yields a more adequate analysis for copula expressions and the like but may also improve our treatment of events.
A pragmatic explanation of the stage level/individual level contrast in combination with locatives
(2004)
One important difference between stage level predicates (SLPs) and individual level predicates (ILPs) is their behavior with respect to locative modifiers. It is commonly assumed that SLPs but not ILPs combine with locatives. The present study argues against a semantic account for this behavior (as advanced by e.g. Kratzer 1995, Chierchia 1995) and proposes a genuinely pragmatic explanation of the observed stage level/individual level contrast instead. The proposal is spelled out using Blutners (1998, 2000) optimality theoretic version of the Gricean maxims. Building on the observation that the respective locatives are not event-related but frame-setting modifiers, the preference for main predicates that express temporary properties is explained as a side-effect of “synchronizing” the main predicate with the locative frame in the course of finding an optimal interpretation. By emphasizing the division of labor between grammar and pragmatics, the proposed solution takes a considerable load off of semantics.
The study offers a discourse-based account of the Spanish copula forms ser and estar, which are generally considered to be lexical exponents of the stage-level/individual-level contrast. It argues against the popular view that the distinction between SLPs and ILPs rests on a fundamental cognitive division of the world that is reflected in the grammar. As it happens, conceptual oppositions like “temporary vs. permanent” or “arbitrary vs. essential“ provide only a preference for the interpretation of estar and ser. In addition, the evidence for an SLP/ILP impact on the grammar turns out to be far less conclusive than is currently assumed. The study argues against event-based accounts of the ser/estar contrast in particular, showing that ser and estar pattern alike in failing all of the standard eventuality tests. The discourse-based account proposed instead assumes that ser and estar both display the same lexical semantics (which is identical to the semantics of English be, German sein, etc.); estar differs from ser only in presupposing a relation to a specific discourse situation. By using estar a speaker restricts his or her claim to a specific discourse situation, whereas by using ser, the speaker makes no such restriction. The preference for interpreting estar predications as denoting temporary properties and ser predications as denoting permanent properties follows from economy principles driving the pragmatic legitimation of estars discourse dependence. The analysis proposed in this paper can also account for the observation that ser predications do not give rise to thetic judgements. The proposal is couched in terms of the framework of DRT.
In recent years, research in parsing has extended in several new directions. One of these directions is concerned with parsing languages other than English. Treebanks have become available for many European languages, but also for Arabic, Chinese, or Japanese. However, it was shown that parsing results on these treebanks depend on the types of treebank annotations used. Another direction in parsing research is the development of dependency parsers. Dependency parsing profits from the non-hierarchical nature of dependency relations, thus lexical information can be included in the parsing process in a much more natural way. Especially machine learning based approaches are very successful (cf. e.g.). The results achieved by these dependency parsers are very competitive although comparisons are difficult because of the differences in annotation. For English, the Penn Treebank has been converted to dependencies. For this version, Nivre et al. report an accuracy rate of 86.3%, as compared to an F-score of 92.1 for Charniaks parser. The Penn Chinese Treebank is also available in a constituent and a dependency representations. The best results reported for parsing experiments with this treebank give an F-score of 81.8 for the constituent version and 79.8% accuracy for the dependency version. The general trend in comparisons between constituent and dependency parsers is that the dependency parser performs slightly worse than the constituent parser. The only exception occurs for German, where F-scores for constituent plus grammatical function parses range between 51.4 and 75.3, depending on the treebank, NEGRA or TüBa-D/Z. The dependency parser based on a converted version of Tüba-D/Z, in contrast, reached an accuracy of 83.4%, i.e. 12 percent points better than the best constituent analysis including grammatical functions.
This paper profiles significant differences in syntactic distribution and differences in word class frequencies for two treebanks of spoken and written German: the TüBa-D/S, a treebank of transliterated spontaneous dialogues, and the TüBa-D/Z treebank of newspaper articles published in the German daily newspaper die tageszeitung´(taz). The approach can be used more generally as a means of distinguishing and classifying language corpora of different genres.
This paper profiles significant differences in syntactic distribution and differences in word class frequencies for two treebanks of spoken and written German: the TüBa-D/S, a treebank of transliterated spontaneous dialogs, and the TüBa-D/Z treebank of newspaper articles published in the German daily newspaper ´die tageszeitung´(taz). The approach can be used more generally as a means of distinguishing and classifying language corpora of different genres.