Linguistik
Refine
Year of publication
- 2001 (136) (remove)
Document Type
- Part of a Book (66)
- Article (25)
- Conference Proceeding (12)
- Working Paper (9)
- Preprint (8)
- Book (6)
- Review (6)
- Report (2)
- Diploma Thesis (1)
- Periodical (1)
Language
- English (102)
- German (29)
- Portuguese (4)
- Polish (1)
Is part of the Bibliography
- no (136)
Keywords
- Syntax (32)
- Semantik (20)
- Prädikat (18)
- Deutsch (15)
- Englisch (13)
- Informationsstruktur (10)
- Satzakzent (8)
- Lexikologie (6)
- Russisch (6)
- Chinesisch (5)
Institute
The two papers included in this volume have developed from work with the CHILDES tools and the Media Editor in the two research projects, "Second language acquisition of German by Russian learners", sponsored by the Max Planck Institute for Psycholinguistics, Nijmegen, from 1998 to 1999 (directed by Ursula Stephany, University of Cologne, and Wolfgang Klein, Max Planck Institute for Psycholinguistics, Nijmegen) and "The age factor in the acquisition of German as a second language", sponsored by the German Science Foundation (DFG), Bonn, since 2000 (directed by Ursula Stephany, University of Cologne, and Christine Dimroth, Max Planck Institute for Psycholinguistics, Nijmegen). The CHILDES Project has been developed and is being continuously improved at Carnegie Mellon University, Pittsburgh, under the supervision of Brian MacWhinney. Having used the CHILDES tools for more than ten years for transcribing and analyzing Greek child data there it was no question that I would also use them for research into the acquisition of German as a second language and analyze the big amount of spontaneous speech gathered from two Russian girls with the help of the CLAN programs. When in the spring of 1997, Steven Gillis from the University of Antwerp (in collaboration with Gert Durieux) developed a lexicon-based automatic coding system based on the CLAN program MOR and suitable for coding languages with richer morphologies than English, such as Modern Greek. Coding huge amounts of data then became much quicker and more comfortable so that I decided to adopt this system for German as well. The paper "Working with the CHILDES Tools" is based on two earlier manuscripts which have grown out of my research on Greek child language and the many CHILDES workshops taught in Germany, Greece, Portugal, and Brazil over the years. Its contents have now been adapted to the requirements of research into the acquisition of German as a second language and for use on Windows.
It has become commonplace to introduce works on aspect with the remark that there is hardly another field in linguistics so much plagued by terminological and notional confusion. [..] About 20 major books claiming a comprehensive treatment have come to my attention during little more than the past half decade […]. Among these books are five that form the subject of this paper in a narrower sense, given that the present article originally started out as a combined review of these five works: […] Even if one is not at all keen on monocultures, it is clear that the obvious disunity in fundamental points of view makes the situation increasingly difficult for the "ordinary working linguist". It is getting impossible to keep up with the many different issues raised in the theoretical literature when, for instance, writing a chapter on aspect for a descriptive grammar of a language. As a result, a tremendous gap between descriptive and theoretical work has arisen. This has not gone unnoticed in the literature. There are several recent publications in which explicit attempts are made to bridge this gap […], all of them trying to add a typological perspective to aspect theory and to free it from its purely truth-conditional embedding, which was the dominant paradigm in the 70ies and 80ies. But again, these works are often themselves cast into specific theoretical frameworks, more often than not ignoring other approaches to the field if they do not fit their persuasions. I will therefore avail myself of the opportunity of this review article by briefly sorting out the differences in the fundamental assumptions and theoretical primitives of the various approaches, in order to come to grips with the aspectological landscape. A general, chiefly historically oriented assessment is presented in the first part of this paper (see section 1). The second part is then devoted to a detailed discussion of the books under review against the background etablished in this survey (see section 2). At the end, I will try to draw some conclusions and hint at some directions for future work with aspect in a descriptive and/or typological context (see section 3).
Ziel dieser Arbeit ist die Darstellung des Phänomens "Agrammatismus" für die deutsche Sprache. Den Kernbereich der Studie bildet die Analyse eines Fallbeispiels. Wegen der variablen Erscheinungsformen des Agrammatismus (z.B. Saffran 1982, Miceli et al. 1989, Nespoulous & Dordain 1991, Fromkin 1995) werden Gruppenstudien in der jüngeren Forschung weitgehend abgelehnt (z.B. Seewald 1998: 62, Tyler 1987: 161). Mit der Analyse eines Einzelfalls soll der daraus resultierenden Forderung nach weiteren Einzelfallstudien entsprochen werden (Tesak 1990: 18, Tesak 1991: 177). In der vorliegenden Arbeit sollen besonders sprachspezifische Fehlermuster herausgearbeitet werden, wie sie in sprachvergleichenden Studien nachgewiesen werden konnten (z.B. Kehayia 1991, Lorch 1986, Menn & Obler 1990). Diese zeigen sich nach Menn & Obler (1990: 1370ff.) hauptsächlich in der Verteilung von Auslassungen und Substitutionen auf freie und gebundene Morpheme (siehe Kap. 1.2.1., S. 5). Die deutsche Sprache verfügt über die Möglichkeit, grammatische Funktionen bzw. grammatische Relationen sowohl durch freie als auch durch gebundene Morpheme zu realisieren (Comrie 1987: 111-137). Deshalb ist sie besonders geeignet, die beobachteten Abhängigkeiten zwischen Fehlermustern und Grammatik zu überprüfen. Als theoretische Grundlage für die Analyse der agrammatischen Sprache werden in Kap. I nach einer einführenden Begriffsdefinition (Kap. 1.1.) die Symptome des Agrammatismus im einzelnen dargestellt (Kap. 1.2.). Dabei stehen sowohl die bis heute dokumentierten Leistungsdissoziationen als auch sprachspezifische Fehlermuster zur Diskussion. Anschließend werden die aus der Variabilität der agrammatischen Erscheinungsformen resultierenden unterschiedlichen Erklärungsansätze zum zugrundeliegenden Defizit erläutert (Kap. 1.3 .). Die aus dem aktuellen Forschungsstand abzuleitenden Fragestellungen (Kap. 1.4.) bilden die Basis für die in Kap. 2. folgende Analyse des Fallbeispiels. Bei der Entwicklung der Fragestellungen werden neben sprachspezifischen Merkmalen des Agrammatismus im Deutschen die Eigenschaften berücksichtigt, die in der Literatur allgemein kontrovers diskutiert werden. In Kap. 3 erfolgt abschließend eine zusammenfassende Diskussion der Ergebnisse, die eine Einordnung der Fallstudie in den aktuellen Forschungsstand enthält, sowie einen wertenden Vergleich der aus der Einzelfallanalyse gewonnenen Daten mit den m Kap. 1.3. vorgestellten Erklärungsansätzen für die zugrundeliegende Störung.
In this paper we show an approach to the customization of GermaNet to the German HPSG grammar lexicon developed in the Verbmobil project. GermaNet has a broad coverage of the German base vocabulary and fine-grained semantic classification; while the HPSG grammar lexicon is comparatively small und has a coarse-grained semantic classification. In our approach, we have developed a mapping algorithm to relate the synsets in GermaNet with the semantic sorts in HPSG. The evaluation result shows that this approach is useful for the lexical extension of our deep grammar development to cope with real-world text understanding.
The Child Language Data Exchange System (CHILDES) consists of Codes for the Human Analysis of Transcripts (CHAT), Computerized Language Analysis (CLAN), and a database. There is also an online manual which includes the CHILDES bibliography, the database, and the CHAT conventions as well as the CLAN instructions. The first three parts of this paper concern the CHAT format of transcription, grammatical coding, and analyzing transcripts by using the CLAN programs. The fourth part shows examples of transcribed and coded data.
MED (Media EDitor) is a program designed to facilitate the transcription of digitized soundfiles into textfiles. It was written by Hans Drexler and Daan Broeder, Max Planck Institute for Psycholinguistics, Nijmegen, The Netherlands. [...] The aim of MED is to facilitate the transcription of sound into text using a single program. It works on the principle of the coexistence and interaction of two basic elements, the waveform display window and the text window. [...] This means that you no longer need to use both a sound editor and a word processor at the same time in order to transcribe digitized speech files. Instead, you can directly type the sound you hear (and see) via MED into the text window. Furthermore, you can directly link sound portions of the waveform display window to text portions of the text window, so that you can easily locate and listen to the original source of your transcription once the links have been set. In this function the waveform display window and the text window virtually interact with each other.
Auto - bil, Reha - rehab, Mikro - mick, Alki - alkis : Kurzwörter im Deutschen und Schwedischen
(2001)
Das Kurzwort wird nach BELLMANN 1980 und KOBLER-TRILL 1994 definiert als eine sowohl graphisch als auch phonisch realisierte gekürzte Form, die aus einem längeren sog. Basislexem (einschließlich eines Wortgruppenlexems) hervorgeht (im Folgenden auch Vollform genannt). Dabei besteht zwischen Kurzwort und Basislexem, die weiterhin nebeneinander bestehen, eine Synonymie-Beziehung, d.h. beide referieren auf das gleiche Objekt (vgl. Limo und Limonade, Kripo und Kriminalpolizei).
Die deutsche Wechselflexion besteht hauptsächlich im e -> i- und im a -> e-Wechsel in der 2. und 3. Person Singular im Präsens starker Verben (z.B. ich gebe vs. du gibst/sie gibt oder ich fahre vs. du fährst/sie fährt). Dieser binnenflektierende, modulatorische Person/Numerus-Ausdruck galt bisher als konservativer Zug des Deutschen und wurde von der Linguistik kaum beachtet, möglicherweise weil sein Erhalt theoretisch schwer zu begründen ist. Manche Linguisten haben sogar schon seinen Abbau prognostiziert. In diesem Beitrag wird dieses marginalisierte Phänomen synchron wie diachron dargestellt und mit dem Luxemburgischen verglichen. Beide Sprachen verfügen über einen stabilen Bestand an über fünfzig häufig verwendeten Wechselflexionsverben. Im Gegensatz zum Deutschen hat sich die luxemburgische Wechselflexion von den starken Verben gelöst und wurde sekundär auch auf schwache und athematische Verben übertragen. Dabei kommt es zu über zwanzig verschiedenen Vokalalternanzen. Dieser massive Aus- und Umbau der luxemburgischen Wechselflexion wird dokumentiert und, zusammen mit der deutschen Wechselflexion, einer theoretischen Fundierung unterzogen.
The development of "junk" : irregularization strategies of HAVE and SAY in the Germanic languages
(2001)
Although it is a wellknown fact that the most frequent verbs are the most irregular ones (if not suppletive), it is rarely asked how they became irregular. This article deals with the irregularization process of two originally regular (weak) verbs, HAVE and SAY in the Germanic languages, e.g. have, but has/'s and had/'d (instead of regular *haves/*haved) or say [sei], but says [sez] and said [sed] in English. Other verbs, such as DO, GO, STAND, BE, COME, and so on, also tend to irregularizations again and again without any apparent reason. In contrast to HAVE and SAY these verbs have always been rather irregular, at least dating from their first written records.
It is often assumed that the goal of typology is to define the notion ‘possible human language’. This view, which I call the Universalist Typology view is shared, for example, by virtually all contributors to Bynon & Shibatani’s 1995 volume Approaches to Language Typology, and by Moravscik in her review of this volume in Linguistic Typology 1 (p.105). In the following I claim that this assumption is fundamentally mistaken. To clarify the theoretical status of what is meant by ‘possible human language’, I argue here for a distinction between typological theory (theoretical typology) and grammatical theory (theoretical syntax and theoretical morphology) as distinct subdisciplines of linguistics.
The role of migration and language contact in the development of the Sino-Tibetan language family
(2001)
Das Fersental (Valle del Fèrsina) liegt etwa fünfzehn Kilometer östlich von Trient in der Provinz Trient / Trento in Oberitalien und bildet eine germanophone Sprachinsel im hauptsächlich italienisch-sprachigen Trentino. Gesprochen wird die Minderheitensprache „Mòchenisch“ [...] oder Deutsch-Fersentalerisch heute in drei Orten des Fersentals [...]. Die Grammatik bietet eine Übersicht über Lautungen, Formen und Satzbau des Mòchenischen.
This paper is part of a research project on OT Syntax and the typology of the free relative (FR) construction. It concentrates on the details of an OT analysis and some of its consequences for OT syntax. I will not present a general discussion of the phenomenon and the many controversial issues it is famous for in generative syntax.
Unter “Kasussynkretismus” versteht man den Wegfall von morphologischen Unterscheidungen im Kasussystem einer Sprache. Hier will ich über den Synkretismus sprechen, der im Deutschen im Femininum stattgefunden hat. Im Gegensatz zum Maskulinum, aber ebenso wie im Neutrum, unterscheidet das Deutsche systematisch nicht zwischen der Nominativform und der Akkusativform.
Wie in anderen Regionen ist auch in der Schweiz seit den 1950er Jahren eine Bewegung weg von der Untersuchung der 'reinen' Dialekte in ländlicher Umgebung hin zu einer Untersuchung von aktueller Sprachverwendung im urbanen Umfeld zu beobachten. Schweizer Dialektologie ist somit heute deutlich als 'social dialectology' zu verstehen. Die traditionelle Dialektologie hat sich an der sprachlichen Vielfalt der Städte gestört, weil diese dem Bemühen entgegenstanden, die diatopische Verteilung sprachlicher Varianten möglichst genau zu beschreiben. Die Sprache der Städte blieb deshalb am Rande des sprachwissenschaftlichen Interesses. Es zeigt sich jedoch deutlich (Siebenhaar i. Dr.), dass gerade in der Schweiz, wo die Mundarten auch in den Städten nicht durch die Standardsprachen verdrängt wurden, schon früh ein Interesse an der mundartlichen Variation aufgekommen ist.
I discuss the status of WH-words for interrogative interpretations, and show that the derivation of constituent questions evolves from a specific interplay of syntactic and semantic representations with pragmatics. I argue that WH-pronouns are not ‘interrogative’. Rather, they are underspecified elements; due to this underspecification, WH-words can form a constitutive part not only of interrogative, but also of exclamative and declarative clauses. WH-words introduce a variable of a particular conceptual domain into the semantic representation. Accordingly, they have to be specified for interpretation. Different WH-contexts give rise to different interpretations. In a cross-linguistic overview, I discuss the characteristic elements contributing to the derivation of interrogatives. I argue that specific particles or their phonologically empty counterparts in the head of CP contribute the interrogative aspect. The speech act of ‘asking’ is then carried out via an intonational contour that identifies a question. By default, this intonational contour operates on interrogative sentences; however, other sentence formats – in particular, those of declarative sentences – are possible as well. The distinction of (a) grammatical (syntactic, semantic and phonological) sentence formats for interrogative and declarative sentences, and (b) intonational contours serving the discrimination of speech acts like questions and assertions, can be related to psychological and neurological evidence.
What role does language play in the development of numerical cognition? In the present paper I argue that the evolution of symbolic thinking (as a basis for language) laid the grounds for the emergence of a systematic concept of number. This concept is grounded in the notion of an infinite sequence and encompasses number assignments that can focus on cardinal aspects ("three pencils"), ordinal aspects ("the third runner"), and even nominal aspects ("bus #3"). I show that these number assignments are based on a specific association of relational structures, and that it is the human language faculty that provides a cognitive paradigm for such an association, suggesting that language played a pivotal role in the evolution of systematic numerical cognition.
In linguistics and the philosophy of language, the mass/count distinction has traditionally been regarded as a bi-partition on the nominal domain, where typical instances are nouns like "beef" (mass) vs."cow" (count). In the present paper, we argue that this partition reveals a system that is based on both syntactic features and conceptual features, and present experimental evidence suggesting that the discrimination of the two kinds of features has a psychological reality.
Gegenstand des vorliegenden Beitrags ist der Zusammenhang der beiden Bereiche Sprache und außersprachliches Begriffssystem: Wie sind sprachliche und konzeptuelle Module verknüpft, und wie lässt sich ihr Zusammenhang theoretisch erfassen? Ich skizziere zwei alternative Ansätze zur Modellierung dieser Schnittstelle: das „Zwei-Ebenen-Modell“ und das Modell der „Conceptual Semantics“. Vor dem Hintergrund der beiden Ansätze diskutiere ich die Notwendigkeit eines vom konzeptuellen unterschiedenen „semantischen“ Systems, das sprachliche Aspekte der Bedeutung erfasst. Ich entwickele auf dieser Basis ein Modell, in dem die semantische Ebene als integrierter Teil des konzeptuellen Systems CS definiert ist: Semantische Repräsentationen werden durch einen Filter über CS generiert; sie etablieren eine Schnittstellen-Ebene, die CSElemente sprachlichen Strukturen zugänglich macht. Das Modell, das als Elaboration des „Tripartite Parallel Architecture“-Modells (Jackendoff 1997) verstanden werden kann, differenziert sprachliche und nicht-sprachliche Bedeutungsaspekte innerhalb eines komplexen Moduls (“2 in 1”-Ansatz).
In the present paper, I will discuss the semantic structure of nouns and nominal number markers. In particular, I will discuss the question if it is possible to account for the syntactic and semantic formation of nominals in a parallel way, that is I will try to give a compositional account of nominal semantics. The framework that I will use is "twolevel semantics". The semantic representations and their type-theoretical basis will account for general cross-linguistic characteristics of nouns and nominal number and will show interdependencies between noun classes, number marking and cardinal constructions. While the analysis will give a unified account of bare nouns (like dog / water), it will distinguish between the different kinds of nominal terms (like a dog / dogs / water). Following the proposal, the semantic operations underlying the formation of the SR are basically the same for DPs as for CPs. Hence, from such an analysis, independent semantic arguments can be derived for a structural parallelism of nominals and sentences - that is, for the "sentential aspect" of noun phrases. I will first give a sketch of the theoretical background. I will then discuss the cross-linguistic combinatorial potential of nominal constructions, that is, the potential of nouns and number markers to combine with other elements and form complex expressions. This will lead to a general type-theoretical classification for the elements in question. In the next step, I will model the referential potential of nominal constructions. Together with the combinatorial potential, this will give us semantic representations for the basic elements involved in nominal constructions. In an overview, I will summarize our modeling of nouns and nominal number. I will then discuss in an outlook the "sentential aspect" of noun phrases.
Im Rahmen philosophisch-mathematischer Ansätze steht häufig der kardinale Aspekt natürlicher Zahlen im Vordergrund, auf den sprachlich mit Kardinal-Konstruktionen („sieben Zwerge“) referiert wird. Zahlen werden jedoch nicht nur in solchen quantitativen, sondern auch in ordinalen („der dritte Mann“) oder nominalen Kontexten („Bus Nr.129“) gebraucht. Bei einer umfassenden Analyse des Zahlkonzepts sind daher auch diese Komponenten zu berücksichtigen.
I give a unified account of numeral classifiers as lexical items that are reduced to the function of individuation in cardinal counting constructions with transnumeral nouns. I argue that individuation is a lexical-semantic phenomenon that triggers a focus shift from a whole set to its individual elements, but does not affect the conceptual representation. The semantic reduction of numeral classifiers to individuation functions is, on the one hand, reflected by a morpho-syntactic reduction; numeral classifiers do not project to full NPs, but occur as headadjuncts in QPs. On the other hand, it leads to a loss of conceptual features. As a result, nouns that are used as numeral classifiers are conceptually divorced from their NP counterparts. They integrate the nominal concept not as part of their interpretation, but via agreement features that govern the distribution of nouns in classifierconstructions. I show that the selection of conceptual features relevant for the distribution of numeral classifiers and nouns is lexically, not conceptually governed, supporting a model that distinguishes lexical-semantic and conceptual aspects in the generation of meaning.
Cross-linguistically, numerals differ from other linguistic expressions in various aspects of their grammatical behavior and their acquisition. What is so special about them? I will show that a closer look at the status of numbers and numerals not only gives an answer to this question, but can also shed some light onto the syntax-semantics interface. Taking into account philosophical approaches from the foundations of mathematics, I will set forth a definition of number as a function that can be fulfilled by certain sequences. This will lead us (i) to dispense with abstract entities “numbers“ and (ii) to regard numeral sequences as sets that can function as numbers. I will show that this OCCAMiam view captures the peculiar features of numeral sequences as a reflex of their “number function”. On the other hand, the integration of number words into complex syntactic structures leads to a morpho-syntactic behavior of cardinals, ordinals and numerals in “#”-constructions that comes close to that of different word classes, depending on parallels in their semantic-conceptual structure.
A model is proposed that interprets a variety of connected speech processes as resulting from prosodic modulations at different tiers of functional speech motor control along the hypo-hyper dimension [10]. The general background of the model is given by the trichotomy of A-, B- and C-prosodic phenomena [15] that together constitute the acoustic makeup of any speech utterance (with regard to their respective time domains at the uttarance/phrase level, the syllabic level and the segmental level).
The first printed newspapers in the modern sense of the word appeared in the seventeenth century. They were weekly publications which contained regular reports by correspondents from all over Europe, mainlyon political matters. Although the new medium as such was innovative in its general organization, the individual news items were produced by following text patterns which already had a history of their own. The article reports recent research on the emerging constellation of text types in the first two German newspapers, the Aviso and the Relation of the year 1609. lt is focussed on delineating a prototype-based typology of the relevant text types and on tracing back these forms of presentation of news items to earlier genres and media like chronicles, handwritten newsletters, printed pamphlets and biannual news collections. The general interest of this line of research as a contribution to historical pragmatics lies in the attempt to see historical text types in an evolutionary perspective, taking into account the context of text production and, as far as possible, the reactions of the reading public.
Daß das Deutsche eine sterbende Sprache sein könnte, scheint auf den ersten Blick eine sehr gewagte These, da die meisten von uns diese Sprache täglich benutzen und auch nicht vorhaben, dies in nächster Zeit zu ändern. Hier soll der Frage nachgegangen werden, ob die massive Fremdwortübernahme, vor allem aus dem Englischen, dahingehend gedeutet werden kann, daß das Deutsch eine sterbende Sprache ist.
Generative grammar
(2001)
Generative Grammar is the label of the most influential research program in linguistics and related fields in the second half of the 20. century. Initiated by a short book, Noam Chomsky's Syntactic Structures (1957), it became one of the driving forces among the disciplines jointly called the cognitive sciences. The term generative grammar refers to an explicit, formal characterization of the (largely implicit) knowledge determining the formal aspect of all kinds of language behavior. The program had a strong mentalist orientation right from the beginning, documented e.g. in a fundamental critique of Skinner's Verbal behavior (1957) by Chomsky (1959), arguing that behaviorist stimulus-response-theories could in no way account for the complexities of ordinary language use. The "Generative Enterprise", as the program was called in 1982, went through a number of stages, each of which was accompanied by discussions of specific problems and consequences within the narrower domain of linguistics as well as the wider range of related fields, such as ontogenetic development, psychology of language use, or biological evolution. Four stages of the Generative Enterprise can be marked off for expository purposes.
Syntax-semantics interface
(2001)
Intermediate cumulation
(2001)
In der Abteilung Grammatik des Instituts für Deutsche Sprache, Mannheim, wird derzeit ein neues Projekt entwickelt, und zwar das einer Grammatik des Deutschen im europäischen Vergleich (GDE). Dieses Projekt fügt sich ein in die kontrastive Tradition des IDS, ist jedoch andererseits auch in vieler Hinsicht innovativ. Bevor ich das Projekt im Einzelnen vorstelle, versuche ich den Bogen zurück zu den kontrastiven Grammatiken zu schlagen. Gerade die Leserschaft polnischer Germanisten braucht an die Tradition kontrastiver Grammatikschreibung sicher nicht eigens erinnert zu werden. Denn diese Tradition, die untrennbar mit dem Namen Ulrich Engel verknüpft ist, ist gerade erst in der neu erschienenen deutsch-polnischen kontrastiven Grammatik kulminiert. Im Bereich der kontrastiven Grammatiken zu Sprachenpaaren, von denen das Deutsche ein Element ist, verfügt das IDS also über eine vergleichsweise reiche Tradition. Am IDS oder in Kooperation mit dem IDS wurden kontrastive Grammatiken zu den Sprachenpaaren Deutsch – Französisch (Zemb 1978), Deutsch – Serbokroatisch , Deutsch – Spanisch (Cartegena/Gauger 1989), Deutsch – Rumänisch (Engel u.a. 1993) erarbeitet. Zum Sprachenpaar Englisch – Deutsch liegt mit Hawkins 1986 eine typologisch-vergleichende Grammatik vor. Die deutsch-polnische kontrastive Grammatik, die unter der Leitung von Ulrich Engel erarbeitet wurde, ist 1999 erscheinen. Abraham 1994 und Glinz 1994 konfrontieren das Deutsche, mit durchaus unterschiedlicher Akzentsetzung, mit mehreren anderen europäischen Sprachen. An der Berliner Humboldt-Universität laufen derzeit die Vorarbeiten zu einer deutsch-russischen kontrastiven Grammatik (Initiative Wolfgang Gladrow und Michail Kotin). Die Aufgabe einer 'Grammatik des Deutschen im europäischen Kontext' ist also hinlänglich vorbereitet.
Die Erstellung eines Großwörterbuchs ist ein umfagreiches Vorhaben – nicht nur in quantitativem Sinne. So ist es mir eine Ehre, dass ich – als Mitherausgeber der kürzlich erschienenen Großwörterbücher Deutsch-Ungarisch und Ungarisch-Deutsch – im Rahmen dieser Tagung die derzeit laufende lexikographische Arbeit an einem deutsch-finnischen Großwörterbuch unter der Leitung von Professor Jarmo Korhonen näher kennen lernen kann. Über dieses Projekt schreibt Lenk (1998: 87) in einem Tagungsbericht: „Das [...] geplante neue Großwörterbuch begnügt sich mit einer voraussichtlichen Stichwortzahl von 100.000.“ Nun erhebt sich die Frage, was hier wohl mit der Formulierung „begnügt sich“ gemeint war: Wie „groß“ muss eigentlich ein „Großwörterbuch“ sein, um diesen Namen führen zu dürfen? Unter diesem Aspekt möchte sich der vorliegende Beitrag mit der Problematik der Größenklassen bzw. -bezeichnungen von Wörterbüchern auseinander setzen, da diese Fragestellung in mehrfacher Hinsicht aktuell ist, sowohl für die metalexikographische Theorie als auch für die Praxis der Wörterbucharbeit. Zur Verdeutlichung sei zunächst exemplarisch auf die ungarische Wörterbuchwirklichkeit hingewiesen: Es sind vor kurzem fast zeitgleich – allerdings für unterschiedliche Sprachenpaare – so genannte „Großwörterbücher“ einerseits mit lediglich 30.000 (z.B. Radácsy 1997) und andererseits mit mehr als 200.000 Lemmata (z.B. Halász/Földes/Uzonyi 1998a) herausgegeben worden. Ebenfalls in Ungarn erscheinen jetzt – sogar für dieselbe Sprachrichtung – zwei Wörterbücher mit im Wesentlichen gleicher Lemmaanzahl, wobei sich das eine „Kleinwörterbuch“ (Halász/Földes/Uzonyi 2000a), das andere aber schon „Handwörterbuch“ (Hessky 2000) nennt. Mit anderen Worten: Sprachlexika mit etwas über 30.000 Lemmata nennt man mal Klein-, mal Hand-, mal Großwörterbuch. Von dieser empirischen Beobachtung ausgehend soll im Weiteren an einer größeren Zahl zweisprachiger Wörterbücher, in denen eine der beteiligten Sprachen das Deutsche ist, untersucht werden, ob die Bezeichnungen als einigermaßen verlässliche Indikatoren für die Größe des lexikographisch erfassten Sprachmaterials angesehen werden können. Ebenfalls soll der Frage nachgegangen werden, ob die immer zahlreicher werdenden Attribuierungen und Bestimmungswörter wie großes Wörterbuch oder Global-, Universal-, Kompaktwörterbücher etc. mit dem tatsächlichen Umfang der Wörterbücher korrelieren und ob bzw. inwieweit die diesbezüglich verwendeten Terminologien der einzelnen lexikographischen Werkstätten bzw. der Verlage miteinander kompatibel sind. Hier besteht erheblicher Klärungsbedarf. Vor diesem Hintergrund sollen generell die Probleme der Größenbezeichnungen bzw. -klassen – oder wie der Heidelberger Metalexikograph Wiegand (1990: 2127) besonders fachkundig formuliert: „die Zahlen zur Mächtigkeit der Trägermenge der Makrostruktur“ – angesprochen werden. Dabei muss man sich natürlich klar vor Augen halten, dass die Lemmaanzahl nur eines der Kriterien zur Bestimmung des Volumens, d.h. der Größenklasse ist (vgl. Wiegand 1990: 2129). Bei der Lemmaselektion ergeben sich daher für die Lexikographen gleich zwei grundsätzliche Dilemmas: (a) in quantitativer Hinsicht wie viel und (b) in qualitativer Hinsicht welche Lemmata Aufnahme finden sollen. Denn nur bei einem geschlossenen Korpus – wie etwa bei einem historischen Wörterbuch – liegt eine idealtypische Lemmaselektion vor, indem die Quellen vollständig ausgewertet werden können: Beispielsweise war es Hannig (1995: VII) möglich, in seinem „Handwörterbuch Ägyptisch- Deutsch. Die Sprache der Pharaonen (2800-950 v.Chr.)“ relativ ruhigen Gewissens zu äußern: „Das Handwörterbuch ist eine möglichst vollständige Sammlung aller bekannten Wörter der zweiten/dritten bis inklusive einundzwanzigsten Dynastie“. Die Probleme der Größenklassen scheinen in den einschlägigen Fachdiskursen kaum eine Rolle zu spielen. In einer Monographie erwähnt zwar Schaeder (1987: 84) im Zusammenhang mit einsprachigen Spezialwörterbüchern am Rande: „Geteilt dürften die Ansichten darüber sein, was ein großes und was ein kleines Wörterbuch ist“. Gleichwohl finden sich in den sonst erschöpfenden HSK-Bänden „Wörterbücher“ von Hausmann/Reichmann/Wiegand/Zgusta (1990/1991) recht sporadisch und zugleich ziemlich rudimentäre Hinweise auf eine Phänomenologie der Größenordnung von Wörterbüchern.
Mit dem vorliegenden Beitrag sollte gezeigt werden, dass Untersuchungen zur Sprache von Minderheitenblättern nicht nur die Forschungen zur Pressesprache bereichern können, sondern gleichermaßen den Erkenntnisstand über verschiedene andere Sondersprachen. Infolge des besonderen sprachlich-kommunikativen Kontextes der lebensweltlichen Mehrsprachigkeit und des spezifischen soziokulturellen Umfelds der erlebten Interkulturalität vermögen solche Forschungen - die künftig in größerer Zahl und auf breiterer Basis wünschenswert wären - Blickwinkel, Instrumentarien und Ergebnisse der traditionellen Forschungsaktivitäten im binnendeutschen Sprachraum durch qualitativ neue Aspekte zu ergänzen und dadurch auch in vielerlei Hinsicht zu relativieren.
Die Untersuchung von Eigennamen (EN) im Kontext der Kontaktlinguistik stellt ein besonders aktuelles und informatives Forschungsfeld dar: Beispielsweise hat Eichler (1976: 128) bereits vor zweieinhalb Jahrzehnten erkannt, dass "gerade Sprachkontaktforschung heute ohne die onomastische Komponente nicht mehr gut denkbar ist". Beim gegenwärtigen Wissensstand kann auch von der anderen Seite her festgestellt werden, dass – insbesondere in Kulturräumen, in denen mehrere Sprachen miteinander in Berührung kommen – die Namenforschung eines kontaktlinguistischen Blickwinkels bedarf. Denn die EN verkörpern wohl den deutlichsten Nachweis für langfristige Vorgänge und Ergebnisse von Sprachenkontakten. So können diesbezüglich etwa hinsichtlich des "Namenstransfers" (Terminus nach Eichhoff 1991: 264) in mehr oder weniger multilinguale Regionen vor allem die Familien- und Ortsnamen lehrreiche linguistische wie auch interkulturelle Aufschlüsse liefern. Die onomastische Forschung verhält sich in diesem Problembereich unterschiedlich. Die kontaktlinguistischen Implikationen des direkten Transfers von Personennamen (mit phonematischer Anpassung) wurden in angelsächsischer Relation (norwegische, jiddische und ungarische Namen in den USA) bereits von einer Reihe bekannter Linguisten wie Kimmerle (1941: 1ff.; 1942: 158ff.), Haugen (1953: 201ff.), Mencken (1949: 474ff. sowie Supplement II, 1952: 396ff.), Weinreich (1968: 53), Bartha (1993: 41 ff.) und Kontra (1988: 58ff.) angesprochen. Hingegen würdigen nicht wenige Veröffentlichungen mit germanistischer Ausrichtung, auch wenn sie deutsche Nachnamen am Rande oder außerhalb des sog. "geschlossenen deutschen Sprachraums" ausführlich behandeln, diese Sprachenkontaktphänomene keines Hinweises (z. B. Breza 1986, Grünspanová 1975). Einige Arbeiten schneiden zwar die Einwirkung der Kontaktsprache(n) auf die deutschen Familiennamen (FaN) an, machen dies allerdings nicht zu ihrem primären Untersuchungsobjekt (z. B. Čučka/Melika 1979, Hellfritzsch 1990, Matejčík 1993[3] und Mori 1993). Lediglich in deutsch-tschechischer (Knappová 1990) und stärker in deutsch-angloamerikanischer sowie deutsch-costaricanischer Relation liegen einschlägig ertragreiche Beiträge vor, die verschiedene Integrationserscheinungen am Beispiel deutscher FaN in der englischsprachigen Umwelt der USA bzw. dem spanischsprachigen Milieu von Costa Rica thematisieren (Jones 1991 und besonders Eichhoff 1991 bzw. Boving 1986). Vor diesem Hintergrund zielt die vorliegende Studie darauf ab, deutschsprachige FaN in Südungarn einer kontaktlinguistischen Analyse zu unterziehen. Dies verspricht insofern ein besonders reizvolles Untersuchungsfeld, als in den Anthroponymen – dank lang anhaltender intensiver und mannigfacher Sprachen- und Kulturenkontakte trotz ihrer amtlich festgelegten Schreibformen – deutsche und ungarische Sprachelemente miteinander verschmelzen und in enger Symbiose existieren. Die Wechselwirkungen der flektierenden, indogermanischen deutschen Sprache und der agglutinierenden, finnisch-ugrischen ungarischen Sprache sind auch im Hinblick auf die Sprachtypologie besonders interessant.
Wo es auch immer um die Stellung der deutschen Sprache geht, kann ein Hinweis auf Ostmittel-, Ost- und Südosteuropa, einschließlich der GUS kaum fehlen. Zumeist wird dieses Areal (im Weiteren bediene ich mich des im deutschen Sprachraum zunehmend verwendeten Kürzels MOE) fast als Synonym für eine Hochburg des Deutschen apostrophiert. Deutsch als MOE-Sprache? - kann man sich fragen. Die Daten, die Wahrnehmungen und die Einstellungen sind allerdings nicht ganz einheitlich und nicht restlos eindeutig. Die Situation etwa der Hochschulgermanistik in der östlichen Hälfte Europas hat Kalmán in der Deutschen Universitäts-Zeitung wie folgt beschrieben: „Mangelnde Strukturierung des Fachbereiches, fehlende Differenzierung von Abschlüssen, Frontalunterricht und die Didaktik des kritiklosen Auswendiglernens - nach nun fast sechs Jahren hat sich an den ostmittel- und osteuropäischen Hochschulen nichts Grundlegendes geändert. […] Denn: ´Die Wandlungsunfähigkeit in diesen Ländern ist keine Frage des Systems mehr, sie ist eine Frage der Bequemlichkeit´“. Im Gegensatz zu diesem vernichtenden Verdikt meine ich als „betroffener“ Hochschulgermanist aus Ungarn, dass es bei uns doch nicht so schlecht aussieht. So möchte ich in diesem Beitrag die aktuelle Situation der deutschen Sprache in den Bereichen Schule und Universität vorstellen und einige Entwicklungstendenzen herausarbeiten. Dabei sei zwar der ganze MOE-Horizont im Blick behalten, es soll aber Ungarn besondere Aufmerksamkeit geschenkt werden.
Chunk parsing has focused on the recognition of partial constituent structures at the level of individual chunks. Little attention has been paid to the question of how such partial analyses can be combined into larger structures for complete utterances. Such larger structures are not only desirable for a deeper syntactic analysis. They also constitute a necessary prerequisite for assigning function-argument structure. The present paper offers a similaritybased algorithm for assigning functional labels such as subject, object, head, complement, etc. to complete syntactic structures on the basis of prechunked input. The evaluation of the algorithm has concentrated on measuring the quality of functional labels. It was performed on a German and an English treebank using two different annotation schemes at the level of function argument structure. The results of 89.73% correct functional labels for German and 90.40%for English validate the general approach.
Maschinelles Lernen wird häufig zur effzienten Annotation großer Datenmengen eingesetzt. Die Forschung zu maschinellen Lernverfahren beschränkt sich i.a. darauf unterschiedliche Lernverfahren zu vergelichen oder die optimale größe der Trainingsdaten zu bestimmen. Bisher wurde jedoch nicht untersucht, in wie weit sich linguistisches Wissen bei der Aufgabendefinition positiv auswirken kann. Dies soll hier anhand des Lernens von Base-Nominalphrasen mit drei unterschiedlichen Definitionen untersucht werden. Die Definitionen unterscheiden sich im Grad der linguistisch motivierten Erweiterungen, die zu einer eher praktisch motivierten ersten Definition hinzu kamen. Die Untersuchungen ergaben, dass sich die Anzahl der falsch klasssifizierten Wörter um ein Drittel reduzieren lässt.
Chunk parsing has focused on the recognition of partial constituent structures at the level of individual chunks. Little attention has been paid to the question of how such partial analyses can be combined into larger structures for complete utterances. The TüSBL parser extends current chunk parsing techniques by a tree-construction component that extends partial chunk parses to complete tree structures including recursive phrase structure as well as function-argument structure. TüSBLs tree construction algorithm relies on techniques from memory-based learning that allow similarity-based classification of a given input structure relative to a pre-stored set of tree instances from a fully annotated treebank. A quantitative evaluation of TüSBL has been conducted using a semi-automatically constructed treebank of German that consists of appr. 67,000 fully annotated sentences. The basic PARSEVAL measures were used although they were developed for parsers that have as their main goal a complete analysis that spans the entire input.This runs counter to the basic philosophy underlying TüSBL, which has as its main goal robustness of partially analyzed structures.
Der TUSNELDA-Standard : ein Korpusannotierungsstandard zur Unterstützung linguistischer Forschung
(2001)
Die Verwendung von Standards für die Annotierung größerer Sammlungen elektronischer Texte (Korpora) ist eine Voraussetzung für eine mögliche Wiederverwendung dieser Korpora. Dieser Artikel stellt einen Korpusannotierungsstandard vor, der die Anforderungen der Untersuchung unterschiedlichster linguistischer Phänomene berücksichtigt. Der Standard wurde im SFB 441 an der Universität Tübingen entwickelt. Er geht von bestehenden Standards, insbesondere CES und TEI, aus, die sich als teilweise zu ausführlich und zu wenig restriktiv,teilweise auch als nicht ausdrucksstark genug erweisen, um den Bedürfnissen korpusbasierter linguistischer Forschung gerecht zu werden.