Linguistik
Refine
Year of publication
- 2001 (135) (remove)
Document Type
- Part of a Book (66)
- Article (25)
- Conference Proceeding (12)
- Working Paper (9)
- Preprint (8)
- Book (6)
- Review (6)
- Report (2)
- Diploma Thesis (1)
Language
- English (102)
- German (28)
- Portuguese (4)
- Polish (1)
Has Fulltext
- yes (135) (remove)
Is part of the Bibliography
- no (135)
Keywords
- Syntax (32)
- Semantik (20)
- Prädikat (18)
- Deutsch (15)
- Englisch (13)
- Informationsstruktur (10)
- Satzakzent (8)
- Lexikologie (6)
- Russisch (6)
- Chinesisch (5)
Institute
Chunk parsing has focused on the recognition of partial constituent structures at the level of individual chunks. Little attention has been paid to the question of how such partial analyses can be combined into larger structures for complete utterances. Such larger structures are not only desirable for a deeper syntactic analysis. They also constitute a necessary prerequisite for assigning function-argument structure. The present paper offers a similaritybased algorithm for assigning functional labels such as subject, object, head, complement, etc. to complete syntactic structures on the basis of prechunked input. The evaluation of the algorithm has concentrated on measuring the quality of functional labels. It was performed on a German and an English treebank using two different annotation schemes at the level of function argument structure. The results of 89.73% correct functional labels for German and 90.40%for English validate the general approach.
Der TUSNELDA-Standard : ein Korpusannotierungsstandard zur Unterstützung linguistischer Forschung
(2001)
Die Verwendung von Standards für die Annotierung größerer Sammlungen elektronischer Texte (Korpora) ist eine Voraussetzung für eine mögliche Wiederverwendung dieser Korpora. Dieser Artikel stellt einen Korpusannotierungsstandard vor, der die Anforderungen der Untersuchung unterschiedlichster linguistischer Phänomene berücksichtigt. Der Standard wurde im SFB 441 an der Universität Tübingen entwickelt. Er geht von bestehenden Standards, insbesondere CES und TEI, aus, die sich als teilweise zu ausführlich und zu wenig restriktiv,teilweise auch als nicht ausdrucksstark genug erweisen, um den Bedürfnissen korpusbasierter linguistischer Forschung gerecht zu werden.
Chunk parsing has focused on the recognition of partial constituent structures at the level of individual chunks. Little attention has been paid to the question of how such partial analyses can be combined into larger structures for complete utterances. The TüSBL parser extends current chunk parsing techniques by a tree-construction component that extends partial chunk parses to complete tree structures including recursive phrase structure as well as function-argument structure. TüSBLs tree construction algorithm relies on techniques from memory-based learning that allow similarity-based classification of a given input structure relative to a pre-stored set of tree instances from a fully annotated treebank. A quantitative evaluation of TüSBL has been conducted using a semi-automatically constructed treebank of German that consists of appr. 67,000 fully annotated sentences. The basic PARSEVAL measures were used although they were developed for parsers that have as their main goal a complete analysis that spans the entire input.This runs counter to the basic philosophy underlying TüSBL, which has as its main goal robustness of partially analyzed structures.
Maschinelles Lernen wird häufig zur effzienten Annotation großer Datenmengen eingesetzt. Die Forschung zu maschinellen Lernverfahren beschränkt sich i.a. darauf unterschiedliche Lernverfahren zu vergelichen oder die optimale größe der Trainingsdaten zu bestimmen. Bisher wurde jedoch nicht untersucht, in wie weit sich linguistisches Wissen bei der Aufgabendefinition positiv auswirken kann. Dies soll hier anhand des Lernens von Base-Nominalphrasen mit drei unterschiedlichen Definitionen untersucht werden. Die Definitionen unterscheiden sich im Grad der linguistisch motivierten Erweiterungen, die zu einer eher praktisch motivierten ersten Definition hinzu kamen. Die Untersuchungen ergaben, dass sich die Anzahl der falsch klasssifizierten Wörter um ein Drittel reduzieren lässt.
In der Abteilung Grammatik des Instituts für Deutsche Sprache, Mannheim, wird derzeit ein neues Projekt entwickelt, und zwar das einer Grammatik des Deutschen im europäischen Vergleich (GDE). Dieses Projekt fügt sich ein in die kontrastive Tradition des IDS, ist jedoch andererseits auch in vieler Hinsicht innovativ. Bevor ich das Projekt im Einzelnen vorstelle, versuche ich den Bogen zurück zu den kontrastiven Grammatiken zu schlagen. Gerade die Leserschaft polnischer Germanisten braucht an die Tradition kontrastiver Grammatikschreibung sicher nicht eigens erinnert zu werden. Denn diese Tradition, die untrennbar mit dem Namen Ulrich Engel verknüpft ist, ist gerade erst in der neu erschienenen deutsch-polnischen kontrastiven Grammatik kulminiert. Im Bereich der kontrastiven Grammatiken zu Sprachenpaaren, von denen das Deutsche ein Element ist, verfügt das IDS also über eine vergleichsweise reiche Tradition. Am IDS oder in Kooperation mit dem IDS wurden kontrastive Grammatiken zu den Sprachenpaaren Deutsch – Französisch (Zemb 1978), Deutsch – Serbokroatisch , Deutsch – Spanisch (Cartegena/Gauger 1989), Deutsch – Rumänisch (Engel u.a. 1993) erarbeitet. Zum Sprachenpaar Englisch – Deutsch liegt mit Hawkins 1986 eine typologisch-vergleichende Grammatik vor. Die deutsch-polnische kontrastive Grammatik, die unter der Leitung von Ulrich Engel erarbeitet wurde, ist 1999 erscheinen. Abraham 1994 und Glinz 1994 konfrontieren das Deutsche, mit durchaus unterschiedlicher Akzentsetzung, mit mehreren anderen europäischen Sprachen. An der Berliner Humboldt-Universität laufen derzeit die Vorarbeiten zu einer deutsch-russischen kontrastiven Grammatik (Initiative Wolfgang Gladrow und Michail Kotin). Die Aufgabe einer 'Grammatik des Deutschen im europäischen Kontext' ist also hinlänglich vorbereitet.
Wie in anderen Regionen ist auch in der Schweiz seit den 1950er Jahren eine Bewegung weg von der Untersuchung der 'reinen' Dialekte in ländlicher Umgebung hin zu einer Untersuchung von aktueller Sprachverwendung im urbanen Umfeld zu beobachten. Schweizer Dialektologie ist somit heute deutlich als 'social dialectology' zu verstehen. Die traditionelle Dialektologie hat sich an der sprachlichen Vielfalt der Städte gestört, weil diese dem Bemühen entgegenstanden, die diatopische Verteilung sprachlicher Varianten möglichst genau zu beschreiben. Die Sprache der Städte blieb deshalb am Rande des sprachwissenschaftlichen Interesses. Es zeigt sich jedoch deutlich (Siebenhaar i. Dr.), dass gerade in der Schweiz, wo die Mundarten auch in den Städten nicht durch die Standardsprachen verdrängt wurden, schon früh ein Interesse an der mundartlichen Variation aufgekommen ist.
Unter “Kasussynkretismus” versteht man den Wegfall von morphologischen Unterscheidungen im Kasussystem einer Sprache. Hier will ich über den Synkretismus sprechen, der im Deutschen im Femininum stattgefunden hat. Im Gegensatz zum Maskulinum, aber ebenso wie im Neutrum, unterscheidet das Deutsche systematisch nicht zwischen der Nominativform und der Akkusativform.
What role does language play in the development of numerical cognition? In the present paper I argue that the evolution of symbolic thinking (as a basis for language) laid the grounds for the emergence of a systematic concept of number. This concept is grounded in the notion of an infinite sequence and encompasses number assignments that can focus on cardinal aspects ("three pencils"), ordinal aspects ("the third runner"), and even nominal aspects ("bus #3"). I show that these number assignments are based on a specific association of relational structures, and that it is the human language faculty that provides a cognitive paradigm for such an association, suggesting that language played a pivotal role in the evolution of systematic numerical cognition.
I discuss the status of WH-words for interrogative interpretations, and show that the derivation of constituent questions evolves from a specific interplay of syntactic and semantic representations with pragmatics. I argue that WH-pronouns are not ‘interrogative’. Rather, they are underspecified elements; due to this underspecification, WH-words can form a constitutive part not only of interrogative, but also of exclamative and declarative clauses. WH-words introduce a variable of a particular conceptual domain into the semantic representation. Accordingly, they have to be specified for interpretation. Different WH-contexts give rise to different interpretations. In a cross-linguistic overview, I discuss the characteristic elements contributing to the derivation of interrogatives. I argue that specific particles or their phonologically empty counterparts in the head of CP contribute the interrogative aspect. The speech act of ‘asking’ is then carried out via an intonational contour that identifies a question. By default, this intonational contour operates on interrogative sentences; however, other sentence formats – in particular, those of declarative sentences – are possible as well. The distinction of (a) grammatical (syntactic, semantic and phonological) sentence formats for interrogative and declarative sentences, and (b) intonational contours serving the discrimination of speech acts like questions and assertions, can be related to psychological and neurological evidence.
I give a unified account of numeral classifiers as lexical items that are reduced to the function of individuation in cardinal counting constructions with transnumeral nouns. I argue that individuation is a lexical-semantic phenomenon that triggers a focus shift from a whole set to its individual elements, but does not affect the conceptual representation. The semantic reduction of numeral classifiers to individuation functions is, on the one hand, reflected by a morpho-syntactic reduction; numeral classifiers do not project to full NPs, but occur as headadjuncts in QPs. On the other hand, it leads to a loss of conceptual features. As a result, nouns that are used as numeral classifiers are conceptually divorced from their NP counterparts. They integrate the nominal concept not as part of their interpretation, but via agreement features that govern the distribution of nouns in classifierconstructions. I show that the selection of conceptual features relevant for the distribution of numeral classifiers and nouns is lexically, not conceptually governed, supporting a model that distinguishes lexical-semantic and conceptual aspects in the generation of meaning.
Gegenstand des vorliegenden Beitrags ist der Zusammenhang der beiden Bereiche Sprache und außersprachliches Begriffssystem: Wie sind sprachliche und konzeptuelle Module verknüpft, und wie lässt sich ihr Zusammenhang theoretisch erfassen? Ich skizziere zwei alternative Ansätze zur Modellierung dieser Schnittstelle: das „Zwei-Ebenen-Modell“ und das Modell der „Conceptual Semantics“. Vor dem Hintergrund der beiden Ansätze diskutiere ich die Notwendigkeit eines vom konzeptuellen unterschiedenen „semantischen“ Systems, das sprachliche Aspekte der Bedeutung erfasst. Ich entwickele auf dieser Basis ein Modell, in dem die semantische Ebene als integrierter Teil des konzeptuellen Systems CS definiert ist: Semantische Repräsentationen werden durch einen Filter über CS generiert; sie etablieren eine Schnittstellen-Ebene, die CSElemente sprachlichen Strukturen zugänglich macht. Das Modell, das als Elaboration des „Tripartite Parallel Architecture“-Modells (Jackendoff 1997) verstanden werden kann, differenziert sprachliche und nicht-sprachliche Bedeutungsaspekte innerhalb eines komplexen Moduls (“2 in 1”-Ansatz).
Im Rahmen philosophisch-mathematischer Ansätze steht häufig der kardinale Aspekt natürlicher Zahlen im Vordergrund, auf den sprachlich mit Kardinal-Konstruktionen („sieben Zwerge“) referiert wird. Zahlen werden jedoch nicht nur in solchen quantitativen, sondern auch in ordinalen („der dritte Mann“) oder nominalen Kontexten („Bus Nr.129“) gebraucht. Bei einer umfassenden Analyse des Zahlkonzepts sind daher auch diese Komponenten zu berücksichtigen.
In linguistics and the philosophy of language, the mass/count distinction has traditionally been regarded as a bi-partition on the nominal domain, where typical instances are nouns like "beef" (mass) vs."cow" (count). In the present paper, we argue that this partition reveals a system that is based on both syntactic features and conceptual features, and present experimental evidence suggesting that the discrimination of the two kinds of features has a psychological reality.
The first printed newspapers in the modern sense of the word appeared in the seventeenth century. They were weekly publications which contained regular reports by correspondents from all over Europe, mainlyon political matters. Although the new medium as such was innovative in its general organization, the individual news items were produced by following text patterns which already had a history of their own. The article reports recent research on the emerging constellation of text types in the first two German newspapers, the Aviso and the Relation of the year 1609. lt is focussed on delineating a prototype-based typology of the relevant text types and on tracing back these forms of presentation of news items to earlier genres and media like chronicles, handwritten newsletters, printed pamphlets and biannual news collections. The general interest of this line of research as a contribution to historical pragmatics lies in the attempt to see historical text types in an evolutionary perspective, taking into account the context of text production and, as far as possible, the reactions of the reading public.
Die deutsche Wechselflexion besteht hauptsächlich im e -> i- und im a -> e-Wechsel in der 2. und 3. Person Singular im Präsens starker Verben (z.B. ich gebe vs. du gibst/sie gibt oder ich fahre vs. du fährst/sie fährt). Dieser binnenflektierende, modulatorische Person/Numerus-Ausdruck galt bisher als konservativer Zug des Deutschen und wurde von der Linguistik kaum beachtet, möglicherweise weil sein Erhalt theoretisch schwer zu begründen ist. Manche Linguisten haben sogar schon seinen Abbau prognostiziert. In diesem Beitrag wird dieses marginalisierte Phänomen synchron wie diachron dargestellt und mit dem Luxemburgischen verglichen. Beide Sprachen verfügen über einen stabilen Bestand an über fünfzig häufig verwendeten Wechselflexionsverben. Im Gegensatz zum Deutschen hat sich die luxemburgische Wechselflexion von den starken Verben gelöst und wurde sekundär auch auf schwache und athematische Verben übertragen. Dabei kommt es zu über zwanzig verschiedenen Vokalalternanzen. Dieser massive Aus- und Umbau der luxemburgischen Wechselflexion wird dokumentiert und, zusammen mit der deutschen Wechselflexion, einer theoretischen Fundierung unterzogen.
The development of "junk" : irregularization strategies of HAVE and SAY in the Germanic languages
(2001)
Although it is a wellknown fact that the most frequent verbs are the most irregular ones (if not suppletive), it is rarely asked how they became irregular. This article deals with the irregularization process of two originally regular (weak) verbs, HAVE and SAY in the Germanic languages, e.g. have, but has/'s and had/'d (instead of regular *haves/*haved) or say [sei], but says [sez] and said [sed] in English. Other verbs, such as DO, GO, STAND, BE, COME, and so on, also tend to irregularizations again and again without any apparent reason. In contrast to HAVE and SAY these verbs have always been rather irregular, at least dating from their first written records.
Das Fersental (Valle del Fèrsina) liegt etwa fünfzehn Kilometer östlich von Trient in der Provinz Trient / Trento in Oberitalien und bildet eine germanophone Sprachinsel im hauptsächlich italienisch-sprachigen Trentino. Gesprochen wird die Minderheitensprache „Mòchenisch“ [...] oder Deutsch-Fersentalerisch heute in drei Orten des Fersentals [...]. Die Grammatik bietet eine Übersicht über Lautungen, Formen und Satzbau des Mòchenischen.
Auto - bil, Reha - rehab, Mikro - mick, Alki - alkis : Kurzwörter im Deutschen und Schwedischen
(2001)
Das Kurzwort wird nach BELLMANN 1980 und KOBLER-TRILL 1994 definiert als eine sowohl graphisch als auch phonisch realisierte gekürzte Form, die aus einem längeren sog. Basislexem (einschließlich eines Wortgruppenlexems) hervorgeht (im Folgenden auch Vollform genannt). Dabei besteht zwischen Kurzwort und Basislexem, die weiterhin nebeneinander bestehen, eine Synonymie-Beziehung, d.h. beide referieren auf das gleiche Objekt (vgl. Limo und Limonade, Kripo und Kriminalpolizei).