Linguistik
Refine
Year of publication
- 2000 (10) (remove)
Document Type
- Preprint (4)
- Article (3)
- Conference Proceeding (2)
- Part of a Book (1)
Has Fulltext
- yes (10) (remove)
Is part of the Bibliography
- no (10)
Keywords
- Computerlinguistik (2)
- Japanisch (2)
- Alemannisch (1)
- Automatische Sprachanalyse (1)
- Deutsch (1)
- Fehlererkennung (1)
- Fehlertoleranz (1)
- Funktionsverbgefüge (1)
- German (1)
- Geschlecht (1)
Institute
- Extern (10) (remove)
“Funktionsverbgefüge” diye nitelendirilen bir ad ve eylemden oluşan Almanca işlevsel ad-eylem kümeleri, hem sözdizimsel hem de anlamsal bakımdan farklı özellikler gösterir. Bu nedenle, yabancı dil olarak Almanca öğretiminde öğrenme güçlüklerine yol açan bu sözcük kümelerinin öğretim biçimi daha da önem kazanmıştır. Bu çalışmada, öncelikle Almanca işlevsel ad-eylem kümelerinin (Funktionsverbgefüge) sözdizimsel ve anlamsal özellikleri ve buna bağlı olarak onların öğretim biçimi konulaştırılmaktadır. Bilişsel ve eklektik yöntem ilkeleri temel alınarak bu sözcük kümelerinin metin bağlamında sırasıyla tanıma, anlama, dizgeleştirme ve etkin kullanma biçiminde aktarılmasına ilişkin öneriler sunulmaktadır.
We present a solution for the representation of Japanese honorifical information in the HPSG framework. Basically, there are three dimensions of honorification. We show that a treatment is necessary that involves both the syntactic and the contextual level of information. The japanese grammar is part of a machine translation system.
Der Präteritumschwund dürfte eine der markantesten morphologischen Entwicklungen des Alemannischen (bzw. Oberdeutschen) bilden. Sein Verlauf in schweizerdeutschen Dialekten ist mit der Arbeit von JÖRG (1976) dokumentiert und ungefiibr ins 16. Jahrhundert zu datieren. Konsequenz der Aufgabe dieses synthetischen Verfahrens war die Verlegung der Vergangenheitskategorie in die Syntax. Dies hat zu einer starken typologischen Drift des Alemannischen in Richtung eines analytischen und zusätzlich klammernden Sprachtyps geführt: Das Perfekt ist zweigliedrig (finites Auxiliar + infinites Vollverb), das Plusquamperfekt sogar dreigliedrig (sogenanntes doppeltes Perfekt). Finites und infinites Verb können durch ganze Satzglieder, Adverbien etc. voneinander getrennt sein, sind also unter Umständen weit voneinander entfernt, was das Ausdrucksverfahren nicht gerade vereinfacht. Der Präteritumschwuud kontrastiert in eigentümlicher Weise mit dem Erhalt, ja sogar dem sekundären Ausbau synthetischer Konjunktivformen (sowohl Konjunktiv I als auch II), die weiteres morphologisches Charakteristikum des Alemannischen sind, doch nicht Thema dieses Beitrags (hierzu s. NÜBLING 1997).
In schwedischen Krankenhäusern ist es selbstverständlich, einen Krankenpfleger mit Syster 'Schwester' anzusprechen (also z.B. Syster Nils 'Schwester Nils'). Auch die Berufsbezeichnung von Schwester Nils ist weiblich: Er ist sjuksköterska, wörtlich 'Krankenpflegerin' (-ska ist schwedisches Movierungssuffix), also 'Krankenschwester'. Der im Schwedischen ganz geläufige Satz han är sjuksköterska 'er ist Krankenschwester' klingt für deutsche Ohren ungrammatisch. Vor etwa 30 Jahren war dies in Schweden nicht anders, doch hat man dieses Problem auf andere Weise gelöst als in Deutschland: Im Schwedischen ist die Sexusneutralisierung weiblicher Personen bezeichnungen möglich, genauer: möglich gemacht worden, während dies in Deutschland als unzulässiger Eingriff ins Sprachsystem betrachtet wird.
Intimität und Geschlecht : zur Syntax und Pragmatik der Anrede im Liebesbrief des 20. Jahrhunderts
(2000)
Die Trennung der Lebenswelt in Privatsphäre und Öffentlichkeit käme der Verortung von Intimität entgegen. Es scheint aber, als ob Intimität nicht einem klar abgegrenzten Bereich zugeordnet werden kann, sondern nunmehr als relationale Kategorie zu fassen ist. Gerade der historische Vergleich (Vgl. CORBIN 1992) erlaubt weder einheitlich räumliche oder körperliche noch ästhetische Kriterien zur Abgrenzung von Intimität. ...
Das Chunkparsing bietet einen besonders vielversprechenden Ansatz zum robusten, partiellen Parsing mit dem Ziel einer breiten Datenabdeckung. Ziel beim Chunkparsing ist eine partielle, nicht-rekursive syntaktische Struktur. Dieser extrem effiziente Parsing-Ansatz läßt sich als Kaskade endlicher Transducer realisieren. In diesem Beitrag wird TüSBL vorgestellt, ein System, bei dem die Eingabe aus spontaner, gesprochener Spache besteht, die dem Parser in Form eines Worthypothesengraphen aus einem Spracherkenner zur Verfügung gestellt wird. Chunkparsing ist für eine solche Anwendung besonders geeignet, da es fragmentarische oder nicht wohlgeformte Äußerungen robust behandeln kann. Des weiteren wird eine Baumkonstruktionskomponente vorgestellt, die die partiellen Chunkstrukturen zu vollständigen Bäumen mit grammatischen Funktionen erweitert. Das System wird anhand manuell überprüfter Systemeingaben evaluiert, da sich die üblichen Evaluationsparameter hierfür nicht eignen.
In this paper, we investigate the role of sub-optimality in training data for part-of-speech tagging. In particular, we examine to what extent the size of the training corpus and certain types of errors in it affect the performance of the tagger. We distinguish four types of errors: If a word is assigned a wrong tag, this tag can belong to the ambiguity class of the word (i.e. to the set of possible tags for that word) or not; furthermore, the major syntactic category (e.g. "N" or "V") can be correctly assigned (e.g. if a finite verb is classified as an infinitive) or not (e.g. if a verb is classified as a noun). We empirically explore the decrease of performance that each of these error types causes for different sizes of the training set. Our results show that those types of errors that are easier to eliminate have a particularly negative effect on the performance. Thus, it is worthwhile concentrating on the elimination of these types of errors, especially if the training corpus is large.
This paper proposes a corpus encoding standard that meets the needs of linguistic research using a variety of linguistic data structures. The standard was developed in SFB 441, a research project at the University of Tuebingen. The principal concern of SFB 441 are the empirical data structures which feed into linguistic theory building. SFB 441 consists of several projects, most of which are building corpora to empirically investigate various linguistic phenomena in various languages (e.g. modal verbs in German, forms of address and politeness in Russian). These corpora will form the components of the "Tuebingen collection of reusable, empirical, linguistic data structures (TUSNELDA)". The TUSNELDA annotation standard aims at providing a uniform encoding scheme for all subcorpora and texts of TUSNELDA such that they can be processed with uniform standardized tools. To guarantee maximal reusability we use XML for encoding. Previous SGML standards for text encoding were provided by the Text Encoding Initiative (TEI) and the Expert Advisory Group on Language Engineering Standards (Corpus Encoding Standard, CES). The TUSNELDA standard is based on TEI and XCES (XML version of CES) but takes into account the specific needs of the SFB projects, i.e. the peculiarities of the examined languages and linguistic phenomena.
Existing analyses of German scrambling phenomena within TAG-related formalisms all use non-local variants of TAG. However, there are good reasons to prefer local grammars, in particular with respect to the use of the derivation structure for semantics. Therefore this paper proposes to use local TDGs, a TAG-variant generating tree descriptions that shows a local derivation structure. However the construction of minimal trees for the derived tree descriptions is not subject to any locality constraint. This provides just the amount of non-locality needed for an adequate analysis of scrambling. To illustrate this a local TDG for some German scrambling data is presented.