Linguistik
Refine
Year of publication
- 2002 (12) (remove)
Document Type
- Conference Proceeding (4)
- Working Paper (3)
- Part of a Book (2)
- Preprint (2)
- Article (1)
Has Fulltext
- yes (12)
Is part of the Bibliography
- no (12)
Keywords
- Morphologie (4)
- Computerlinguistik (3)
- Geschlechterforschung (2)
- Grammatik (2)
- Isländisch (2)
- Artikel (1)
- Bahasa Indonesia (1)
- Bildergeschichte (1)
- Deutsch (1)
- Erzähltechnik (1)
Institute
- Extern (12) (remove)
This paper provides an overview of current research on a hybrid and robust parsing architecture for the morphological, syntactic and semantic annotation of German text corpora. The novel contribution of this research lies not in the individual parsing modules, each of which relies on state-of-the-art algorithms and techniques. Rather what is new about the present approach is the combination of these modules into a single architecture. This combination provides a means to significantly optimize the performance of each component, resulting in an increased accuracy of annotation.
We present an architecture for the integration of shallow and deep NLP components which is aimed at flexible combination of different language technologies for a range of practical current and future applications. In particular, we describe the integration of a high-level HPSG parsing system with different high-performance shallow components, ranging from named entity recognition to chunk parsing and shallow clause recognition. The NLP components enrich a representation of natural language text with layers of new XML meta-information using a single shared data structure, called the text chart. We describe details of the integration methods, and show how information extraction and language checking applications for realworld German text benefit from a deep grammatical analysis.
We present a broad coverage Japanese grammar written in the HPSG formalism with MRS semantics. The grammar is created for use in real world applications, such that robustness and performance issues play an important role. It is connected to a POS tagging and word segmentation tool. This grammar is being developed in a multilingual context, requiring MRS structures that are easily comparable across languages.
Die Idee, das Isländische - eine archaische, am Nordwestrand des germanischen Sprachgebiets gelegene skandinavische Inselsprache - auf die Möglichkeiten des Sexusausdrucks hin zu untersuchen, entstand imZusammenhang einer kontrastiven Arbeit zum Sexusausdruck im Deutschen und Schwedischen (siehe Nübling 2000). Das Schwedische verfügt nur noch über zwei Genera, das sog. Utrum (das aus dem Zusammenfall von Femininum und Maskulinum hervorgeht) und das Neutrum.
This article examines the expression of natural gender in Icelandic nouns denoting human beings. Particular attention will be paid to the system's symmetry with regards to nouns denoting women and men. Our society consists more or less exactly of half women and half men. One would therefore assume that systems for terms denoting persons would also be symmetrically organised. Yet this assumption could not be further from the truth, and not just in single isolated cases, but in many languages: I will attempt to show that Icelandic has numerous methods for referring to women, but also many barriers and idiosyncrasies.
Die vorliegende Arbeit soll sich mit dem „Zusammenziehen von Wörtern“ beschäftigen, das als typisch für die „Pottsprache“ […] angesehen wird. Dieses Zusammenziehen soll innerhalb der Klitisierungsforschung anhand zweier Fälle untersucht werden. Zum einen sollen reduzierte Formen der Pronomina und zum anderen reduzierte Artikelformen, nämlich die des bestimmten und des unbestimmten Artikels, als Untersuchungsgegenstand dienen. Dieses soll auf einer empirischen Basis, dass heißt auf der Basis von erhobenen und analysierten Sprachdaten, geschehen. Der erste Schritt soll dabei eine Darstellung der hier behandelten Sprachvarietät sein. […] Der zweite Schritt besteht in einer Darstellung der Theorie der Klitisierung […] Nachdem der Hintergrund dieser Arbeit dargestellt worden ist, folgt die eigentliche Analyse. Zunächst wird die Klitisierung von Pronomina untersucht […], dann die von Artikelformen […]. Beide Phänomene werden nacheinander auf ihre Eigenschaften hin untersucht, um dann zum Schluss zu einer Hypothese aus der bisherigen Forschung, nämlich die der flektierten Präpositionen, Stellung zu beziehen […]. Abschließend soll versucht werden die Ergebnisse dieser Arbeit in den Forschungsstand bei der Erforschung von Klitisierung auf der einen Seite und der Varietät Ruhrdeutsch auf der anderen Seite einzuordnen […].
Based on a detailed case study of parallel grammar development distributed across two sites, we review some of the requirements for regression testing in grammar engineering, summarize our approach to systematic competence and performance profiling, and discuss our experience with grammar development for a commercial application. If possible, the workshop presentation will be organized around a software demonstration.
Quantitative evaluation of parsers has traditionally centered around the PARSEVAL measures of crossing brackets, (labeled) precision, and (labeled) recall. However, it is well known that these measures do not give an accurate picture of the quality of the parsers output. Furthermore, we will show that they are especially unsuited for partial parsers. In recent years, research has concentrated on dependencybased evaluation measures. We will show in this paper that such a dependency-based evaluation scheme is particularly suitable for partial parsers. TüBa-D, the treebank used here for evaluation, contains all the necessary dependency information so that the conversion of trees into a dependency structure does not have to rely on heuristics. Therefore, the dependency representations are not only reliable, they are also linguistically motivated and can be used for linguistic purposes.
Das ausgehende 19. und beginnende 20. Jahrhundert setzt sich von den erkenntnistheoretischen Konzepten der vorangegangenen Zeit deutlich ab:Während – stark vereinfacht – die Philosophie bis dahin die Möglichkeit der Erkenntnis entweder in der subjektiven oder objektiven Dimension zu finden glaubte,wobei die Funktion der Sprache im Erkenntnisprozess kaum hinterfragt wurde, wird zur Jahrhundertwende eine Tendenz deutlich, die einerseits die Adäquatheit der sprachlichen Vermittlung entweder in Frage stellt oder zumindest thematisiert, andererseits die tradierten Erkenntnismodi neu reflektiert oder ihnen sogar den Rücken kehrt.
Die Flexionsmorphologie befasst sich mit der "Beugung" von Wörtern, d. h. mit der systematischen Kombination von (meist) Lexemen mit bestimmten sog. grammatischen Informationen (auch: Flexionskategorien). So wird die Wortart der Substantive im Deutschen mit den Informationen Kasus und vor allem Numerus (Singular und Plural) versehen.