Refine
Year of publication
- 2008 (211) (remove)
Document Type
- Article (95)
- Part of a Book (56)
- Report (17)
- Preprint (12)
- Part of Periodical (8)
- Conference Proceeding (7)
- Book (6)
- Review (6)
- Other (3)
- Working Paper (1)
Has Fulltext
- yes (211)
Keywords
- Germanistik (29)
- Russland (29)
- Rezension (19)
- Linguistik (18)
- Kroatisch (7)
- Literatur (7)
- Deutsch (6)
- Gabon (5)
- Gabun (5)
- Ikone (5)
Institute
- Extern (211) (remove)
How to compare treebanks
(2008)
Recent years have seen an increasing interest in developing standards for linguistic annotation, with a focus on the interoperability of the resources. This effort, however, requires a profound knowledge of the advantages and disadvantages of linguistic annotation schemes in order to avoid importing the flaws and weaknesses of existing encoding schemes into the new standards. This paper addresses the question how to compare syntactically annotated corpora and gain insights into the usefulness of specific design decisions. We present an exhaustive evaluation of two German treebanks with crucially different encoding schemes. We evaluate three different parsers trained on the two treebanks and compare results using EVALB, the Leaf-Ancestor metric, and a dependency-based evaluation. Furthermore, we present TePaCoC, a new testsuite for the evaluation of parsers on complex German grammatical constructions. The testsuite provides a well thought-out error classification, which enables us to compare parser output for parsers trained on treebanks with different encoding schemes and provides interesting insights into the impact of treebank annotation schemes on specific constructions like PP attachment or non-constituent coordination.
In this paper, we present an open-source parsing environment (Tübingen Linguistic Parsing Architecture, TuLiPA) which uses Range Concatenation Grammar (RCG) as a pivot formalism, thus opening the way to the parsing of several mildly context-sensitive formalisms. This environment currently supports tree-based grammars (namely Tree-Adjoining Grammars (TAG) and Multi-Component Tree-Adjoining Grammars with Tree Tuples (TT-MCTAG)) and allows computation not only of syntactic structures, but also of the corresponding semantic representations. It is used for the development of a tree-based grammar for German.
This paper investigates the relation between TT-MCTAG, a formalism used in computational linguistics, and RCG. RCGs are known to describe exactly the class PTIME; simple RCG even have been shown to be equivalent to linear context-free rewriting systems, i.e., to be mildly context-sensitive. TT-MCTAG has been proposed to model free word order languages. In general, it is NP-complete. In this paper, we will put an additional limitation on the derivations licensed in TT-MCTAG. We show that TT-MCTAG with this additional limitation can be transformed into equivalent simple RCGs. This result is interesting for theoretical reasons (since it shows that TT-MCTAG in this limited form is mildly context-sensitive) and, furthermore, even for practical reasons: We use the proposed transformation from TT-MCTAG to RCG in an actual parser that we have implemented.
TT-MCTAG lets one abstract away from the relative order of co-complements in the final derived tree, which is more appropriate than classic TAG when dealing with flexible word order in German. In this paper, we present the analyses for sentential complements, i.e., wh-extraction, thatcomplementation and bridging, and we work out the crucial differences between these and respective accounts in XTAG (for English) and V-TAG (for German).
Developing linguistic resources, in particular grammars, is known to be a complex task in itself, because of (amongst others) redundancy and consistency issues. Furthermore some languages can reveal themselves hard to describe because of specific characteristics, e.g. the free word order in German. In this context, we present (i) a framework allowing to describe tree-based grammars, and (ii) an actual fragment of a core multicomponent tree-adjoining grammar with tree tuples (TT-MCTAG) for German developed using this framework. This framework combines a metagrammar compiler and a parser based on range concatenation grammar (RCG) to respectively check the consistency and the correction of the grammar. The German grammar being developed within this framework already deals with a wide range of scrambling and extraction phenomena.
Cet article étudie la relation entre les grammaires darbres adjoints à composantes multiples avec tuples darbres (TT-MCTAG), un formalisme utilisé en linguistique informatique, et les grammaires à concaténation dintervalles (RCG). Les RCGs sont connues pour décrire exactement la classe PTIME, il a en outre été démontré que les RCGs « simples » sont même équivalentes aux systèmes de réécriture hors-contextes linéaires (LCFRS), en dautres termes, elles sont légèrement sensibles au contexte. TT-MCTAG a été proposé pour modéliser les langages à ordre des mots libre. En général ces langages sont NP-complets. Dans cet article, nous définissons une contrainte additionnelle sur les dérivations autorisées par le formalisme TT-MCTAG. Nous montrons ensuite comment cette forme restreinte de TT-MCTAG peut être convertie en une RCG simple équivalente. Le résultat est intéressant pour des raisons théoriques (puisqu’il montre que la forme restreinte de TT-MCTAG est légèrement sensible au contexte), mais également pour des raisons pratiques (la transformation proposée ici a été utilisée pour implanter un analyseur pour TT-MCTAG).
In this paper we present a parsing architecture that allows processing of different mildly context-sensitive formalisms, in particular Tree-Adjoining Grammar (TAG), Multi-Component Tree-Adjoining Grammar with Tree Tuples (TT-MCTAG) and simple Range Concatenation Grammar (RCG). Furthermore, for tree-based grammars, the parser computes not only syntactic analyses but also the corresponding semantic representations.
Von 560 in Deutschland nachgewiesenen Arten wurden 555 Arten einer Bewertung unterzogen. Danach sind 289 Arten (52 %) bestandsgefährdet. 227 Arten wurden einer Gefährdungskategorie zugeordnet: 25 Arten zu Kategorie 1 ("vom Aussterben bedroht"), 81 Arten zu Kategorie 2 ("stark gefährdet"), 88 Arten zu Kategorie 3 ("gefährdet"), 33 Arten zu Kategorie G ("Gefährdung unbekannten Ausmaßes"); 24 Arten gelten als "extrem selten" (R) und 43 Arten wurden in die Vorwarnliste (V) aufgenommen. Für 17 Arten sind die "Daten unzureichend" (D) für eine Einstufung. Im Vergleich mit der Fassung von 1998 hat der prozentuale Anteil der in die Rote Liste aufgenommenen Arten nicht abgenommen. Nur 37 % der Arten gelten als derzeit nicht gefährdet. Veränderungen zeigen sich vor allem in unterschiedlichen Einstufungen der Arten. Dies ist teilweise durch die andere Einschätzung der Bestandessituation bedingt, teilweise auch durch die neue Vorgehensweise und Anwendung des vorgegebenen Einstufungsschemas. Bei 59 Arten ergab sich eine im Vergleich zu 1998 günstigere Bestandessituation, 36 Arten finden sich nun in einer höheren Kategorie, weil sich ihre Situation schlechter darstellt als vor 10 Jahren. Hauptursache für den gravierenden Rückgang vieler Arten ist die industrielle Landwirtschaft und der damit einhergehende Verlust artspezfischer Nahrungsquellen und Nistplätze.
Vor einigen Jahren habe ich bereits über die Verbreitung und Ökologie der Seidenbiene Colletes collaris Dours berichtet (Westrich 1997). Diese Art ist in Deutschland extrem selten. Ihr aktueller Verbreitungsschwerpunkt liegt im Kaiserstuhl (Westrich et al. 2000). Die Untersuchungen von Pollenladungen von Weibchen aus dem gesamten Areal hatten gezeigt, daß die Art oligolektisch und auf Asteraceae spezialisiert ist. Als Pollenquellen bisher bekannt geworden sind Aster linosyris, Hieracium umbellatum, Picris hieracioides, Senecio erucifolius, Solidago virgaurea und Carduus acanthoides. Im Jahr 2006 machte ich im Kaiserstuhl ergänzende Beobachtungen zum Blütenbesuch, über die ich hier berichte.
Im Winter 1994/1995 wurden in drei Landschilfbeständen am Bodensee (Aach-Ried, Wollmatinger Ried, Konstanz) 294 Schilfgallen von Lipara lucens (Chloropidae) gesammelt. Davon wurden 223 für die Zucht und 82 für den Laborversuch zur Prüfung der Überfl utungstoleranz ausgewählt. Die gefluteten Gallen wurden entweder ½ Tag, 2 Tage oder 4 Tage bei Außentemperaturen im Februar unter Wasser gesetzt und anschließend mit 141 weiteren Gallen (Kontrolle) in Zuchtgläser verbracht. Neben Lipara lucens wurden folgende Arten aus den Gallen gezogen: Apidae (Bienen): Hylaeus pectoralis, Osmia leucomelana; Sphecidae (Grab wespen): Pemphredon lethifer, Trypoxylon attenuatum; Eumenidae (solitäre Falten wespen): Stenodynerus xanthomelas; Gaster up tionidae (Schmal bauchwespen): Gasteruption assectator, Gasteruption phragmiticola; Chrysi didae (Goldwespen): Chrysis cyanea; Eulophidae: Melittobia acasta. Die dominanten Arten waren: Hylaeus pectoralis and Pemphredon lethifer. Die Unterschiede im Artenspektrum der einzelnen Probeflächen waren teils beträchtlich. Insbesondere die Besiedlung durch Hylaeus pectoralis variierte von Lokalität zu Lokalität. Die stark ruderalisierte Probestelle bei Konstanz-Lindenbühl wies das höchste Artenspektrum auf und Pemphredon lethifer hatte hier die höchste Besiedlungsdichte. Dies deutet auf gestörte Verhältnisse im Vergleich zur Probefläche im Aach-Ried hin, einem weitgehend natürlichen Landröhricht. Sowohl aus den Kontrollgallen als auch aus den gefluteten Gallen sind jeweils mehrere Arten, teils in größerer Zahl geschlüpft. Die Unterschiede in der Schlüpfrate (72,4 % bei den Kontrollgallen, 66,7 % bei einer Flutungsdauer von ½ Tag, 69,3 % bei einer Flutungsdauer von 2 Tagen und 51,7 % bei einer Flutungsdauer von 4 Tagen) erklären sich daraus, daß unterschiedlich viele Gallen nicht besiedelt waren. Dies resultiert demnach nicht aus einem möglichen Einfl uß der Überfl utung. Dies hat sich durch ein nachträgliches Öffnen der Gallen bestätigt. Die Gallenerzeugerin Lipara lucens verträgt eine Überflutung ohne Schädigung ebenso wie ihre Parasitoide. Die als Folgesiedler auftretenden nestbauenden Bienen und Grabwespen sind an die Überfl utung dadurch angepaßt, daß entweder ihre Brutzellen mit spezifi schen Materialien ausgekleidet sind (Hylaeus pectoralis) oder daß die winterliche Diapause in selbstgesponnenen Kokons als Ruhelarve überdauert wird (Pemphredon lethifer, Trypoxylon attenuatum). Daraus resultiert: Eine Überflutung im Winterhalbjahr während eines Zeitraumes von ½ Tag bis zu 4 Tagen beeinflußt die Schlüpfrate der Gallenbesiedler nicht. Diese Aussage gilt streng genommen jedoch nur für die Versuchsbedingungen mit sauberem und stehendem Wasser. Belastetes See- oder Flußwasser hat möglicherweise eine andere Auswirkung auf die Gallenbewohner. Stark fließendes Wasser kann die Schilfgallen abknicken und weg spülen. In den zusammengeschwemmten Genisten sind sie erhöhter Feuchtigkeit, stärkerer Verpilzung und damit einer stärkeren Schädigung ausgesetzt.