Convertir des grammaires darbres adjoints à composantes multiples avec tuples d’arbres (TT-MCTAG) en grammaires à concaténation d’intervalles (RCG)
- Cet article étudie la relation entre les grammaires darbres adjoints à composantes multiples avec tuples darbres (TT-MCTAG), un formalisme utilisé en linguistique informatique, et les grammaires à concaténation dintervalles (RCG). Les RCGs sont connues pour décrire exactement la classe PTIME, il a en outre été démontré que les RCGs « simples » sont même équivalentes aux systèmes de réécriture hors-contextes linéaires (LCFRS), en dautres termes, elles sont légèrement sensibles au contexte. TT-MCTAG a été proposé pour modéliser les langages à ordre des mots libre. En général ces langages sont NP-complets. Dans cet article, nous définissons une contrainte additionnelle sur les dérivations autorisées par le formalisme TT-MCTAG. Nous montrons ensuite comment cette forme restreinte de TT-MCTAG peut être convertie en une RCG simple équivalente. Le résultat est intéressant pour des raisons théoriques (puisqu’il montre que la forme restreinte de TT-MCTAG est légèrement sensible au contexte), mais également pour des raisons pratiques (la transformation proposée ici a été utilisée pour implanter un analyseur pour TT-MCTAG).
- This paper investigates the relation between TT-MCTAG, a formalism used in computational linguistics, and RCG. RCGs are known to describe exactly the class PTIME ; "simple" RCG even have been shown to be equivalent to linear context-free rewriting systems, i.e., to be mildly context-sensitive. TT-MCTAG has been proposed to model free word order languages. In general, it is NP-complete. In this paper, we will put an additional limitation on the derivations licensed in TT-MCTAG. We show that TT-MCTAG with this additional limitation can be transformed into equivalent simple RCGs. This result is interesting for theoretical reasons (since it shows that TT-MCTAG in this limited form is mildly context-sensitive) and also for practical reasons (the proposed transformation has been used for implementing a parser for TT-MCTAG).
Author: | Laura KallmeyerORCiDGND, Yannick Parmentier |
---|---|
URN: | urn:nbn:de:hebis:30-1110216 |
URL: | http://www.sfs.uni-tuebingen.de/~lk/papers/taln08.pdf |
Document Type: | Preprint |
Language: | French |
Year of Completion: | 2008 |
Year of first Publication: | 2008 |
Publishing Institution: | Universitätsbibliothek Johann Christian Senckenberg |
Release Date: | 2008/10/20 |
Tag: | Multicomponent Tree Adjoining Grammars; Range Concatenation Grammars; mild context-sensitivity Grammaires d’arbres adjoints à composantes multiples; grammaires à concaténation d’intervalles; légère sensibilité au contexte |
Page Number: | 10 |
Note: | Erschienen in: Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles, Avignon, France : Association pour le Traitement Automatique des Langues, 2008 |
Source: | http://www.sfb441.uni-tuebingen.de/~lk/papers/taln08.pdf ; Actes de la 15eme conférence sur le Traitement Automatique des Langues Naturelles TALN 2008 (Avignon 2008). |
HeBIS-PPN: | 206688725 |
Institutes: | keine Angabe Fachbereich / Extern |
Dewey Decimal Classification: | 4 Sprache / 40 Sprache / 400 Sprache |
Sammlungen: | Linguistik |
Linguistik-Klassifikation: | Linguistik-Klassifikation: Computerlinguistik / Computational linguistics |
Licence (German): | Deutsches Urheberrecht |