Convertir des grammaires darbres adjoints à composantes multiples avec tuples d’arbres (TT-MCTAG) en grammaires à concaténation d’intervalles (RCG)

  • Cet article étudie la relation entre les grammaires darbres adjoints à composantes multiples avec tuples darbres (TT-MCTAG), un formalisme utilisé en linguistique informatique, et les grammaires à concaténation dintervalles (RCG). Les RCGs sont connues pour décrire exactement la classe PTIME, il a en outre été démontré que les RCGs « simples » sont même équivalentes aux systèmes de réécriture hors-contextes linéaires (LCFRS), en dautres termes, elles sont légèrement sensibles au contexte. TT-MCTAG a été proposé pour modéliser les langages à ordre des mots libre. En général ces langages sont NP-complets. Dans cet article, nous définissons une contrainte additionnelle sur les dérivations autorisées par le formalisme TT-MCTAG. Nous montrons ensuite comment cette forme restreinte de TT-MCTAG peut être convertie en une RCG simple équivalente. Le résultat est intéressant pour des raisons théoriques (puisqu’il montre que la forme restreinte de TT-MCTAG est légèrement sensible au contexte), mais également pour des raisons pratiques (la transformation proposée ici a été utilisée pour implanter un analyseur pour TT-MCTAG).
  • This paper investigates the relation between TT-MCTAG, a formalism used in computational linguistics, and RCG. RCGs are known to describe exactly the class PTIME ; "simple" RCG even have been shown to be equivalent to linear context-free rewriting systems, i.e., to be mildly context-sensitive. TT-MCTAG has been proposed to model free word order languages. In general, it is NP-complete. In this paper, we will put an additional limitation on the derivations licensed in TT-MCTAG. We show that TT-MCTAG with this additional limitation can be transformed into equivalent simple RCGs. This result is interesting for theoretical reasons (since it shows that TT-MCTAG in this limited form is mildly context-sensitive) and also for practical reasons (the proposed transformation has been used for implementing a parser for TT-MCTAG).
Metadaten
Author:Laura KallmeyerORCiDGND, Yannick Parmentier
URN:urn:nbn:de:hebis:30-1110216
URL:http://www.sfs.uni-tuebingen.de/~lk/papers/taln08.pdf
Document Type:Preprint
Language:French
Year of Completion:2008
Year of first Publication:2008
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Release Date:2008/10/20
Tag:Multicomponent Tree Adjoining Grammars; Range Concatenation Grammars; mild context-sensitivity
Grammaires d’arbres adjoints à composantes multiples; grammaires à concaténation d’intervalles; légère sensibilité au contexte
Page Number:10
Note:
Erschienen in: Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles, Avignon, France : Association pour le Traitement Automatique des Langues, 2008
Source:http://www.sfb441.uni-tuebingen.de/~lk/papers/taln08.pdf ; Actes de la 15eme conférence sur le Traitement Automatique des Langues Naturelles TALN 2008 (Avignon 2008).
HeBIS-PPN:206688725
Institutes:keine Angabe Fachbereich / Extern
Dewey Decimal Classification:4 Sprache / 40 Sprache / 400 Sprache
Sammlungen:Linguistik
Linguistik-Klassifikation:Linguistik-Klassifikation: Computerlinguistik / Computational linguistics
Licence (German):License LogoDeutsches Urheberrecht