• Treffer 2 von 33
Zurück zur Trefferliste

Treebank profiling of spoken and written German

  • This paper profiles significant differences in syntactic distribution and differences in word class frequencies for two treebanks of spoken and written German: the TüBa-D/S, a treebank of transliterated spontaneous dialogs, and the TüBa-D/Z treebank of newspaper articles published in the German daily newspaper ´die tageszeitung´(taz). The approach can be used more generally as a means of distinguishing and classifying language corpora of different genres.
Metadaten
Verfasserangaben:Erhard Hinrichs, Sandra KüblerORCiDGND
URN:urn:nbn:de:hebis:30-1111304
URL:http://cl.indiana.edu/~skuebler/papers/GermanEstimation.pdf
Dokumentart:Preprint
Sprache:Englisch
Jahr der Fertigstellung:2005
Jahr der Erstveröffentlichung:2005
Veröffentlichende Institution:Universitätsbibliothek Johann Christian Senckenberg
Datum der Freischaltung:03.11.2008
Seitenzahl:12
Bemerkung:
Erschienen in: Proceedings of the Fourth Workshop on Treebanks and Linguistic Theories (TLT). Barcelona, Spain, December 2005, S. 65-76
Quelle:http://jones.ling.indiana.edu/~skuebler/papers/GermanEstimation.pdf ; Proceedings of the Fourth Workshop on Treebanks and Linguistic Theories - Barcelona, Spain.
HeBIS-PPN:206937660
Institute:keine Angabe Fachbereich / Extern
DDC-Klassifikation:4 Sprache / 40 Sprache / 400 Sprache
Sammlungen:Linguistik
Linguistik-Klassifikation:Linguistik-Klassifikation: Computerlinguistik / Computational linguistics
Lizenz (Deutsch):License LogoDeutsches Urheberrecht