Entwicklung einer digitalen Korpusanwendung zur türkeitürkischen Dialektologie

  • Inhalt dieser Arbeit ist die Entwicklung einer digitalen Korpusanwendung zur türkeitürkischen Dialektologie, in welcher der Inhalt des in Kapitel 3.1 beschriebenen Wörterbuchs komplett enthalten und umfangreich durchsuchbar sein soll. Da das Dialektwörterbuch insgesamt 126.468 Einträge enthält, ist eine manuelle Recherche darin äußerst zeitintensiv und unkomfortabel. Selbst die Suche innerhalb einer digitalen Version, die z. B. in einer Word-Datei gespeichert sein kann, ist nicht komfortabel möglich, sobald Optionen bzw. Einschränkungen getätigt werden sollen, wie z. B. die Beschränkung der Ergebnisse auf das Vorkommen in einer bestimmten Provinz. Daher ist es das Ziel der Entwicklung, den Anwendern folgende Suchmöglichkeiten zu bieten: Das Wörterbuch soll entweder komplett im Volltext durchsucht werden können, oder nur innerhalb des Lemmas1. Dabei soll jeweils die Angabe einer oder mehrerer Provinzen möglich sein, sodass die Suchergebnisse nur jene Einträge beinhalten, in denen Suchbegriff und Provinz in der gleichen Zeile enthalten sind. Die Treffer der Suche sollen farbig hervorgehoben sein, damit insbesondere bei großen Wörterbucheinträgen nicht manuell nach den darin enthaltenen Suchbegriffen gesucht werden muss, sondern diese dem Anwender direkt auffallen. Außerdem ist es wünschenswert, mittels Platzhaltern und sogenannten Coversymbolen nach Wortformen und phonetisch bedingten Allomorphen suchen zu können. Letzteres ist für Linguisten, die sich mit dem Türkischen beschäftigen, bei der Eingabe der Suchbegriffe äußerst praktisch, da das Türkische eine vokalharmonische Sprache ist, in der phonetisch bedingte Varianten üblicherweise durch die Schreibung mit Coversymbolen dargestellt werden: z. B. -lAr für die Pluralallomorphe -lar und -ler...
  • The present paper is the written and mainly theoretical part of the master thesis „developement of a digital corpus application to the dialectology of Turkish of Turkey“. The thesis' ambition is to create a useful linguistical tool and to spark linguists' interest in creating corpora and working with them. First the work's aims and some important definitions are given in chapter one. The second chapter then deals with the linguistic relevance of corpus linguistics. Furthermore, the current state of the art with respect to Turkish corpora is given. The main part of this paper follows afterwards in chapter three. In this section the dictionary of dialects of Turkey, called „Derleme Sözlüğü“, as the basic of the corpus, is described in detail. Additionally, a complete user manual as well as two examples of the application's linguistic benefits are presented. Chapter four deals with the technical side of the thesis, however, it does not go into its depth, since for this purpose the commented source code is contained in the appendix. Finally, the conclusion and an outlook on future works of this kind are given in the fifth chapter.

Download full text files

Export metadata

Metadaten
Author:Manuel Raaf
URN:urn:nbn:de:hebis:30:3-277516
Referee:Uwe Bläsing, Uwe Bläsing
Advisor:Uwe Bläsing, Uwe Bläsing
Document Type:Master's Thesis
Language:German
Date of Publication (online):2013/01/09
Year of first Publication:2012
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2012/03/12
Release Date:2013/01/09
Tag:Dialektologie; Korpus; Korpusanwendung; Korpuslinguistik; Türkisch
Derleme Sözlüğü; Turkey; Turkish; application; corpora; corpus; corpus application; corpus linguistics; developement; dialectology; dictionary
Page Number:IV, 52
Note:
Der in der Arbeit erwähnte Zugang zur Anwendung kann aus urheberrechtlichen Gründen nur Angehörigen des Instituts für Empirische Sprachwissenschaft gewährt werden.
HeBIS-PPN:315196335
Institutes:Sprach- und Kulturwissenschaften / Sprachwissenschaften
Dewey Decimal Classification:4 Sprache / 49 Andere Sprachen / 490 Andere Sprachen
Sammlungen:Universitätspublikationen
Licence (German):License LogoDeutsches Urheberrecht