56 search hits
-
Die thematische Erschließung von Sprachkorpora
(2005)
-
Christian Weiß
- Ziel des Teilprojekts ist die thematische Erschließung der Korpora, um sowohl themenspezifische virtuelle Subkorpora zusammenstellen zu können als auch aufgrund der Analyse sachgebietsbezogener Häufigkeitsverteilungen z.B. Lesarten disambiguieren zu können. Ausgangspunkt ist die Erstellung einer Taxonomie von Sachgebietsthemen. Dies erfolgt in einem semiautomatischen Verfahren, welches die Anwendung von Textmining (Dokumentclustering) und die manuelle Zuordnung von Clustern in eine externen Ontologie beinhaltet. Es wird argumentiert, dass die so gewonnene Taxonomie sowohl intuitiver als auch objektiver ist als bestehende, rein manuelle Ansätze. Sie eignet sich zudem gleichermaßen für manuelle als auch für maschinelle Klassifikation. Für letzteres wird der Naive Bayes'sche Textklassifikator motiviert und für ein klassifiziertes Korpus von knapp zwei Milliarden Wörtern evaluiert.
-
Schritte zur Aufhellung des Sprachräthsels betreffend indo-europäische Sprachwurzeln : entwickelt nach physiologischen Principien
(1868)
-
Jacob Walser
-
Deutsch im Kreis Schanfigg
(2012)
-
Alfred Toth
- In dieser Arbeit wird unter Schanfigg nach Kessler "Schanfigg im weitern Sinne" verstanden, d.h. die Dörfer des politischen Kreises Schanfigg [...]. Da Dialekte im Gegensatz zu Hochsprachen nicht-normierte Sprachvarietäten darstellen, zeichnen sich die Ortsgrammatiken durch eine jeweils enorme Formenvielfalt in lautlicher und in morphologischer Hinsicht aus. Dies war denn auch eines der Ziele der Untersuchung: Mit Hilfe der Prager Phonologie und der auf ihr beruhenden Morphologie sollte aufgezeigt werden, wie groß die allophonische und allomorphische Bandbreite ist, derer sich die Sprecher im Gespräch unbewußt bedienen. Sehr schön läßt sich dies anhand der Verbalmorphologie bei den unregelmäßigen Verben (Kurzverben) aufzeigen. Ein weiteres Ziel der Untersuchung war es, die Stellung der Ortsdialekte des Schanfiggs und ihres Gesamts, also das Schanfigger Diasystem, innerhalb der dem Schanfigg benachbarten Mundarten darzustellen. Idealerweise hätten das Prättigau, das Churwaldner Tal und die Churer bzw. Churerrheintaler Mundarten herangezogen werden müssen. Da aber leider keine Untersuchungen zu den Verhältnissen im Prättigau und im Churwaldner Tal vorhanden sind, wurden die Schanfigger Verhältnisse mit denjenigen der Stadt Chur (vgl. Eckhardt 1991) und des Deutschen im Bezirk Imboden (vgl. Toth und Ebneter 1996) verglichen.
-
Kontextuelle Variabilität synonymer Relationen
(2006)
-
Petra Storjohann
- Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko-Korpus, gewonnen wurden. Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
-
[Kurtze und gründliche Anweisung zur deutschen Sprache ...] Christ. Ernst Steinbachs kurtze und gründliche Anweisung zur deutschen Sprache : vel Succincta & perfecta Grammatica linguae Germanicae Nova methodo tradita
(1724)
-
Christoph Ernst Steinbach
-
JACY - A Grammar for Annotating Syntax, Semantics and Pragmatics of Written and Spoken Japanese for NLP Application Purposes
(2006)
-
Melanie Siegel
- In this text, we describe the development of a broad coverage grammar for Japanese that has
been built for and used in different application contexts. The grammar is based on work done
in the Verbmobil project (Siegel 2000) on machine translation of spoken dialogues in the
domain of travel planning. The second application for JACY was the automatic email
response task. Grammar development was described in Oepen et al. (2002a). Third, it was
applied to the task of understanding material on mobile phones available on the internet, while
embedded in the project DeepThought (Callmeier et al. 2004, Uszkoreit et al. 2004).
Currently, it is being used for treebanking and ontology extraction from dictionary definition
sentences by the Japanese company NTT (Bond et al. 2004).
-
Dutch nominalised infinitives as non-identical twins
(2002)
-
Maaike Schoorlemmer
- Dutch nominalised infinitives have been notoriously difficult to analyse, partly because they seem to show mixed verbal and nominal properties interspersed across the structure. In this paper, it is argued that at least two types of such infinitives should be distinguished, one which contains a high level of verbal functional structure, and one that differs at least in not projecting TP. On the basis of this distinction it is possible to show that Dutch nominalised infinitives have much more predictable properties than could previously be identified. They show evidence of conforming to a model of analysing mixed categories in terms of category switch within the constituent. In order to account for the seemingly interspersed nature of nominal and verbal properties in Dutch nominalised infinitives I propose that Dutch of-phrases (van-phrases) may merge inside the VP, provided they have access to nominal functional structure for feature checking. I will show that if D° is filled by a special type of non-deictic demonstratives van-phrases may even occur in SpecDP.
-
The meaning of chains
(1998)
-
Uli Sauerland
- This thesis investigates the mechanisms applying in the interpretation of syntactic chains. The theoretical background includes a translation of syntactic forms into semantic forms and a model theoretic explication of the meaning of semantic forms. Simplicity considerations apply to all three stages of the interpretation process: syntactic derivation, translation into semantic forms, interpretation of semantic forms. Three main results are achieved. The first is that trace positions can have semantic content beyond what is needed for the semantic dependency of trace and binder. This extra content is some or all of the lexical material of the head of the chain, as expected on the copy theory of movement. Two independent arguments support this conclusion. One, discussed in chapter 2, is based on the distribution of Condition C effects, where novel interactions between variable binding, antecedent contained deletion and Condition C are observed. The second, developed in chapter 3, is based on conditions on the identity of traces observed in antecedent contained deletion constructions. Both arguments lead to the same generalizations about what lexical material of the head is interpreted in the trace position. The second main result is that lambda calculus is superior to both standard predicate logic and combinatorial logic as the mathematical model for the semantic mechanism mediating the dependency of trace (or bound pronoun) and binder. Chapter 4 argues this on the basis of the distribution of focus and destressing in constructions with bound pronouns. The third main result is that quantification must be allowed to range over pointwise different choice functions. Chapter 5 shows that quantification over individuals is insufficient, and that pointwise different choice functions are required. The result entails that the syntactic difference of A-chains and A-bar chains predicts a semantic difference in the type of the variable involved, which is argued to explain weak crossover phenomena. Chapters 6 argues that the interpretation procedures developed in the preceeding chapters account for all cases. It is shown that only traces of the type of individuals arise, and that scope reconstruction is a phonological phenomenon. The latter result also supports the T-model of syntax.
-
The consonant phonemes of Proto-East-Cushitic (PEC) : a first approximation
(1979)
-
Hans-Jürgen Sasse
- This paper is a preliminary attempt to reconstruct the consonant system of Proto-East-Cushitic (PEC) , one of the four branches of the Cushitic family. Data are taken from some twenty-odd languages including unpublished material on a variety of hitherto little known languages. After discussing a number of general problems raised by the phonological comparison of the East Cushitic languages, 23 consonants are reconstructed for the inventory of the proto-language and the evidence for the reconstructions is presented in the form of cognate sets and correspondence rules which map the proto-phonemes onto the individual reflexes. The method employed is that of comparative linguistics as traditionally employed in Indo-European linguistics.
-
Resumptive Prolepsis : a study in indirect A´-dependencies
(2006)
-
Martin Salzmann