56 search hits
-
Deutsche Rundfunksprache in mehrsprachiger Umwelt : am Beispiel der Verwendung von Phraseologismen
(1995)
-
Csaba Földes
Andrea Hécz
-
Resumptive Prolepsis : a study in indirect A´-dependencies
(2006)
-
Martin Salzmann
-
The consonant phonemes of Proto-East-Cushitic (PEC) : a first approximation
(1979)
-
Hans-Jürgen Sasse
- This paper is a preliminary attempt to reconstruct the consonant system of Proto-East-Cushitic (PEC) , one of the four branches of the Cushitic family. Data are taken from some twenty-odd languages including unpublished material on a variety of hitherto little known languages. After discussing a number of general problems raised by the phonological comparison of the East Cushitic languages, 23 consonants are reconstructed for the inventory of the proto-language and the evidence for the reconstructions is presented in the form of cognate sets and correspondence rules which map the proto-phonemes onto the individual reflexes. The method employed is that of comparative linguistics as traditionally employed in Indo-European linguistics.
-
Das Konzept der Inhaltsstruktur : eine Auseinandersetzung mit dem Konzept der Mikrostrukturen im Kontext der Modellierung einer lexikografischen Datenbasis
(2006)
-
Carolin Müller-Spitzer
- Wenn man heute neue lexikografische Projekte plant, ist es unerlässlich, sowohl den Computer als Arbeitswerkzeug, als auch das elektronische Medium als Publikationsmedium in die Konzeption einzubeziehen. Dabei ist es oft erwünscht, die einmal erarbeiteten lexikografischen Daten mehrfach zu verwerten, sei es als gedruckte und elektronische Version eines Wörterbuchs, sei es einmal als eine lange und kurze Ausführung eines lexikografischen Produkts oder als eine ausschließlich elektronische, aber benutzeradaptiv unterschiedliche Darstellung der gleichen lexikografischen Daten. (Vgl. u.a. Schryver 2003, Storrer 2001, Engelberg/Lemnitzer 2001, S. 220ff.) Solche Wünsche sind mit den heutigen Möglichkeiten des Computereinsatzes zu erfüllen, doch müssen die lexikografischen Prozesse entsprechend geplant werden. Vor allem die Frage der Strukturierung und Aufbereitung der lexikografischen Daten muss sorgfältig überlegt sein, denn hierbei wird der Grundstein dafür gelegt, wie flexibel auf die Daten zugegriffen werden kann und wie unterschiedlich darstellbar sie sind. Für einen inhaltlich wie gestalterisch möglichst flexiblen Umgang mit lexikografischen Daten ist daher eine bestimmte Form der Datenmodellierung und -auszeichnung erforderlich. Das Stichwort, das in diesem Zusammenhang immer wieder fällt, ist das der medienneutralen Datenhaltung. Doch wie müssen lexikografische Daten ausgezeichnet werden, damit diese Kodierung losgelöst von den Eigenschaften einer bestimmten Präsentation ist? Welche Richtlinien können hier projektübergreifend angewandt werden? Die moderne Wörterbuchforschung gibt darauf noch keine hinreichenden Antworten. Vor allem fehlen klare, theoretisch fundierte und intersubjektiv nachvollziehbare Richtlinien für die maßgeschneiderte Modellierung lexikografischer Daten. Denn oft ist es in lexikografischen Projekten nicht möglich, eine Standard-Modellierung wie die TEI2 oder leXeML3 anzuwenden, da diese kein ausreichend granulares und maßgeschneidertes Modellierungsinventar bieten, um die lexikografischen Daten später sehr flexibel darstellen zu können und verschiedenartige Zugriffsstrukturen zu bieten. Doch auch bei der Entwicklung einer maßgeschneiderten Modellierung ist es wichtig, einen klaren Leitfaden für die Datenmodellierung zu haben, um nicht bei jedem Phänomen neu entscheiden zu müssen, wie die Modellierung aussehen soll. Ziel dieses Aufsatzes ist es daher, ein Konzept vorzustellen, welche Eigenschaften lexikografischer Daten Gegenstand für eine Modellierung einer lexikografischen Datenbasis sein sollen, wie eine solche Modellierung aussehen kann und schließlich auch, welche Folgen diese Art der Modellierung für die lexikografische Praxis hat. Ein wichtiger Teil dieses Konzepts der Inhaltsstrukturen ist dabei auch die Entwicklung und Ausgestaltung einer eigenen Terminologie; auch in Abgrenzung zu Wiegands Konzept der Mikrostrukturen (vgl. Abschnitt 5).
-
Für und wider : fex- 'wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist.' ; Ergänzung zu III <PHIL>, „Semantisches Paradigma“, Teilsynonyme
(2007)
-
Gabriele Hoppe
- Die Monografie befasst sich mit der scherzhaften Wortbildungseinheit -fex 'wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist' (Kunstfex), nachgewiesen seit dem späteren 19. Jahrhundert im deutschen Sprachraum, herausgebildet aus überregional durch literarische Vermittlung bekannt gewordenen regionalsprachlichen (bayerischen und österreichischen) Komposita mit dem Substantiv Fex (Bergfex, Blüemlfex). Die Herkunft von Fex und damit auch von -fex ist bis heute ungesichert. Seit jüngerer Zeit nun wird |fex| in einen bestimmten etymologischen Zusammenhang mit dem lateinischen Suffix -i-fex (zu lateinisch facere 'machen') gebracht. |fex| wird auf das so genannte scherzlateinische Narefex zurückgeführt, das schon früher als Analogiebildung zu lateinischen Wörtern wie artifex und carnifex betrachtet wurde. Ungeachtet dieser problematischen etymologischen Herleitung stehen im Deutschen gebildete Wörter auf -fex (Küchenfex) und aus dem Lateinischen ins Deutsche entlehnte (Pontifex), auch im Deutschen und anderen europäischen Sprachen gebildete Wörter auf -i-fex (Gillifex, Zotifex, Spinifex und Tubifex) im heutigen Deutsch eigentümlich nebeneinander. Semantische Ähnlichkeiten scheinen sich mitunter zu zeigen (Versifex vs. Reimfex). Zunächst konnotative, dann integrative formale Eindeutschungen von Wörtern auf -i-fex verwischen die weitere Unterscheidung beider Gruppen (die Pluralformen Artifexe, Dramatifexe, Hexametrifexe, Pontifexe, Tubifexe und Versifexe vs. Steinfexe statt der Formen auf -i-fices). Es ist denkbar, dass deutende Sprachteilhaber von nur einer Gruppe von Wörtern bei gegebener Fugenvarianz ausgehen - wie sie bei fortschreitender Integration von Lehnkombinemen für deutsche Lehn-Wortbildungsprodukte nachweisbar ist (Bieriothek, Comicothek vs. Donnerthek, Rockthek). Die Arbeit versucht, die Entwicklung der beiden Wortbildungseinheiten -fex und -i-fex im Deutschen darzustellen und einen wortgeschichtlichen, dokumentationsgestützten Überblick über die relevanten Lehnwörter und (Lehn-)Wortbildungsprodukte zu geben. Inhalt: Register. Überblick. 1.-fex und -i-fex, eine Art etymologischer Dublette? 1.1 Lateinische Wörter mit dem Suffix -i-fex. Deutsche Lehnwörter aus dem Lateinischen und Neulateinischen mit dem Segment |ifex|. 1.2 Das Kombinem -i-fex in deutschen (europäischen) Lehn-Wortbildungsprodukten. 1.3 Ungeklärte frühe deutsche Wortbildungsprodukte mit der Sequenz ...fex. 1.4 Fex, Kürzung aus Narefex als „gesunkenem Kulturgut“? „Scherzlateinischer“ Ausgangspunkt Narefex für die Herausbildung des oberdeutschen Lexems Fex und in der Folge der deutschen Wortbildungseinheit -fex ‘wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist’? 1.5 Das Substantiv Fex in oberdeutschen Regionalsprachen. 1.6 -fex- und -i-fex-/|ifex| Wörter. Ihre ‘Übereinstimmungen’. 1.6.1 Zufällige semantische Ähnlichkeit. 1.6.2 Bedingte weitere formale Übereinstimmung. Pluralformen der Sequenz ...fexe. 1.6.3 Mögliche scherzhafte Zusammenbildung. 2. Artikel- und Belegteil für alle Gruppen von Wörtern der Sequenz ...fex (in chronologischer Ordnung). 3. Anmerkungen. 4. Literatur. 5. Quellenverzeichnis. 6. Siglen für die Komponenten der Materialbasis
-
Die thematische Erschließung von Sprachkorpora
(2005)
-
Christian Weiß
- Ziel des Teilprojekts ist die thematische Erschließung der Korpora, um sowohl themenspezifische virtuelle Subkorpora zusammenstellen zu können als auch aufgrund der Analyse sachgebietsbezogener Häufigkeitsverteilungen z.B. Lesarten disambiguieren zu können. Ausgangspunkt ist die Erstellung einer Taxonomie von Sachgebietsthemen. Dies erfolgt in einem semiautomatischen Verfahren, welches die Anwendung von Textmining (Dokumentclustering) und die manuelle Zuordnung von Clustern in eine externen Ontologie beinhaltet. Es wird argumentiert, dass die so gewonnene Taxonomie sowohl intuitiver als auch objektiver ist als bestehende, rein manuelle Ansätze. Sie eignet sich zudem gleichermaßen für manuelle als auch für maschinelle Klassifikation. Für letzteres wird der Naive Bayes'sche Textklassifikator motiviert und für ein klassifiziertes Korpus von knapp zwei Milliarden Wörtern evaluiert.
-
Kontextuelle Variabilität synonymer Relationen
(2006)
-
Petra Storjohann
- Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko-Korpus, gewonnen wurden. Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
-
Lexikografische Portale im Internet
(2008)
-
Annette Klosa
-
Sprachliche Variabilität des Deutschen und ihre Erfassung mit Methoden der automatischen Spracherkennung
(2005)
-
Nina Berend
Stefan Kleiner
Ralf Knöbl
- Die Datenbank wird auf den Ergebnissen der Analyse einschlägiger umfangreicher Korpora des gesprochenen Deutsch basieren. Um jedoch große Korpora analysieren zu können, ist es notwendig, automatische Analyseverfahren der Variation zu entwickeln. Mit traditionellen manuellen Methoden kann der Aufbau einer korpusbasierten Datenbank kaum verwirklicht werden. Dem eigentlichen Variationsprojekt wurde daher eine kleine Pilotstudie vorgeschaltet, die die Möglichkeiten der automatischen Analyse prüfen sollte. Dabei wurde der Frage nachgegangen, ob es möglich ist, regionale Varianten des Deutschen mit Verfahren der automatischen Spracherkennung zu untersuchen, d.h., ob es möglich ist, eine verlässliche Transkription der regionalen Varianten automatisch herzustellen. Diese Pilotstudie zur automatischen Transkription stützte sich auf das im IDS bereits vorhandene System SPRAT (Speech Recognition and Alignment Tool), das zum Alignieren (Text-Ton-Synchronisation) verwendet wird. Im Rahmen der Pilotstudie wurde dieses System modifiziert und in einer Reihe von Tests dessen automatische Transkription evaluiert (vgl. Abschnitt 3). Das Ziel des vorliegenden Beitrags ist es, die Ergebnisse dieser Pilotstudie vorzustellen. Zunächst aber soll ein kurzer Exkurs verdeutlichen, um welches System es sich beim IDS-Aligner SPRAT handelt.
-
The meaning of chains
(1998)
-
Uli Sauerland
- This thesis investigates the mechanisms applying in the interpretation of syntactic chains. The theoretical background includes a translation of syntactic forms into semantic forms and a model theoretic explication of the meaning of semantic forms. Simplicity considerations apply to all three stages of the interpretation process: syntactic derivation, translation into semantic forms, interpretation of semantic forms. Three main results are achieved. The first is that trace positions can have semantic content beyond what is needed for the semantic dependency of trace and binder. This extra content is some or all of the lexical material of the head of the chain, as expected on the copy theory of movement. Two independent arguments support this conclusion. One, discussed in chapter 2, is based on the distribution of Condition C effects, where novel interactions between variable binding, antecedent contained deletion and Condition C are observed. The second, developed in chapter 3, is based on conditions on the identity of traces observed in antecedent contained deletion constructions. Both arguments lead to the same generalizations about what lexical material of the head is interpreted in the trace position. The second main result is that lambda calculus is superior to both standard predicate logic and combinatorial logic as the mathematical model for the semantic mechanism mediating the dependency of trace (or bound pronoun) and binder. Chapter 4 argues this on the basis of the distribution of focus and destressing in constructions with bound pronouns. The third main result is that quantification must be allowed to range over pointwise different choice functions. Chapter 5 shows that quantification over individuals is insufficient, and that pointwise different choice functions are required. The result entails that the syntactic difference of A-chains and A-bar chains predicts a semantic difference in the type of the variable involved, which is argued to explain weak crossover phenomena. Chapters 6 argues that the interpretation procedures developed in the preceeding chapters account for all cases. It is shown that only traces of the type of individuals arise, and that scope reconstruction is a phonological phenomenon. The latter result also supports the T-model of syntax.