Linguistik
Refine
Year of publication
Document Type
- Book (108) (remove)
Language
- German (60)
- English (26)
- Portuguese (9)
- mis (5)
- Multiple languages (5)
- French (2)
- Danish (1)
Has Fulltext
- yes (108) (remove)
Is part of the Bibliography
- no (108)
Keywords
- Mosambik (14)
- Mozambique (14)
- Moçambique (14)
- Deutsch (8)
- Dialektologie (8)
- Computerlinguistik (7)
- Grammatik (7)
- Alphabet (6)
- Aussprache (6)
- Japanisch (6)
Institute
- Extern (24)
- Sprachwissenschaften (2)
- Universitätsbibliothek (2)
- Gesellschaftswissenschaften (1)
- Neuere Philologien (1)
Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko-Korpus, gewonnen wurden. Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
Ziel des Teilprojekts ist die thematische Erschließung der Korpora, um sowohl themenspezifische virtuelle Subkorpora zusammenstellen zu können als auch aufgrund der Analyse sachgebietsbezogener Häufigkeitsverteilungen z.B. Lesarten disambiguieren zu können. Ausgangspunkt ist die Erstellung einer Taxonomie von Sachgebietsthemen. Dies erfolgt in einem semiautomatischen Verfahren, welches die Anwendung von Textmining (Dokumentclustering) und die manuelle Zuordnung von Clustern in eine externen Ontologie beinhaltet. Es wird argumentiert, dass die so gewonnene Taxonomie sowohl intuitiver als auch objektiver ist als bestehende, rein manuelle Ansätze. Sie eignet sich zudem gleichermaßen für manuelle als auch für maschinelle Klassifikation. Für letzteres wird der Naive Bayes'sche Textklassifikator motiviert und für ein klassifiziertes Korpus von knapp zwei Milliarden Wörtern evaluiert.
Die Monografie befasst sich mit der scherzhaften Wortbildungseinheit -fex 'wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist' (Kunstfex), nachgewiesen seit dem späteren 19. Jahrhundert im deutschen Sprachraum, herausgebildet aus überregional durch literarische Vermittlung bekannt gewordenen regionalsprachlichen (bayerischen und österreichischen) Komposita mit dem Substantiv Fex (Bergfex, Blüemlfex). Die Herkunft von Fex und damit auch von -fex ist bis heute ungesichert. Seit jüngerer Zeit nun wird |fex| in einen bestimmten etymologischen Zusammenhang mit dem lateinischen Suffix -i-fex (zu lateinisch facere 'machen') gebracht. |fex| wird auf das so genannte scherzlateinische Narefex zurückgeführt, das schon früher als Analogiebildung zu lateinischen Wörtern wie artifex und carnifex betrachtet wurde. Ungeachtet dieser problematischen etymologischen Herleitung stehen im Deutschen gebildete Wörter auf -fex (Küchenfex) und aus dem Lateinischen ins Deutsche entlehnte (Pontifex), auch im Deutschen und anderen europäischen Sprachen gebildete Wörter auf -i-fex (Gillifex, Zotifex, Spinifex und Tubifex) im heutigen Deutsch eigentümlich nebeneinander. Semantische Ähnlichkeiten scheinen sich mitunter zu zeigen (Versifex vs. Reimfex). Zunächst konnotative, dann integrative formale Eindeutschungen von Wörtern auf -i-fex verwischen die weitere Unterscheidung beider Gruppen (die Pluralformen Artifexe, Dramatifexe, Hexametrifexe, Pontifexe, Tubifexe und Versifexe vs. Steinfexe statt der Formen auf -i-fices). Es ist denkbar, dass deutende Sprachteilhaber von nur einer Gruppe von Wörtern bei gegebener Fugenvarianz ausgehen - wie sie bei fortschreitender Integration von Lehnkombinemen für deutsche Lehn-Wortbildungsprodukte nachweisbar ist (Bieriothek, Comicothek vs. Donnerthek, Rockthek). Die Arbeit versucht, die Entwicklung der beiden Wortbildungseinheiten -fex und -i-fex im Deutschen darzustellen und einen wortgeschichtlichen, dokumentationsgestützten Überblick über die relevanten Lehnwörter und (Lehn-)Wortbildungsprodukte zu geben. Inhalt: Register. Überblick. 1.-fex und -i-fex, eine Art etymologischer Dublette? 1.1 Lateinische Wörter mit dem Suffix -i-fex. Deutsche Lehnwörter aus dem Lateinischen und Neulateinischen mit dem Segment |ifex|. 1.2 Das Kombinem -i-fex in deutschen (europäischen) Lehn-Wortbildungsprodukten. 1.3 Ungeklärte frühe deutsche Wortbildungsprodukte mit der Sequenz ...fex. 1.4 Fex, Kürzung aus Narefex als „gesunkenem Kulturgut“? „Scherzlateinischer“ Ausgangspunkt Narefex für die Herausbildung des oberdeutschen Lexems Fex und in der Folge der deutschen Wortbildungseinheit -fex ‘wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist’? 1.5 Das Substantiv Fex in oberdeutschen Regionalsprachen. 1.6 -fex- und -i-fex-/|ifex| Wörter. Ihre ‘Übereinstimmungen’. 1.6.1 Zufällige semantische Ähnlichkeit. 1.6.2 Bedingte weitere formale Übereinstimmung. Pluralformen der Sequenz ...fexe. 1.6.3 Mögliche scherzhafte Zusammenbildung. 2. Artikel- und Belegteil für alle Gruppen von Wörtern der Sequenz ...fex (in chronologischer Ordnung). 3. Anmerkungen. 4. Literatur. 5. Quellenverzeichnis. 6. Siglen für die Komponenten der Materialbasis
Wenn man heute neue lexikografische Projekte plant, ist es unerlässlich, sowohl den Computer als Arbeitswerkzeug, als auch das elektronische Medium als Publikationsmedium in die Konzeption einzubeziehen. Dabei ist es oft erwünscht, die einmal erarbeiteten lexikografischen Daten mehrfach zu verwerten, sei es als gedruckte und elektronische Version eines Wörterbuchs, sei es einmal als eine lange und kurze Ausführung eines lexikografischen Produkts oder als eine ausschließlich elektronische, aber benutzeradaptiv unterschiedliche Darstellung der gleichen lexikografischen Daten. (Vgl. u.a. Schryver 2003, Storrer 2001, Engelberg/Lemnitzer 2001, S. 220ff.) Solche Wünsche sind mit den heutigen Möglichkeiten des Computereinsatzes zu erfüllen, doch müssen die lexikografischen Prozesse entsprechend geplant werden. Vor allem die Frage der Strukturierung und Aufbereitung der lexikografischen Daten muss sorgfältig überlegt sein, denn hierbei wird der Grundstein dafür gelegt, wie flexibel auf die Daten zugegriffen werden kann und wie unterschiedlich darstellbar sie sind. Für einen inhaltlich wie gestalterisch möglichst flexiblen Umgang mit lexikografischen Daten ist daher eine bestimmte Form der Datenmodellierung und -auszeichnung erforderlich. Das Stichwort, das in diesem Zusammenhang immer wieder fällt, ist das der medienneutralen Datenhaltung. Doch wie müssen lexikografische Daten ausgezeichnet werden, damit diese Kodierung losgelöst von den Eigenschaften einer bestimmten Präsentation ist? Welche Richtlinien können hier projektübergreifend angewandt werden? Die moderne Wörterbuchforschung gibt darauf noch keine hinreichenden Antworten. Vor allem fehlen klare, theoretisch fundierte und intersubjektiv nachvollziehbare Richtlinien für die maßgeschneiderte Modellierung lexikografischer Daten. Denn oft ist es in lexikografischen Projekten nicht möglich, eine Standard-Modellierung wie die TEI2 oder leXeML3 anzuwenden, da diese kein ausreichend granulares und maßgeschneidertes Modellierungsinventar bieten, um die lexikografischen Daten später sehr flexibel darstellen zu können und verschiedenartige Zugriffsstrukturen zu bieten. Doch auch bei der Entwicklung einer maßgeschneiderten Modellierung ist es wichtig, einen klaren Leitfaden für die Datenmodellierung zu haben, um nicht bei jedem Phänomen neu entscheiden zu müssen, wie die Modellierung aussehen soll. Ziel dieses Aufsatzes ist es daher, ein Konzept vorzustellen, welche Eigenschaften lexikografischer Daten Gegenstand für eine Modellierung einer lexikografischen Datenbasis sein sollen, wie eine solche Modellierung aussehen kann und schließlich auch, welche Folgen diese Art der Modellierung für die lexikografische Praxis hat. Ein wichtiger Teil dieses Konzepts der Inhaltsstrukturen ist dabei auch die Entwicklung und Ausgestaltung einer eigenen Terminologie; auch in Abgrenzung zu Wiegands Konzept der Mikrostrukturen (vgl. Abschnitt 5).
This paper is a preliminary attempt to reconstruct the consonant system of Proto-East-Cushitic (PEC) , one of the four branches of the Cushitic family. Data are taken from some twenty-odd languages including unpublished material on a variety of hitherto little known languages. After discussing a number of general problems raised by the phonological comparison of the East Cushitic languages, 23 consonants are reconstructed for the inventory of the proto-language and the evidence for the reconstructions is presented in the form of cognate sets and correspondence rules which map the proto-phonemes onto the individual reflexes. The method employed is that of comparative linguistics as traditionally employed in Indo-European linguistics.