Linguistik
Refine
Year of publication
Document Type
- Book (60) (remove)
Language
- German (60) (remove)
Has Fulltext
- yes (60)
Is part of the Bibliography
- no (60)
Keywords
- Dialektologie (8)
- Deutsch (6)
- Mittelhessisch (4)
- Schweizerdeutsch (4)
- Feldlinguistik (3)
- Mundart (3)
- Sprachwandel (3)
- Bibliographie (2)
- Chur (2)
- Computerlinguistik (2)
Institute
- Extern (5)
- Sprachwissenschaften (2)
- Universitätsbibliothek (2)
- Gesellschaftswissenschaften (1)
1. Für die Vertretung eines eine Nebenhandlung einführenden zweiten Rhemas im Satz lassen sich drei Haupttypen aufstellen: a) "finiter" Typus mit der fast ausschließlichen Vertretung durch Nebensätze; b) "nominaler" Typus mit der Vertretung durch Nominalbildungen, wie Partizipien und Verbalnomina, letztere mit vollständigem Paradigma und genitivischer Patiensbehandlung; c) "infinitivischer" Typus mit der Vertretung durch sogenannte "infinitivische Bildungen", die sich nach formalen und junktionalen Kriterien von den finiten Bildungen abtrennen lassen. Innerhalb der Haupttypen, spez. (da auf idg. Sprachraum dominant) innerhalb des "infinitivischen" Typus lassen sich die Einzelsprachen bzw. Sprachfamilien in Untertypen-Gruppen zusammenfassen. Dabei gibt es einheitliche und Misch-Typen, je nachdem, ob "infinitivische Bildungen" gleicher oder verschiedener Ausprägung vertreten sind. 2. Die Stufen entsprechen Zuständen auf dem Wege zur Erstarrung von rein nominalen Bildungen zu dem verbalen System zugeordneten "infinitivischen" Formen. Die Erstarrung eines nominalen Kasus zu einern "Absolutiv", d.h. einer nicht-nominalen und nicht-finiten Form mit koinzidenter Funktion (die Gleichzeitigkeit des zweiten Rhemas mit dem Prädikat angibt), hängt dabei an der Ubernabrne akkusativischer Rektion sowie der Herauslösung der Form aus dem paradigmatischen Zusammenhang. Die Erstarrung eines nominalen Kasus zu einem ("erweiterten") "Infinitiv", d.h. einer nicht-nominalen und nicht-finiten Form in mehreren syntaktischen und semantischen Funktionen (Subjekts- und Objektsfunktion, iussive und historische Funktion, hauptsächlich aber finale Funktion) zeigt sich ebenfalls an der Übernahrne akkusativischer Rektion und der Herauslösung aus dem Paradigma; dazu kommt aber noch, daß sich der Weg von der Abdeckung einer Funktion zu der mehrerer Funktionen bei dieser Formation nachvollziehen läßt: 3. Zu "Infinitiven" erstarrende Formen stehen ursprünglich in finaler Funktion. Der Übergang in die Objekts- bzw. Subjektsfunktion erfolgt in Verbindung mit prädikaten, die von solchen Verben repräsentiert werden, die der Form ihre finale Konnotation belassen, die aber gleichzeitig die Interpretation der Form als ("patientisches") Objekt bzw. als Subjekt ermöglichen. Dies ist der Fall bei vielen Verben, die man als "Modalverben" bezeichnen kann. Die Erstarrung der "infinitivischen" Formation ist vollzogen, wo die Interpretation als Objekt bzw. Subjekt obsiegt; hier kann die Form ins temporale wie diathetische System eingeordnet werden, und auch andere Funktionen abdecken. 4. Der Verlust der finalen Konnotation der Form macht es erforderlich, für die finale Funktion eine neue Vertretung zu bilden. Soweit hierzu wieder nominale, zu "Infinitiven" Übergehende Bildungen verwendet werden, liegt eine Restitution des durch den Haupttypus bestimmten Systems vor; ein Haupttypuswechsel, angezeigt durch die neue Abdeckung speziell der finalen Funktion durch Nebensätze, ist für den idg. Sprachraum selten (liegt z.B. beim Übergang vom Agr. zum Ngr. vor).
Die Datenbank wird auf den Ergebnissen der Analyse einschlägiger umfangreicher Korpora des gesprochenen Deutsch basieren. Um jedoch große Korpora analysieren zu können, ist es notwendig, automatische Analyseverfahren der Variation zu entwickeln. Mit traditionellen manuellen Methoden kann der Aufbau einer korpusbasierten Datenbank kaum verwirklicht werden. Dem eigentlichen Variationsprojekt wurde daher eine kleine Pilotstudie vorgeschaltet, die die Möglichkeiten der automatischen Analyse prüfen sollte. Dabei wurde der Frage nachgegangen, ob es möglich ist, regionale Varianten des Deutschen mit Verfahren der automatischen Spracherkennung zu untersuchen, d.h., ob es möglich ist, eine verlässliche Transkription der regionalen Varianten automatisch herzustellen. Diese Pilotstudie zur automatischen Transkription stützte sich auf das im IDS bereits vorhandene System SPRAT (Speech Recognition and Alignment Tool), das zum Alignieren (Text-Ton-Synchronisation) verwendet wird. Im Rahmen der Pilotstudie wurde dieses System modifiziert und in einer Reihe von Tests dessen automatische Transkription evaluiert (vgl. Abschnitt 3). Das Ziel des vorliegenden Beitrags ist es, die Ergebnisse dieser Pilotstudie vorzustellen. Zunächst aber soll ein kurzer Exkurs verdeutlichen, um welches System es sich beim IDS-Aligner SPRAT handelt.
Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko-Korpus, gewonnen wurden. Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
Ziel des Teilprojekts ist die thematische Erschließung der Korpora, um sowohl themenspezifische virtuelle Subkorpora zusammenstellen zu können als auch aufgrund der Analyse sachgebietsbezogener Häufigkeitsverteilungen z.B. Lesarten disambiguieren zu können. Ausgangspunkt ist die Erstellung einer Taxonomie von Sachgebietsthemen. Dies erfolgt in einem semiautomatischen Verfahren, welches die Anwendung von Textmining (Dokumentclustering) und die manuelle Zuordnung von Clustern in eine externen Ontologie beinhaltet. Es wird argumentiert, dass die so gewonnene Taxonomie sowohl intuitiver als auch objektiver ist als bestehende, rein manuelle Ansätze. Sie eignet sich zudem gleichermaßen für manuelle als auch für maschinelle Klassifikation. Für letzteres wird der Naive Bayes'sche Textklassifikator motiviert und für ein klassifiziertes Korpus von knapp zwei Milliarden Wörtern evaluiert.
Die Monografie befasst sich mit der scherzhaften Wortbildungseinheit -fex 'wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist' (Kunstfex), nachgewiesen seit dem späteren 19. Jahrhundert im deutschen Sprachraum, herausgebildet aus überregional durch literarische Vermittlung bekannt gewordenen regionalsprachlichen (bayerischen und österreichischen) Komposita mit dem Substantiv Fex (Bergfex, Blüemlfex). Die Herkunft von Fex und damit auch von -fex ist bis heute ungesichert. Seit jüngerer Zeit nun wird |fex| in einen bestimmten etymologischen Zusammenhang mit dem lateinischen Suffix -i-fex (zu lateinisch facere 'machen') gebracht. |fex| wird auf das so genannte scherzlateinische Narefex zurückgeführt, das schon früher als Analogiebildung zu lateinischen Wörtern wie artifex und carnifex betrachtet wurde. Ungeachtet dieser problematischen etymologischen Herleitung stehen im Deutschen gebildete Wörter auf -fex (Küchenfex) und aus dem Lateinischen ins Deutsche entlehnte (Pontifex), auch im Deutschen und anderen europäischen Sprachen gebildete Wörter auf -i-fex (Gillifex, Zotifex, Spinifex und Tubifex) im heutigen Deutsch eigentümlich nebeneinander. Semantische Ähnlichkeiten scheinen sich mitunter zu zeigen (Versifex vs. Reimfex). Zunächst konnotative, dann integrative formale Eindeutschungen von Wörtern auf -i-fex verwischen die weitere Unterscheidung beider Gruppen (die Pluralformen Artifexe, Dramatifexe, Hexametrifexe, Pontifexe, Tubifexe und Versifexe vs. Steinfexe statt der Formen auf -i-fices). Es ist denkbar, dass deutende Sprachteilhaber von nur einer Gruppe von Wörtern bei gegebener Fugenvarianz ausgehen - wie sie bei fortschreitender Integration von Lehnkombinemen für deutsche Lehn-Wortbildungsprodukte nachweisbar ist (Bieriothek, Comicothek vs. Donnerthek, Rockthek). Die Arbeit versucht, die Entwicklung der beiden Wortbildungseinheiten -fex und -i-fex im Deutschen darzustellen und einen wortgeschichtlichen, dokumentationsgestützten Überblick über die relevanten Lehnwörter und (Lehn-)Wortbildungsprodukte zu geben. Inhalt: Register. Überblick. 1.-fex und -i-fex, eine Art etymologischer Dublette? 1.1 Lateinische Wörter mit dem Suffix -i-fex. Deutsche Lehnwörter aus dem Lateinischen und Neulateinischen mit dem Segment |ifex|. 1.2 Das Kombinem -i-fex in deutschen (europäischen) Lehn-Wortbildungsprodukten. 1.3 Ungeklärte frühe deutsche Wortbildungsprodukte mit der Sequenz ...fex. 1.4 Fex, Kürzung aus Narefex als „gesunkenem Kulturgut“? „Scherzlateinischer“ Ausgangspunkt Narefex für die Herausbildung des oberdeutschen Lexems Fex und in der Folge der deutschen Wortbildungseinheit -fex ‘wer etwas in leicht übertriebener Art liebt, auf etwas versessen ist’? 1.5 Das Substantiv Fex in oberdeutschen Regionalsprachen. 1.6 -fex- und -i-fex-/|ifex| Wörter. Ihre ‘Übereinstimmungen’. 1.6.1 Zufällige semantische Ähnlichkeit. 1.6.2 Bedingte weitere formale Übereinstimmung. Pluralformen der Sequenz ...fexe. 1.6.3 Mögliche scherzhafte Zusammenbildung. 2. Artikel- und Belegteil für alle Gruppen von Wörtern der Sequenz ...fex (in chronologischer Ordnung). 3. Anmerkungen. 4. Literatur. 5. Quellenverzeichnis. 6. Siglen für die Komponenten der Materialbasis
Wenn man heute neue lexikografische Projekte plant, ist es unerlässlich, sowohl den Computer als Arbeitswerkzeug, als auch das elektronische Medium als Publikationsmedium in die Konzeption einzubeziehen. Dabei ist es oft erwünscht, die einmal erarbeiteten lexikografischen Daten mehrfach zu verwerten, sei es als gedruckte und elektronische Version eines Wörterbuchs, sei es einmal als eine lange und kurze Ausführung eines lexikografischen Produkts oder als eine ausschließlich elektronische, aber benutzeradaptiv unterschiedliche Darstellung der gleichen lexikografischen Daten. (Vgl. u.a. Schryver 2003, Storrer 2001, Engelberg/Lemnitzer 2001, S. 220ff.) Solche Wünsche sind mit den heutigen Möglichkeiten des Computereinsatzes zu erfüllen, doch müssen die lexikografischen Prozesse entsprechend geplant werden. Vor allem die Frage der Strukturierung und Aufbereitung der lexikografischen Daten muss sorgfältig überlegt sein, denn hierbei wird der Grundstein dafür gelegt, wie flexibel auf die Daten zugegriffen werden kann und wie unterschiedlich darstellbar sie sind. Für einen inhaltlich wie gestalterisch möglichst flexiblen Umgang mit lexikografischen Daten ist daher eine bestimmte Form der Datenmodellierung und -auszeichnung erforderlich. Das Stichwort, das in diesem Zusammenhang immer wieder fällt, ist das der medienneutralen Datenhaltung. Doch wie müssen lexikografische Daten ausgezeichnet werden, damit diese Kodierung losgelöst von den Eigenschaften einer bestimmten Präsentation ist? Welche Richtlinien können hier projektübergreifend angewandt werden? Die moderne Wörterbuchforschung gibt darauf noch keine hinreichenden Antworten. Vor allem fehlen klare, theoretisch fundierte und intersubjektiv nachvollziehbare Richtlinien für die maßgeschneiderte Modellierung lexikografischer Daten. Denn oft ist es in lexikografischen Projekten nicht möglich, eine Standard-Modellierung wie die TEI2 oder leXeML3 anzuwenden, da diese kein ausreichend granulares und maßgeschneidertes Modellierungsinventar bieten, um die lexikografischen Daten später sehr flexibel darstellen zu können und verschiedenartige Zugriffsstrukturen zu bieten. Doch auch bei der Entwicklung einer maßgeschneiderten Modellierung ist es wichtig, einen klaren Leitfaden für die Datenmodellierung zu haben, um nicht bei jedem Phänomen neu entscheiden zu müssen, wie die Modellierung aussehen soll. Ziel dieses Aufsatzes ist es daher, ein Konzept vorzustellen, welche Eigenschaften lexikografischer Daten Gegenstand für eine Modellierung einer lexikografischen Datenbasis sein sollen, wie eine solche Modellierung aussehen kann und schließlich auch, welche Folgen diese Art der Modellierung für die lexikografische Praxis hat. Ein wichtiger Teil dieses Konzepts der Inhaltsstrukturen ist dabei auch die Entwicklung und Ausgestaltung einer eigenen Terminologie; auch in Abgrenzung zu Wiegands Konzept der Mikrostrukturen (vgl. Abschnitt 5).