Linguistik
Refine
Year of publication
- 2010 (85)
- 2013 (79)
- 2009 (69)
- 2018 (56)
- 2017 (55)
- 2011 (49)
- 2012 (40)
- 2008 (38)
- 2007 (37)
- 2000 (36)
- 2005 (35)
- 2004 (31)
- 2006 (31)
- 2001 (29)
- 2016 (29)
- 2002 (27)
- 2014 (27)
- 2003 (25)
- 1999 (21)
- 2015 (20)
- 1998 (15)
- 1995 (14)
- 2019 (14)
- 1994 (13)
- 1991 (11)
- 1996 (11)
- 2021 (11)
- 1984 (9)
- 1983 (8)
- 1993 (8)
- 1997 (8)
- 1986 (7)
- 1988 (7)
- 2023 (7)
- 1969 (6)
- 1970 (6)
- 1976 (6)
- 1989 (6)
- 1992 (6)
- 2020 (6)
- 1975 (5)
- 1985 (5)
- 2022 (5)
- 1978 (4)
- 1979 (4)
- 1980 (4)
- 1987 (4)
- 1990 (4)
- 1971 (3)
- 1972 (3)
- 1977 (3)
- 1982 (3)
- 1868 (2)
- 1724 (1)
- 1833 (1)
- 1887 (1)
- 1889 (1)
- 1904 (1)
- 1913 (1)
- 1925 (1)
- 1929 (1)
- 1930 (1)
- 1958 (1)
- 1968 (1)
- 1973 (1)
- 1974 (1)
- 1981 (1)
Document Type
- Article (451)
- Part of a Book (184)
- Working Paper (132)
- Review (84)
- Book (60)
- Conference Proceeding (52)
- Part of Periodical (26)
- Preprint (22)
- Report (22)
- Doctoral Thesis (7)
Language
- German (1061) (remove)
Keywords
- Deutsch (290)
- Deutsch als Fremdsprache (46)
- Phraseologie (42)
- Tschechisch (42)
- Deutschunterricht (41)
- Linguistik (41)
- Fremdsprachenunterricht (40)
- Fremdsprachenlernen (36)
- Semantik (35)
- Lexikologie (30)
Institute
Das im Jahre 1952 von Elöd Halász herausgegebene Deutsch-ungarische Großwörterbuch und sein 1957 erschienenes ungarisch-deutsches Pendant sind im Laufe der Jahrzehnte beinahe zu einer Legende geworden und fungierten bis vor kurzem als die einzigen Wörterbücher für dieses Sprachenpaar sowohl im ungarischen als auch im deutschen Sprachraum. Entsprechend verlangten diese mittlerweile mehr als 45 bzw. 40 Jahre alten Sprachlexika nach einer grundlegenden Modernisierung. Die beiden Nachfolgewörterbücher sind nun unter der Herausgeberschaft von Csaba Földes und Pál Uzonyi im Verlag der Ungarischen Akademie der Wissenschaften in Budapest erarbeitet worden. Die vorliegende Studie beschäftigt sich mit dem metalexikographischen Konzept der Neubearbeitung, geht dabei auf allgemein-theoretische Fragen der bilingualen Lexikographie ein und beschreibt die einzelnen Etappen des Projekts.
Der Balkan hält Europa - und andere Kontinente - seit einiger Zeit erneut in Atem. Diese politischen Erschütterungen und die Diskurse darüber haben auch sprachliche Ungereimtheiten und grammatische Zweifels- bzw. Problemfälle deutlich werden lassen, auf die man ohne diese Ereignisse wohl kaum aufmerksam geworden wäre. Der Kosovo-Konflikt scheint also offensichtlich auch im Kontext der deutschen Grammatik - und umfassender der Sprache schlechthin - ein vielschichtiges und subtiles Problem von einiger Brisanz darzustellen.
Die Untersuchung von Eigennamen (EN) im Kontext der Kontaktlinguistik stellt ein besonders aktuelles und informatives Forschungsfeld dar: Beispielsweise hat Eichler (1976: 128) bereits vor zweieinhalb Jahrzehnten erkannt, dass "gerade Sprachkontaktforschung heute ohne die onomastische Komponente nicht mehr gut denkbar ist". Beim gegenwärtigen Wissensstand kann auch von der anderen Seite her festgestellt werden, dass – insbesondere in Kulturräumen, in denen mehrere Sprachen miteinander in Berührung kommen – die Namenforschung eines kontaktlinguistischen Blickwinkels bedarf. Denn die EN verkörpern wohl den deutlichsten Nachweis für langfristige Vorgänge und Ergebnisse von Sprachenkontakten. So können diesbezüglich etwa hinsichtlich des "Namenstransfers" (Terminus nach Eichhoff 1991: 264) in mehr oder weniger multilinguale Regionen vor allem die Familien- und Ortsnamen lehrreiche linguistische wie auch interkulturelle Aufschlüsse liefern. Die onomastische Forschung verhält sich in diesem Problembereich unterschiedlich. Die kontaktlinguistischen Implikationen des direkten Transfers von Personennamen (mit phonematischer Anpassung) wurden in angelsächsischer Relation (norwegische, jiddische und ungarische Namen in den USA) bereits von einer Reihe bekannter Linguisten wie Kimmerle (1941: 1ff.; 1942: 158ff.), Haugen (1953: 201ff.), Mencken (1949: 474ff. sowie Supplement II, 1952: 396ff.), Weinreich (1968: 53), Bartha (1993: 41 ff.) und Kontra (1988: 58ff.) angesprochen. Hingegen würdigen nicht wenige Veröffentlichungen mit germanistischer Ausrichtung, auch wenn sie deutsche Nachnamen am Rande oder außerhalb des sog. "geschlossenen deutschen Sprachraums" ausführlich behandeln, diese Sprachenkontaktphänomene keines Hinweises (z. B. Breza 1986, Grünspanová 1975). Einige Arbeiten schneiden zwar die Einwirkung der Kontaktsprache(n) auf die deutschen Familiennamen (FaN) an, machen dies allerdings nicht zu ihrem primären Untersuchungsobjekt (z. B. Čučka/Melika 1979, Hellfritzsch 1990, Matejčík 1993[3] und Mori 1993). Lediglich in deutsch-tschechischer (Knappová 1990) und stärker in deutsch-angloamerikanischer sowie deutsch-costaricanischer Relation liegen einschlägig ertragreiche Beiträge vor, die verschiedene Integrationserscheinungen am Beispiel deutscher FaN in der englischsprachigen Umwelt der USA bzw. dem spanischsprachigen Milieu von Costa Rica thematisieren (Jones 1991 und besonders Eichhoff 1991 bzw. Boving 1986). Vor diesem Hintergrund zielt die vorliegende Studie darauf ab, deutschsprachige FaN in Südungarn einer kontaktlinguistischen Analyse zu unterziehen. Dies verspricht insofern ein besonders reizvolles Untersuchungsfeld, als in den Anthroponymen – dank lang anhaltender intensiver und mannigfacher Sprachen- und Kulturenkontakte trotz ihrer amtlich festgelegten Schreibformen – deutsche und ungarische Sprachelemente miteinander verschmelzen und in enger Symbiose existieren. Die Wechselwirkungen der flektierenden, indogermanischen deutschen Sprache und der agglutinierenden, finnisch-ugrischen ungarischen Sprache sind auch im Hinblick auf die Sprachtypologie besonders interessant.
This paper is concerned with the cultural reality characterised by the cmmunication within bi- or multilingual groups, in comparison to monolingual comniunication. In other words, such groups use their varieties of language differently. In this respect the paper deals with a culture of multilingualisrn, with a primary aim of highlighting subtly the characteristics end structure of the bi- or multilingual way of speaking. In particular, the predominant goal of this study is to emphasize respects of the "mixed" speech behaviour (the bilingual inode of discourse); and of innovations in speech and communication of transcultural bi- or multilingualism utilizing the example of the German as a minority language in Hungary. On the basis of the research it has become clear that linguistic variations and differentes should not be viewed automatically as individual mistakes but as a reaction to a new conununicative challenge. The conclusions for the discipline of "applird lingusitics" encompass that: all outcornes of communicative dynamic processes on the system of language concerning monolingual as well as bilingual language behaviour (inclusive of both "natural" and "artificial" bi- or multilingualism), should be considered more subtly both in theory and practice. In addition these outcomes must be analysed and heuristically described within an integrated frame.
Wo es auch immer um die Stellung der deutschen Sprache geht, kann ein Hinweis auf Ostmittel-, Ost- und Südosteuropa, einschließlich der GUS kaum fehlen. Zumeist wird dieses Areal (im Weiteren bediene ich mich des im deutschen Sprachraum zunehmend verwendeten Kürzels MOE) fast als Synonym für eine Hochburg des Deutschen apostrophiert. Deutsch als MOE-Sprache? - kann man sich fragen. Die Daten, die Wahrnehmungen und die Einstellungen sind allerdings nicht ganz einheitlich und nicht restlos eindeutig. Die Situation etwa der Hochschulgermanistik in der östlichen Hälfte Europas hat Kalmán in der Deutschen Universitäts-Zeitung wie folgt beschrieben: „Mangelnde Strukturierung des Fachbereiches, fehlende Differenzierung von Abschlüssen, Frontalunterricht und die Didaktik des kritiklosen Auswendiglernens - nach nun fast sechs Jahren hat sich an den ostmittel- und osteuropäischen Hochschulen nichts Grundlegendes geändert. […] Denn: ´Die Wandlungsunfähigkeit in diesen Ländern ist keine Frage des Systems mehr, sie ist eine Frage der Bequemlichkeit´“. Im Gegensatz zu diesem vernichtenden Verdikt meine ich als „betroffener“ Hochschulgermanist aus Ungarn, dass es bei uns doch nicht so schlecht aussieht. So möchte ich in diesem Beitrag die aktuelle Situation der deutschen Sprache in den Bereichen Schule und Universität vorstellen und einige Entwicklungstendenzen herausarbeiten. Dabei sei zwar der ganze MOE-Horizont im Blick behalten, es soll aber Ungarn besondere Aufmerksamkeit geschenkt werden.
Vorliegender Beitrag geht davon aus, dass das Kulturphänomen "Deutsche Sprache" in Form und Gebrauch eine weitgehend regionale (areale) Inhomogenität aufweist. Im Argumentationsrahmen einer variationslinguistischen Dialektologie wird versucht, die diatopische Variationsbreite der deutschen Sprache zu umreißen und vor diesem Hintergrund eine spezifische bilinguale dialektale Kontaktvarietät des Deutschen (nämlich das sog. ,,Kontaktdeutsch") in ihrer synchron wie auch diachron überaus dynamischen Ausprägungsstruktur zu beschreiben und in das gegenwärtige Varietätenspektrum des Deutschen - sowohl hinsichtlich seiner Vetonung als auch seiner Dignität - einzuordnen. Somit soll auch zur Erforschung der inneren Dynamik der Varietätenvielfalt beigetragent werden.
Trotz einer allmählichen Hinwendung zu mehrsprachigen und multikulturellen Kontexten in den letzten Jahren gilt nach wie vor, dass den Paradigmen, Terminologien, Beschreibungsansätzen und Instrumentarien der Linguistik der meist unreflektierte Blickwinkel einsprachig und monokulturell sozialisierter Sprecher zugrunde liegt. So wurden z.B. die Sprachnormen bislang allenfalls aus der Sicht der Einsprachigkeit definiert, beschrieben und interpretiert. Die Perspektive bi- bzw. multilingualer Sprecher – einschließlich aller kulturellen Implikationen – wird in der Regel von den sprachwissenschaftlichen Auseinandersetzungen mit der Normen-Thematik ausgeschlossen. So hat auch Juhász, der bekannte ungarische Sprachgermanist, den bilingualen Diskursmodus zweisprachiger Personen als „einen Sprachgebrauch“ bezeichnet, „der sich nicht klassifizieren und noch weniger bewerten lässt“ (1986: 200). Meine Untersuchung beabsichtigt jedoch, die „prototypische“ Sprechweise und den kommunikativen Habitus4 bi- bzw. multilingualer Sprecher unter den Bedingungen gesellschaftlicher Zwei- bzw. Mehrsprachigkeit – ausgehend von der der Ingroup-Kommunikation bei Spontangesprächen unter Gruppenmitgliedern in verschiedenen Alltagssituationen – unter dem Gesichtspunkt der (sprachlichen und kommunikativen) Normen-Problematik zu beschreiben und zu hinterfragen sowie Aspekte ihrer Bewertung zu diskutieren. Damit soll ein Beitrag zur Modellierung bi- bzw. multilingualer und bi- bzw. transkultureller Sprachverhaltenssysteme – im Hinblick auf ihre Struktur, Hierarchie und Dynamik – geleistet werden. Als Exemplifikationsbereich dienen Belege aus dem sprachkommunikativen Verhalten von Ungarndeutschen.
Als eine der markantesten Schwierigkeiten der Zwei- bzw. Mehrsprachigkeitsforschung und der Kontaktlinguistik dürfte m.E. die Uneinheitlichkeit der in der einschlägigen Literatur verwendeten Terminologie und Begrifflichkeit gelten. So hat z.B. BRADEAN-EBINGER (1991: 54) in seiner Dissertation aus dem Jahre 1985 die wichtigste Ursache für den "Mangel an theoretischen Grundlagen" in der Kontaktlinguistik im "Fehlen einer relativ einheitlichen Terminologie" erblickt. Daher möchte die vorliegende Arbeit durch eine systematisierende Zusammenschau und Bewertung einer Zahl unterschiedlicher theoretisch-terminologischer Positionen der internationalen Zwei- bzw. Mehrsprachigkeitsforschung zu einer transparenteren Sicht beitragen und darauf aufbauend einen von mir erarbeiteten terminologisch-begrifflichen Apparat vorstellen, der das Gerüst eines aktuellen einschlägigen empirisch ausgerichteten Forschungsprojekts bildet. Um bei Grundlegendem zu beginnen: Sogar steht - trotz langjähriger vielfältiger Beschäftigung mit diesem Komplex - eine adäquate und einhellig akzeptierte Definition des Bibzw. Multilingualismus noch aus. Allerdings sehen manche, darunter auch jüngere, Publikationen das Phänomen der Zwei- bzw. Mehrsprachigkeit etwas simplifiziert. So geht z.B. OHRT (1998: 5) davon aus, daß dieser Begriff völlig eindeutig sei, und zwar in diesem Sinne: "Ein Individuum soll mehr als eine Sprache beherrschen, also außer seiner Muttersprache mindestens noch eine Fremdsprache. […] [M]an kann auch feststellen, daß es weltweit kaum eine andere Meinung gibt […]." In Kenntnis des aktuellen Literaturstandes wäre meiner Meinung nach zu konstatieren, daß dies der Komplexität und dem Facettenreichtum der Problematik nicht gerecht wird. Es liegt noch nicht einmal eine adäquate und einhellig akzeptierte Definition des Bi- bzw. Multilingualismus vor. Bereits vor mehr als zweieinhalb Jahrzehnten führte OVERBEKE (1972: 112 ff.) bei seiner Auseinandersetzung mit dem Terminus nicht weniger als 21 Definitionen der Zweisprachigkeit an, die er aus der Fachliteratur unter drei Gesichtspunkten - normativ, beschreibend und methodologisch - ermittelt hat. Trotz der stürmischen Entwicklung und vieler beachtenswerter Leistungen auf dem Gebiet der Bi- und Multilingualismusforschung bleibt nach wie vor festzustellen, daß die Skala der zur Verfügung stehenden Arbeitsdefinitionen ziemlich breit ist: Auf der einen Seite befinden sich die Forscher, die nur die "muttersprachähnliche Kontrolle über zwei Sprachen" (BLOOMFIELD 1933: 56) als Zweisprachigkeit anerkennen. Diese Position hält sich teilweise bis in die Gegenwart. Entsprechend hat BRADEAN-EBINGER kürzlich die "allgemeine Definition" so formuliert: "Zwei- und Mehrsprachigkeit ist die muttersprachähnliche Beherrschung, der aktive und passive Gebrauch von zwei oder mehreren Sprache [sic!], die Fähigkeit, diese Sprachen je nach Sprechsituation und -partner zu wechseln" (1997: 42). Am anderen Endpol liegen Minimaldefinitionen, wie etwa die von HAUGEN (1953: 7), "Die Zweisprachigkeit beginnt dort, wo der Sprecher einer Sprache komplette, inhalttragende Äußerungen in der anderen Sprache erzeugen kann." Für Anliegen und Charakter meines im weiteren vorzustellenden Projekts dürfte sich wohl die funktionale Herangehensweise von OKSAAR (1992: 24) am ehesten eignen, derzufolge Mehrsprachigkeit die Fähigkeit einer Person ist, zwei oder mehr Sprachen als Kommunikationsmittel zu verwenden und von einer Sprache in die andere hinüberzuwechseln, wenn die Situation es erfordert.
Der traditionsreiche Kultur-, Kontakt- und Integrationsraum Schlesien stellt eine Region im Überlappungs- und Durchdringungsbereich von Kulturen, Religionen, Sprachen und Nationen dar, wo sich im historischen Verlauf eine spezielle Sensibilität für Probleme und Chancen kultureller und sprachlicher Pluralität sowie für die Geschichtlichkeit und Dynamik multikultureller Zusammenhänge entwickeln konnte. Daher verkörpert er ein besonders wertvolles Erinnerungsgut (vgl. zur Thematik Engel/Honsza 2001 und Lasatowicz 2004). Solche Regionen werden nun mit Blick auf ihre Ressourcen des multikulturellen Gedächtnisses im Zuge von gesamteuropäischen Prozessen – auch im Sinne einer neuen „mentalen Welt“ – zunehmend aufgewertet. Die kulturelle und sprachliche Situation, einschließlich der Sprach gebrauchsstrukturen, ist in derartigen multi-ethnischen Arealen im Spannungsfeld von mehreren Sprachen, Kulturen und Identitäten naturgemäß äußerst vielschichtig. Entsprechend dieser komplexen sprachkommunikativen Realität in Mehrsprachigkeits-Kulturen setzt ihre wissenschaftlich adäquate Erfassung, Beschreibung und Explizierung ein mehrperspektivisches multi-, inter- und transdisziplinäres Herangehen voraus. Denn die Bearbeitung der entsprechend weiten Fragestellungen erfordert einen relevanten Betrachtungsrahmen und eine angepasste Methodologie, die sowohl dem komplexen Gegenstand als auch den Erkenntnisinteressen der Praxis gerecht werden. Müssen doch die Linguisten mit der mannigfaltigen sprachkommunikativen Realität mindestens (a) systemorientiert, (b) soziologisch und (c) „technologisch“ umgehen und sie entsprechend reflektieren können. Da aber die Gesamtthematik – wie sie auch im Titel der Tagung zum Ausdruck kommt – einen etwas sperrigen Gegenstand bildet, konzentriert sich der vorliegende Beitrag lediglich auf einen besonders wichtigen Aspekt. Mithin lautet die erkenntnisleitende Forschungsfrage: Wie kann man inter- bzw. transkulturelle,4 bi- bzw. multilinguale Kommunikationsräume im Kontakt der Kulturen mit den für sie charakteristischen zweisprachigen Diskursmodi (die oft durch verschiedene Ausprägungen von Hybridität gekennzeichnet sind) in disziplinärer Hinsicht sinnvoll analysieren? Also in welchem generellen Verstehensrahmen bzw. unter welchem "Blickwinkel", im Kompetenzbereich welcher linguistischen Teildisziplin, mit welcher Methodologie lassen sich die im Blickpunkt stehenden sprachkommunikativen Konstellationen, bilingualen Sprechhandlungen und entsprechenden Kontakt-, Interaktions-, Überblendungs- und Konvergenzphänomene sachangemessen untersuchen und heuristisch interpretieren? Solche Fragen erlangen m.E. angesichts der aktuellen Fachentwicklung der Sprachwissenschaft zunehmend Relevanz. War doch im Rahmen der kartesischen Sicht noch eine Einheit von Rationalität und Wissenschaft gegeben, ist spätestens seit Thomas Kuhn (1996) klar geworden, dass man es heute mit einem Nach- und Nebeneinander verschiedener (z.T. sogar inkommensurabler) „Paradigmen“ (Kuhn 1996), „Denkstile“ (vgl. Fleck 2002), „disziplinärer Matrizes“ (Kuhn 1977, 392 f.) oder Wissenschaftskulturen als diskursive Terrains zu tun hat.
Tagging kausaler Relationen
(2005)
In dieser Diplomarbeit geht es um kausale Beziehungen zwischen Ereignissen und Erklärungsbeziehungen zwischen Ereignissen, bei denen kausale Relationen eine wichtige Rolle spielen. Nachdem zeitliche Relationen einerseits ihrer einfacheren Formalisierbarkeit und andererseits ihrer gut sichtbaren Rolle in der Grammatik (Tempus und Aspekt, zeitliche Konjunktionen) wegen in jüngerer Zeit stärker im Mittelpunkt des Interesses standen, soll hier argumentiert werden, dass kausale Beziehungen und die Erklärungen, die sie ermöglichen, eine wichtigere Rolle im Kohärenzgefüge des Textes spielen. Im Gegensatz zu “tiefen” Verfahren, die auf einer detaillierten semantischen Repr¨asentation des Textes aufsetzen und infolgedessen für unrestringierten Text m. E. nicht geeignet sind, wird hier untersucht, wie man dieses Ziel erreichen kann, ohne sich auf eine aufwändig konstruierte Wissensbasis verlassen zu müssen.
Im Fokus dieser Magisterarbeit stehen Präpositionalphrasen (PP), deren Komplement eine unikale Komponente ist. Es handelt sich bei diesen Komplementen um Nomen, die außerhalb einer PP nicht vorkommen bzw. in anderen Umgebungen nicht die selbe Bedeutung haben. Um dieses Phänomen zu beschreiben wird eine Analyse innerhalb der Head-Driven Phrase Structure Grammar (HPSG) entwickelt. Grundkenntnisse über Struktur und Begrifflichkeiten der HPSG werden in dieser Arbeit vorausgesetzt, als Referenz siehe [PS94]. Die Gliederung gestaltet sich wie folgt: Zunächst werden die zu untersuchenden Daten im Detail dargestellt. Anschließend werden verschiedene Analysemöglichkeiten innerhalb der Theorie der HPSG in Betracht gezogen, nämlich Selektion, Konstruktion und Kollokation. Dabei muss festgestellt werden, dass die existierenden Ansätze den Daten nicht oder nur unbefriedigend gerecht werden können. Der Ansatz, der letztendlich verfolgt wird, besteht darin, den bereits existierenden Selektionsmechanismus über SPEC zu generalisieren. Dieses Vorgehen erlaubt dann der unikalen NP, die Präposition, mit welcher sie einhergeht, zu selegieren. Hierzu werden einige, jedoch vertretbare Änderungen in der HPSG-Architektur vorgenommen und es wird gezeigt, wie mit dem generalisierten Mechanismus die Daten behandelt werden können. Daran anschließend folgt eine Erweiterung des Phänomenbereichs auf Paarformeln. Ferner wird ein Einwand im Zusammenhang mit der Analyse des Komplements als NP bzw. DP diskutiert und zur weiteren Motivation des Ansatzes wird noch ein weiteres lokales Phänomen,die Distribution der Spur, mit der hier vorgestellten Herangehensweise modelliert. Darüberhinaus wird die Frage untersucht, ob man nicht auch PPs mit festen Verben geschickt analysieren kann. Dazu wird ein Weg, Lexeme zu selegieren, eingeführt und der entwickelte Mechanismus erweitert. Diese Erweiterung findet Anwendung bei der Modellierung der lokalen Distribution einer Partikel. Eine Zusammenfassung, sowie ein Ausblick auf weiterführende Fragestellungen schließen die Arbeit ab.
Das Zustandspassiv : grammatische Einordnung – Bildungsbeschränkungen – Interpretationsspielraum
(2005)
Das Chunkparsing bietet einen besonders vielversprechenden Ansatz zum robusten, partiellen Parsing mit dem Ziel einer breiten Datenabdeckung. Ziel beim Chunkparsing ist eine partielle, nicht-rekursive syntaktische Struktur. Dieser extrem effiziente Parsing-Ansatz läßt sich als Kaskade endlicher Transducer realisieren. In diesem Beitrag wird TüSBL vorgestellt, ein System, bei dem die Eingabe aus spontaner, gesprochener Spache besteht, die dem Parser in Form eines Worthypothesengraphen aus einem Spracherkenner zur Verfügung gestellt wird. Chunkparsing ist für eine solche Anwendung besonders geeignet, da es fragmentarische oder nicht wohlgeformte Äußerungen robust behandeln kann. Des weiteren wird eine Baumkonstruktionskomponente vorgestellt, die die partiellen Chunkstrukturen zu vollständigen Bäumen mit grammatischen Funktionen erweitert. Das System wird anhand manuell überprüfter Systemeingaben evaluiert, da sich die üblichen Evaluationsparameter hierfür nicht eignen.
Part-of-Speech tagging is generally performed by Markov models, based on bigram or trigram models. While Markov models have a strong concentration on the left context of a word, many languages require the inclusion of right context for correct disambiguation. We show for German that the best results are reached by a combination of left and right context. If only left context is available, then changing the direction of analysis and going from right to left improves the results. In a version of MBT (Daelemans et al., 1996) with default parameter settings, the inclusion of the right context improved POS tagging accuracy from 94.00% to 96.08%, thus corroborating our hypothesis. The version with optimized parameters reaches 96.73%.
In dieser Arbeit soll erst ein kurzer Überblick über die Gebiete der Wortklassifizierung und des maschinellen Lernens gegeben werden (Kap. 1). Dann wird der Ansatz der transformationsbasierten fehlergesteuerten Wortklassifizierung (Transformation-Based Error-Driven Tagging) von Brill (1992, 1993, 1994) vorgestellt und für die Verwendung für deutschsprachige Korpora angepaßt (Kap. 2). Hierbei handelt es sich um ein regelbasiertes System, bei dem die Regeln im Gegensatz zu den bisher vorhandenen Systemen nicht manuell erarbeitet und dem System vorgegeben werden; das System erwirbt die Regeln vielmehr selbst anhand von wenigen Regelschemata aus einem kleinen bereits getaggten Lernkorpus. In Kapitel 3 werden die Ergebnisse aus der Anwendung des Systems auf Teile eines deutschsprachigen Korpus dargestellt. In Kapitel 4 schließlich werden andere Taggingsysteme vorgestellt und mit dem System von Brill (1993) anhand von acht Kriterien verglichen.
Maschinelles Lernen wird häufig zur effzienten Annotation großer Datenmengen eingesetzt. Die Forschung zu maschinellen Lernverfahren beschränkt sich i.a. darauf unterschiedliche Lernverfahren zu vergelichen oder die optimale größe der Trainingsdaten zu bestimmen. Bisher wurde jedoch nicht untersucht, in wie weit sich linguistisches Wissen bei der Aufgabendefinition positiv auswirken kann. Dies soll hier anhand des Lernens von Base-Nominalphrasen mit drei unterschiedlichen Definitionen untersucht werden. Die Definitionen unterscheiden sich im Grad der linguistisch motivierten Erweiterungen, die zu einer eher praktisch motivierten ersten Definition hinzu kamen. Die Untersuchungen ergaben, dass sich die Anzahl der falsch klasssifizierten Wörter um ein Drittel reduzieren lässt.
Der TUSNELDA-Standard : ein Korpusannotierungsstandard zur Unterstützung linguistischer Forschung
(2001)
Die Verwendung von Standards für die Annotierung größerer Sammlungen elektronischer Texte (Korpora) ist eine Voraussetzung für eine mögliche Wiederverwendung dieser Korpora. Dieser Artikel stellt einen Korpusannotierungsstandard vor, der die Anforderungen der Untersuchung unterschiedlichster linguistischer Phänomene berücksichtigt. Der Standard wurde im SFB 441 an der Universität Tübingen entwickelt. Er geht von bestehenden Standards, insbesondere CES und TEI, aus, die sich als teilweise zu ausführlich und zu wenig restriktiv,teilweise auch als nicht ausdrucksstark genug erweisen, um den Bedürfnissen korpusbasierter linguistischer Forschung gerecht zu werden.
Die Theorie des sprachlichen Lernens und Lehrens ist bis in die siebziger Jahre des 20. Jahrhunderts hinein eine "Meisterlehre" (Müller-Michaels 1980) gewesen. Große Vorbilder eines Volkes (z.B. Mose), Leiter philosophischer Schulen (z.B. Platon) oder Äbte von Klöstern (z.B. Augustinus) und schließlich staatlich geprüfte Oberstudiendirektoren (z.B. Ulshöfer) beschrieben den jüngeren Kollegen, was sich beim Lehren der Sprache über Jahrzehnte bewährt habe: wie man am besten den Sprachunterricht erteile (Müller 1922, Seidemann 1973, Ulshöfer 1968, Essen 1968). Mit der Etablierung der Sprachdidaktiken an den Universitäten ist das Konzept der "norm-setzenden Handlungswissenschaften" Müller-Michaels 1980, Ivo 1975) entwickelt worden. Der Forscher (nicht mehr als Meister der Praxis ausgewiesen) untersucht die Prozesse des sprachlichen Lehrens und Lernens, indem er im "Feld" des Praktikers Erhebungen anstellt, um anschließend die erhobenen Daten einer Hypothesenprüfung zu unterziehen. Als Handlungsfeld wird besonders die Schule berücksichtigt. Die Methoden der Forschung sind vorwiegend "quasi-experimentell". In der Nachfolge der Sprachtheorie Chomsky´s (Chomsky 1965) sind die experimentellen Ansätze zur Untersuchung des Spracherwerbs, der Spracherwerbsstörung und der betreffenden Interventionen entwickelt worden (de Villiers/ de Villiers 1970, Hörmann 1978). Ort der Untersuchung ist das Labor. Das Design dieser Sprachdidaktik (bzw. Psycholinguistik, Kognitionswissenschaften etc.) ist experimentell (z.B. Herrmann 2004). Alle drei Konzepte stehen sich in vielerlei Hinsicht antagonistisch gegenüber. Sie auseinander zu halten - und andererseits mit Gewinn aufeinander zu beziehen -, gehört zu den Basis-Fähigkeiten der linguosomatischen Berufe und ihrer zugrundeliegenden Theorie (Beispiel Sprachlehrberufe, Phoniatrie, Sprachheil-Sonderpädagogik, psychosomatische Sprachtherapien). Daher sind die signifikanten Gegensätze der drei Konzepte herauszuarbeiten und ihre widerstrebenden Konsequenzen aufeinander zu beziehen.
Seitdem die Junggrammatiker den Begriff des Lautgesetzes geprägt haben, sind deren fast ebenso viele aufgestellt wie in der Folge hinterfragt, widerlegt und vielleicht am Ende sogar doch wieder erfolgreich verteidigt worden. Jedes Lautgesetz wirkt in einem unterschiedlichen Zeitraum. Ist aus dem Zeitraum des Wirkens mehrerer zeitlich benachbarter oder gar einander zeitlich überlappender Lautgesetze ein ausreichend großes Textkorpus erhalten, so ist es ein Leichtes, die Reihenfolge des Wirkens der Gesetze zu ermitteln, oder, im günstigsten Fall, den Zeitraum ihres Wirkens sogar mit gewisser Präzision datieren zu können. Anders verhält es sich hingegen, wenn schriftliche Überlieferungen der untersuchten Sprache in der entscheidenden Epoche nur spärlich oder gar nicht vorliegen. Hier muss daher traditionell darauf zurückgegriffen werden, die Reihenfolge anhand der allein möglichen Entwicklung einzelner Wörter, auf die besonders viele der betreffenden Lautgesetze gewirkt haben, zu bestimmen. Diese Methode birgt jedoch die Gefahr menschlicher Fehler, insbesondere in Fällen, in denen eine klare Reihenfolge nur unter Betrachtung mehrerer Wörter zu ermitteln ist. Die Forscher vergangener Jahrzehnte und Jahrhunderte hatten hier allerdings keine andere Wahl. Mit den heute verfügbaren Computern eröffnen sich jedoch ungeahnte Möglichkeiten. Zuvor in Programmiersprache umgeschriebene Lautgesetze können in Sekundenschnelle auf immense Textkorpora angewandt werden. Um aber – ohne jegliche Zuhilfenahme außersprachlichen Wissens – die eine oder mehrere mögliche Reihenfolgen verschiedener Lautgesetze zu bestimmen, ist es nötig, sämtliche Möglichkeiten anhand eines Wortkorpus durchzuspielen und die jeweiligen Ergebnisse mit den tatsächlichen, vorliegenden Ergebnissen zu vergleichen. Dieser Versuch soll im Folgenden unternommen werden. Auf diese Weise könnten dann relative Chronologien von Lautgesetzen, die als längst etabliert gelten, noch einmal auf den Prüfstand gestellt und möglicherweise sogar noch präzisiert werden. Nach einer kurzen Begriffsgeschichte des Lautgesetzes soll zunächst auf sprachliche Problemstellungen eingegangen werden, die das Vorhaben erschweren, bevor die Auswahl zweier den Untersuchungszeitraum begrenzender Sprachstufen sowie eine Beschreibung des Datenmaterials – Wortkorpus und Lautgesetze – folgen. Nun soll das Computerprogramm, von den Anforderungen bis hin zur Umsetzung, erläutert werden. Anschließen soll sich hieran eine Darstellung der Erkenntnisse, die die Ergebnisse des Programms gewähren. Im Schlussteil sollen die offen gebliebenen und die neu entstandenen Fragen noch einmal zusammengefasst und Möglichkeiten zur hierauf basierenden weitergehenden Forschung erörtert werden.