Linguistik
Refine
Year of publication
Document Type
- Article (1213)
- Part of a Book (784)
- Working Paper (254)
- Review (181)
- Conference Proceeding (166)
- Preprint (122)
- Book (108)
- Part of Periodical (64)
- Report (58)
- Doctoral Thesis (23)
Language
- English (1397)
- German (1061)
- Croatian (298)
- Portuguese (120)
- Turkish (43)
- Multiple languages (25)
- French (21)
- mis (16)
- Spanish (7)
- Polish (4)
Keywords
- Deutsch (437)
- Syntax (151)
- Linguistik (129)
- Englisch (123)
- Semantik (112)
- Spracherwerb (96)
- Phonologie (85)
- Rezension (77)
- Kroatisch (68)
- Fremdsprachenlernen (67)
Institute
- Extern (438)
- Institut für Deutsche Sprache (IDS) Mannheim (113)
- Neuere Philologien (43)
- Sprachwissenschaften (43)
- Universitätsbibliothek (4)
- Sprach- und Kulturwissenschaften (3)
- Gesellschaftswissenschaften (2)
- Medizin (2)
- Präsidium (2)
- SFB 268 (2)
Vorliegender Beitrag geht davon aus, dass das Kulturphänomen "Deutsche Sprache" in Form und Gebrauch eine weitgehend regionale (areale) Inhomogenität aufweist. Im Argumentationsrahmen einer variationslinguistischen Dialektologie wird versucht, die diatopische Variationsbreite der deutschen Sprache zu umreißen und vor diesem Hintergrund eine spezifische bilinguale dialektale Kontaktvarietät des Deutschen (nämlich das sog. ,,Kontaktdeutsch") in ihrer synchron wie auch diachron überaus dynamischen Ausprägungsstruktur zu beschreiben und in das gegenwärtige Varietätenspektrum des Deutschen - sowohl hinsichtlich seiner Vetonung als auch seiner Dignität - einzuordnen. Somit soll auch zur Erforschung der inneren Dynamik der Varietätenvielfalt beigetragent werden.
Trotz einer allmählichen Hinwendung zu mehrsprachigen und multikulturellen Kontexten in den letzten Jahren gilt nach wie vor, dass den Paradigmen, Terminologien, Beschreibungsansätzen und Instrumentarien der Linguistik der meist unreflektierte Blickwinkel einsprachig und monokulturell sozialisierter Sprecher zugrunde liegt. So wurden z.B. die Sprachnormen bislang allenfalls aus der Sicht der Einsprachigkeit definiert, beschrieben und interpretiert. Die Perspektive bi- bzw. multilingualer Sprecher – einschließlich aller kulturellen Implikationen – wird in der Regel von den sprachwissenschaftlichen Auseinandersetzungen mit der Normen-Thematik ausgeschlossen. So hat auch Juhász, der bekannte ungarische Sprachgermanist, den bilingualen Diskursmodus zweisprachiger Personen als „einen Sprachgebrauch“ bezeichnet, „der sich nicht klassifizieren und noch weniger bewerten lässt“ (1986: 200). Meine Untersuchung beabsichtigt jedoch, die „prototypische“ Sprechweise und den kommunikativen Habitus4 bi- bzw. multilingualer Sprecher unter den Bedingungen gesellschaftlicher Zwei- bzw. Mehrsprachigkeit – ausgehend von der der Ingroup-Kommunikation bei Spontangesprächen unter Gruppenmitgliedern in verschiedenen Alltagssituationen – unter dem Gesichtspunkt der (sprachlichen und kommunikativen) Normen-Problematik zu beschreiben und zu hinterfragen sowie Aspekte ihrer Bewertung zu diskutieren. Damit soll ein Beitrag zur Modellierung bi- bzw. multilingualer und bi- bzw. transkultureller Sprachverhaltenssysteme – im Hinblick auf ihre Struktur, Hierarchie und Dynamik – geleistet werden. Als Exemplifikationsbereich dienen Belege aus dem sprachkommunikativen Verhalten von Ungarndeutschen.
Als eine der markantesten Schwierigkeiten der Zwei- bzw. Mehrsprachigkeitsforschung und der Kontaktlinguistik dürfte m.E. die Uneinheitlichkeit der in der einschlägigen Literatur verwendeten Terminologie und Begrifflichkeit gelten. So hat z.B. BRADEAN-EBINGER (1991: 54) in seiner Dissertation aus dem Jahre 1985 die wichtigste Ursache für den "Mangel an theoretischen Grundlagen" in der Kontaktlinguistik im "Fehlen einer relativ einheitlichen Terminologie" erblickt. Daher möchte die vorliegende Arbeit durch eine systematisierende Zusammenschau und Bewertung einer Zahl unterschiedlicher theoretisch-terminologischer Positionen der internationalen Zwei- bzw. Mehrsprachigkeitsforschung zu einer transparenteren Sicht beitragen und darauf aufbauend einen von mir erarbeiteten terminologisch-begrifflichen Apparat vorstellen, der das Gerüst eines aktuellen einschlägigen empirisch ausgerichteten Forschungsprojekts bildet. Um bei Grundlegendem zu beginnen: Sogar steht - trotz langjähriger vielfältiger Beschäftigung mit diesem Komplex - eine adäquate und einhellig akzeptierte Definition des Bibzw. Multilingualismus noch aus. Allerdings sehen manche, darunter auch jüngere, Publikationen das Phänomen der Zwei- bzw. Mehrsprachigkeit etwas simplifiziert. So geht z.B. OHRT (1998: 5) davon aus, daß dieser Begriff völlig eindeutig sei, und zwar in diesem Sinne: "Ein Individuum soll mehr als eine Sprache beherrschen, also außer seiner Muttersprache mindestens noch eine Fremdsprache. […] [M]an kann auch feststellen, daß es weltweit kaum eine andere Meinung gibt […]." In Kenntnis des aktuellen Literaturstandes wäre meiner Meinung nach zu konstatieren, daß dies der Komplexität und dem Facettenreichtum der Problematik nicht gerecht wird. Es liegt noch nicht einmal eine adäquate und einhellig akzeptierte Definition des Bi- bzw. Multilingualismus vor. Bereits vor mehr als zweieinhalb Jahrzehnten führte OVERBEKE (1972: 112 ff.) bei seiner Auseinandersetzung mit dem Terminus nicht weniger als 21 Definitionen der Zweisprachigkeit an, die er aus der Fachliteratur unter drei Gesichtspunkten - normativ, beschreibend und methodologisch - ermittelt hat. Trotz der stürmischen Entwicklung und vieler beachtenswerter Leistungen auf dem Gebiet der Bi- und Multilingualismusforschung bleibt nach wie vor festzustellen, daß die Skala der zur Verfügung stehenden Arbeitsdefinitionen ziemlich breit ist: Auf der einen Seite befinden sich die Forscher, die nur die "muttersprachähnliche Kontrolle über zwei Sprachen" (BLOOMFIELD 1933: 56) als Zweisprachigkeit anerkennen. Diese Position hält sich teilweise bis in die Gegenwart. Entsprechend hat BRADEAN-EBINGER kürzlich die "allgemeine Definition" so formuliert: "Zwei- und Mehrsprachigkeit ist die muttersprachähnliche Beherrschung, der aktive und passive Gebrauch von zwei oder mehreren Sprache [sic!], die Fähigkeit, diese Sprachen je nach Sprechsituation und -partner zu wechseln" (1997: 42). Am anderen Endpol liegen Minimaldefinitionen, wie etwa die von HAUGEN (1953: 7), "Die Zweisprachigkeit beginnt dort, wo der Sprecher einer Sprache komplette, inhalttragende Äußerungen in der anderen Sprache erzeugen kann." Für Anliegen und Charakter meines im weiteren vorzustellenden Projekts dürfte sich wohl die funktionale Herangehensweise von OKSAAR (1992: 24) am ehesten eignen, derzufolge Mehrsprachigkeit die Fähigkeit einer Person ist, zwei oder mehr Sprachen als Kommunikationsmittel zu verwenden und von einer Sprache in die andere hinüberzuwechseln, wenn die Situation es erfordert.
Der traditionsreiche Kultur-, Kontakt- und Integrationsraum Schlesien stellt eine Region im Überlappungs- und Durchdringungsbereich von Kulturen, Religionen, Sprachen und Nationen dar, wo sich im historischen Verlauf eine spezielle Sensibilität für Probleme und Chancen kultureller und sprachlicher Pluralität sowie für die Geschichtlichkeit und Dynamik multikultureller Zusammenhänge entwickeln konnte. Daher verkörpert er ein besonders wertvolles Erinnerungsgut (vgl. zur Thematik Engel/Honsza 2001 und Lasatowicz 2004). Solche Regionen werden nun mit Blick auf ihre Ressourcen des multikulturellen Gedächtnisses im Zuge von gesamteuropäischen Prozessen – auch im Sinne einer neuen „mentalen Welt“ – zunehmend aufgewertet. Die kulturelle und sprachliche Situation, einschließlich der Sprach gebrauchsstrukturen, ist in derartigen multi-ethnischen Arealen im Spannungsfeld von mehreren Sprachen, Kulturen und Identitäten naturgemäß äußerst vielschichtig. Entsprechend dieser komplexen sprachkommunikativen Realität in Mehrsprachigkeits-Kulturen setzt ihre wissenschaftlich adäquate Erfassung, Beschreibung und Explizierung ein mehrperspektivisches multi-, inter- und transdisziplinäres Herangehen voraus. Denn die Bearbeitung der entsprechend weiten Fragestellungen erfordert einen relevanten Betrachtungsrahmen und eine angepasste Methodologie, die sowohl dem komplexen Gegenstand als auch den Erkenntnisinteressen der Praxis gerecht werden. Müssen doch die Linguisten mit der mannigfaltigen sprachkommunikativen Realität mindestens (a) systemorientiert, (b) soziologisch und (c) „technologisch“ umgehen und sie entsprechend reflektieren können. Da aber die Gesamtthematik – wie sie auch im Titel der Tagung zum Ausdruck kommt – einen etwas sperrigen Gegenstand bildet, konzentriert sich der vorliegende Beitrag lediglich auf einen besonders wichtigen Aspekt. Mithin lautet die erkenntnisleitende Forschungsfrage: Wie kann man inter- bzw. transkulturelle,4 bi- bzw. multilinguale Kommunikationsräume im Kontakt der Kulturen mit den für sie charakteristischen zweisprachigen Diskursmodi (die oft durch verschiedene Ausprägungen von Hybridität gekennzeichnet sind) in disziplinärer Hinsicht sinnvoll analysieren? Also in welchem generellen Verstehensrahmen bzw. unter welchem "Blickwinkel", im Kompetenzbereich welcher linguistischen Teildisziplin, mit welcher Methodologie lassen sich die im Blickpunkt stehenden sprachkommunikativen Konstellationen, bilingualen Sprechhandlungen und entsprechenden Kontakt-, Interaktions-, Überblendungs- und Konvergenzphänomene sachangemessen untersuchen und heuristisch interpretieren? Solche Fragen erlangen m.E. angesichts der aktuellen Fachentwicklung der Sprachwissenschaft zunehmend Relevanz. War doch im Rahmen der kartesischen Sicht noch eine Einheit von Rationalität und Wissenschaft gegeben, ist spätestens seit Thomas Kuhn (1996) klar geworden, dass man es heute mit einem Nach- und Nebeneinander verschiedener (z.T. sogar inkommensurabler) „Paradigmen“ (Kuhn 1996), „Denkstile“ (vgl. Fleck 2002), „disziplinärer Matrizes“ (Kuhn 1977, 392 f.) oder Wissenschaftskulturen als diskursive Terrains zu tun hat.
We adopt Markert and Nissim (2005)’s approach of using the World Wide Web to resolve cases of coreferent bridging for German and discuss the strength and weaknesses of this approach. As the general approach of using surface patterns to get information on ontological relations between lexical items has only been tried on English, it is also interesting to see whether the approach works for German as well as it does for English and what differences between these languages need to be accounted for. We also present a novel approach for combining several patterns that yields an ensemble that outperforms the best-performing single patterns in terms of both precision and recall.
Tagging kausaler Relationen
(2005)
In dieser Diplomarbeit geht es um kausale Beziehungen zwischen Ereignissen und Erklärungsbeziehungen zwischen Ereignissen, bei denen kausale Relationen eine wichtige Rolle spielen. Nachdem zeitliche Relationen einerseits ihrer einfacheren Formalisierbarkeit und andererseits ihrer gut sichtbaren Rolle in der Grammatik (Tempus und Aspekt, zeitliche Konjunktionen) wegen in jüngerer Zeit stärker im Mittelpunkt des Interesses standen, soll hier argumentiert werden, dass kausale Beziehungen und die Erklärungen, die sie ermöglichen, eine wichtigere Rolle im Kohärenzgefüge des Textes spielen. Im Gegensatz zu “tiefen” Verfahren, die auf einer detaillierten semantischen Repr¨asentation des Textes aufsetzen und infolgedessen für unrestringierten Text m. E. nicht geeignet sind, wird hier untersucht, wie man dieses Ziel erreichen kann, ohne sich auf eine aufwändig konstruierte Wissensbasis verlassen zu müssen.
When a statistical parser is trained on one treebank, one usually tests it on another portion of the same treebank, partly due to the fact that a comparable annotation format is needed for testing. But the user of a parser may not be interested in parsing sentences from the same newspaper all over, or even wants syntactic annotations for a slightly different text type. Gildea (2001) for instance found that a parser trained on the WSJ portion of the Penn Treebank performs less well on the Brown corpus (the subset that is available in the PTB bracketing format) than a parser that has been trained only on the Brown corpus, although the latter one has only half as many sentences as the former. Additionally, a parser trained on both the WSJ and Brown corpora performs less well on the Brown corpus than on the WSJ one. This leads us to the following questions that we would like to address in this paper: - Is there a difference in usefulness of techniques that are used to improve parser performance between the same-corpus and the different-corpus case? - Are different types of parsers (rule-based and statistical) equally sensitive to corpus variation? To achieve this, we compared the quality of the parses of a hand-crafted constraint-based parser and a statistical PCFG-based parser that was trained on a treebank of German newspaper text.
In the past, a divide could be seen between ’deep’ parsers on the one hand, which construct a semantic representation out of their input, but usually have significant coverage problems, and more robust parsers on the other hand, which are usually based on a (statistical) model derived from a treebank and have larger coverage, but leave the problem of semantic interpretation to the user. More recently, approaches have emerged that combine the robustness of datadriven (statistical) models with more detailed linguistic interpretation such that the output could be used for deeper semantic analysis. Cahill et al. (2002) use a PCFG-based parsing model in combination with a set of principles and heuristics to derive functional (f-)structures of Lexical-Functional Grammar (LFG). They show that the derived functional structures have a better quality than those generated by a parser based on a state-of-the-art hand-crafted LFG grammar. Advocates of Dependency Grammar usually point out that dependencies already are a semantically meaningful representation (cf. Menzel, 2003). However, parsers based on dependency grammar normally create underspecified representations with respect to certain phenomena such as coordination, apposition and control structures. In these areas they are too "shallow" to be directly used for semantic interpretation. In this paper, we adopt a similar approach to Cahill et al. (2002) using a dependency-based analysis to derive functional structure, and demonstrate the feasibility of this approach using German data. A major focus of our discussion is on the treatment of coordination and other potentially underspecified structures of the dependency data input. F-structure is one of the two core levels of syntactic representation in LFG (Bresnan, 2001). Independently of surface order, it encodes abstract syntactic functions that constitute predicate argument structure and other dependency relations such as subject, predicate, adjunct, but also further semantic information such as the semantic type of an adjunct (e.g. directional). Normally f-structure is captured as a recursive attribute value matrix, which is isomorphic to a directed graph representation. Figure 5 depicts an example target f-structure. As mentioned earlier, these deeper-level dependency relations can be used to construct logical forms as in the approaches of van Genabith and Crouch (1996), who construct underspecified discourse representations (UDRSs), and Spreyer and Frank (2005), who have robust minimal recursion semantics (RMRS) as their target representation. We therefore think that f-structures are a suitable target representation for automatic syntactic analysis in a larger pipeline of mapping text to interpretation. In this paper, we report on the conversion from dependency structures to fstructure. Firstly, we evaluate the f-structure conversion in isolation, starting from hand-corrected dependencies based on the TüBa-D/Z treebank and Versley (2005)´s conversion. Secondly, we start from tokenized text to evaluate the combined process of automatic parsing (using Foth and Menzel (2006)´s parser) and f-structure conversion. As a test set, we randomly selected 100 sentences from TüBa-D/Z which we annotated using a scheme very close to that of the TiGer Dependency Bank (Forst et al., 2004). In the next section, we sketch dependency analysis, the underlying theory of our input representations, and introduce four different representations of coordination. We also describe Weighted Constraint Dependency Grammar (WCDG), the dependency parsing formalism that we use in our experiments. Section 3 characterises the conversion of dependencies to f-structures. Our evaluation is presented in section 4, and finally, section 5 summarises our results and gives an overview of problems remaining to be solved.
This paper is concerned with the tagging of spatial expressions in German newspaper articles, assigning a meaning to the expression and classifying the usages of the spatial expression and linking the derived referent to an event description. In our system, we implemented the activation of concepts in a very simple fashion, a concept is activated once (with a cost depending on the item that activated it) and is left activated thereafter. As an example, a city also activates the nodes for the region and the country it is part of, so that cities from one country are chosen over cities from different countries. A test corpus of 12 German newspaper articles was tested regarding several disambiguation strategies. Disambiguation was carried out via a beam search to find an approximately cost-optimal solution for the conflict set of potential grounding candidates for the tagged spatial expression. Test showed that the disambiguation strategies improved accuracy significantly.
Using a qualitative analysis of disagreements from a referentially annotated newspaper corpus, we show that, in coreference annotation, vague referents are prone to greater disagreement. We show how potentially problematic cases can be dealt with in a way that is practical even for larger-scale annotation, considering a real-world example from newspaper text.