Linguistik
Refine
Year of publication
Document Type
- Article (1356)
- Part of a Book (784)
- Working Paper (254)
- Review (181)
- Conference Proceeding (166)
- Preprint (122)
- Book (108)
- Part of Periodical (64)
- Report (58)
- Doctoral Thesis (23)
Language
- English (1540)
- German (1061)
- Croatian (298)
- Portuguese (120)
- Turkish (43)
- Multiple languages (25)
- French (21)
- mis (16)
- Spanish (7)
- Polish (4)
Keywords
- Deutsch (437)
- Syntax (151)
- Linguistik (130)
- Englisch (123)
- Semantik (112)
- Spracherwerb (96)
- Phonologie (86)
- Rezension (77)
- Kroatisch (68)
- Fremdsprachenlernen (67)
Institute
- Extern (438)
- Institut für Deutsche Sprache (IDS) Mannheim (113)
- Neuere Philologien (43)
- Sprachwissenschaften (43)
- Universitätsbibliothek (4)
- Sprach- und Kulturwissenschaften (3)
- Gesellschaftswissenschaften (2)
- Medizin (2)
- Präsidium (2)
- SFB 268 (2)
- Informatik (1)
- Kulturwissenschaften (1)
Die Untersuchung von Eigennamen (EN) im Kontext der Kontaktlinguistik stellt ein besonders aktuelles und informatives Forschungsfeld dar: Beispielsweise hat Eichler (1976: 128) bereits vor zweieinhalb Jahrzehnten erkannt, dass "gerade Sprachkontaktforschung heute ohne die onomastische Komponente nicht mehr gut denkbar ist". Beim gegenwärtigen Wissensstand kann auch von der anderen Seite her festgestellt werden, dass – insbesondere in Kulturräumen, in denen mehrere Sprachen miteinander in Berührung kommen – die Namenforschung eines kontaktlinguistischen Blickwinkels bedarf. Denn die EN verkörpern wohl den deutlichsten Nachweis für langfristige Vorgänge und Ergebnisse von Sprachenkontakten. So können diesbezüglich etwa hinsichtlich des "Namenstransfers" (Terminus nach Eichhoff 1991: 264) in mehr oder weniger multilinguale Regionen vor allem die Familien- und Ortsnamen lehrreiche linguistische wie auch interkulturelle Aufschlüsse liefern. Die onomastische Forschung verhält sich in diesem Problembereich unterschiedlich. Die kontaktlinguistischen Implikationen des direkten Transfers von Personennamen (mit phonematischer Anpassung) wurden in angelsächsischer Relation (norwegische, jiddische und ungarische Namen in den USA) bereits von einer Reihe bekannter Linguisten wie Kimmerle (1941: 1ff.; 1942: 158ff.), Haugen (1953: 201ff.), Mencken (1949: 474ff. sowie Supplement II, 1952: 396ff.), Weinreich (1968: 53), Bartha (1993: 41 ff.) und Kontra (1988: 58ff.) angesprochen. Hingegen würdigen nicht wenige Veröffentlichungen mit germanistischer Ausrichtung, auch wenn sie deutsche Nachnamen am Rande oder außerhalb des sog. "geschlossenen deutschen Sprachraums" ausführlich behandeln, diese Sprachenkontaktphänomene keines Hinweises (z. B. Breza 1986, Grünspanová 1975). Einige Arbeiten schneiden zwar die Einwirkung der Kontaktsprache(n) auf die deutschen Familiennamen (FaN) an, machen dies allerdings nicht zu ihrem primären Untersuchungsobjekt (z. B. Čučka/Melika 1979, Hellfritzsch 1990, Matejčík 1993[3] und Mori 1993). Lediglich in deutsch-tschechischer (Knappová 1990) und stärker in deutsch-angloamerikanischer sowie deutsch-costaricanischer Relation liegen einschlägig ertragreiche Beiträge vor, die verschiedene Integrationserscheinungen am Beispiel deutscher FaN in der englischsprachigen Umwelt der USA bzw. dem spanischsprachigen Milieu von Costa Rica thematisieren (Jones 1991 und besonders Eichhoff 1991 bzw. Boving 1986). Vor diesem Hintergrund zielt die vorliegende Studie darauf ab, deutschsprachige FaN in Südungarn einer kontaktlinguistischen Analyse zu unterziehen. Dies verspricht insofern ein besonders reizvolles Untersuchungsfeld, als in den Anthroponymen – dank lang anhaltender intensiver und mannigfacher Sprachen- und Kulturenkontakte trotz ihrer amtlich festgelegten Schreibformen – deutsche und ungarische Sprachelemente miteinander verschmelzen und in enger Symbiose existieren. Die Wechselwirkungen der flektierenden, indogermanischen deutschen Sprache und der agglutinierenden, finnisch-ugrischen ungarischen Sprache sind auch im Hinblick auf die Sprachtypologie besonders interessant.
This paper is concerned with the cultural reality characterised by the cmmunication within bi- or multilingual groups, in comparison to monolingual comniunication. In other words, such groups use their varieties of language differently. In this respect the paper deals with a culture of multilingualisrn, with a primary aim of highlighting subtly the characteristics end structure of the bi- or multilingual way of speaking. In particular, the predominant goal of this study is to emphasize respects of the "mixed" speech behaviour (the bilingual inode of discourse); and of innovations in speech and communication of transcultural bi- or multilingualism utilizing the example of the German as a minority language in Hungary. On the basis of the research it has become clear that linguistic variations and differentes should not be viewed automatically as individual mistakes but as a reaction to a new conununicative challenge. The conclusions for the discipline of "applird lingusitics" encompass that: all outcornes of communicative dynamic processes on the system of language concerning monolingual as well as bilingual language behaviour (inclusive of both "natural" and "artificial" bi- or multilingualism), should be considered more subtly both in theory and practice. In addition these outcomes must be analysed and heuristically described within an integrated frame.
Wo es auch immer um die Stellung der deutschen Sprache geht, kann ein Hinweis auf Ostmittel-, Ost- und Südosteuropa, einschließlich der GUS kaum fehlen. Zumeist wird dieses Areal (im Weiteren bediene ich mich des im deutschen Sprachraum zunehmend verwendeten Kürzels MOE) fast als Synonym für eine Hochburg des Deutschen apostrophiert. Deutsch als MOE-Sprache? - kann man sich fragen. Die Daten, die Wahrnehmungen und die Einstellungen sind allerdings nicht ganz einheitlich und nicht restlos eindeutig. Die Situation etwa der Hochschulgermanistik in der östlichen Hälfte Europas hat Kalmán in der Deutschen Universitäts-Zeitung wie folgt beschrieben: „Mangelnde Strukturierung des Fachbereiches, fehlende Differenzierung von Abschlüssen, Frontalunterricht und die Didaktik des kritiklosen Auswendiglernens - nach nun fast sechs Jahren hat sich an den ostmittel- und osteuropäischen Hochschulen nichts Grundlegendes geändert. […] Denn: ´Die Wandlungsunfähigkeit in diesen Ländern ist keine Frage des Systems mehr, sie ist eine Frage der Bequemlichkeit´“. Im Gegensatz zu diesem vernichtenden Verdikt meine ich als „betroffener“ Hochschulgermanist aus Ungarn, dass es bei uns doch nicht so schlecht aussieht. So möchte ich in diesem Beitrag die aktuelle Situation der deutschen Sprache in den Bereichen Schule und Universität vorstellen und einige Entwicklungstendenzen herausarbeiten. Dabei sei zwar der ganze MOE-Horizont im Blick behalten, es soll aber Ungarn besondere Aufmerksamkeit geschenkt werden.
Vorliegender Beitrag geht davon aus, dass das Kulturphänomen "Deutsche Sprache" in Form und Gebrauch eine weitgehend regionale (areale) Inhomogenität aufweist. Im Argumentationsrahmen einer variationslinguistischen Dialektologie wird versucht, die diatopische Variationsbreite der deutschen Sprache zu umreißen und vor diesem Hintergrund eine spezifische bilinguale dialektale Kontaktvarietät des Deutschen (nämlich das sog. ,,Kontaktdeutsch") in ihrer synchron wie auch diachron überaus dynamischen Ausprägungsstruktur zu beschreiben und in das gegenwärtige Varietätenspektrum des Deutschen - sowohl hinsichtlich seiner Vetonung als auch seiner Dignität - einzuordnen. Somit soll auch zur Erforschung der inneren Dynamik der Varietätenvielfalt beigetragent werden.
Trotz einer allmählichen Hinwendung zu mehrsprachigen und multikulturellen Kontexten in den letzten Jahren gilt nach wie vor, dass den Paradigmen, Terminologien, Beschreibungsansätzen und Instrumentarien der Linguistik der meist unreflektierte Blickwinkel einsprachig und monokulturell sozialisierter Sprecher zugrunde liegt. So wurden z.B. die Sprachnormen bislang allenfalls aus der Sicht der Einsprachigkeit definiert, beschrieben und interpretiert. Die Perspektive bi- bzw. multilingualer Sprecher – einschließlich aller kulturellen Implikationen – wird in der Regel von den sprachwissenschaftlichen Auseinandersetzungen mit der Normen-Thematik ausgeschlossen. So hat auch Juhász, der bekannte ungarische Sprachgermanist, den bilingualen Diskursmodus zweisprachiger Personen als „einen Sprachgebrauch“ bezeichnet, „der sich nicht klassifizieren und noch weniger bewerten lässt“ (1986: 200). Meine Untersuchung beabsichtigt jedoch, die „prototypische“ Sprechweise und den kommunikativen Habitus4 bi- bzw. multilingualer Sprecher unter den Bedingungen gesellschaftlicher Zwei- bzw. Mehrsprachigkeit – ausgehend von der der Ingroup-Kommunikation bei Spontangesprächen unter Gruppenmitgliedern in verschiedenen Alltagssituationen – unter dem Gesichtspunkt der (sprachlichen und kommunikativen) Normen-Problematik zu beschreiben und zu hinterfragen sowie Aspekte ihrer Bewertung zu diskutieren. Damit soll ein Beitrag zur Modellierung bi- bzw. multilingualer und bi- bzw. transkultureller Sprachverhaltenssysteme – im Hinblick auf ihre Struktur, Hierarchie und Dynamik – geleistet werden. Als Exemplifikationsbereich dienen Belege aus dem sprachkommunikativen Verhalten von Ungarndeutschen.
Als eine der markantesten Schwierigkeiten der Zwei- bzw. Mehrsprachigkeitsforschung und der Kontaktlinguistik dürfte m.E. die Uneinheitlichkeit der in der einschlägigen Literatur verwendeten Terminologie und Begrifflichkeit gelten. So hat z.B. BRADEAN-EBINGER (1991: 54) in seiner Dissertation aus dem Jahre 1985 die wichtigste Ursache für den "Mangel an theoretischen Grundlagen" in der Kontaktlinguistik im "Fehlen einer relativ einheitlichen Terminologie" erblickt. Daher möchte die vorliegende Arbeit durch eine systematisierende Zusammenschau und Bewertung einer Zahl unterschiedlicher theoretisch-terminologischer Positionen der internationalen Zwei- bzw. Mehrsprachigkeitsforschung zu einer transparenteren Sicht beitragen und darauf aufbauend einen von mir erarbeiteten terminologisch-begrifflichen Apparat vorstellen, der das Gerüst eines aktuellen einschlägigen empirisch ausgerichteten Forschungsprojekts bildet. Um bei Grundlegendem zu beginnen: Sogar steht - trotz langjähriger vielfältiger Beschäftigung mit diesem Komplex - eine adäquate und einhellig akzeptierte Definition des Bibzw. Multilingualismus noch aus. Allerdings sehen manche, darunter auch jüngere, Publikationen das Phänomen der Zwei- bzw. Mehrsprachigkeit etwas simplifiziert. So geht z.B. OHRT (1998: 5) davon aus, daß dieser Begriff völlig eindeutig sei, und zwar in diesem Sinne: "Ein Individuum soll mehr als eine Sprache beherrschen, also außer seiner Muttersprache mindestens noch eine Fremdsprache. […] [M]an kann auch feststellen, daß es weltweit kaum eine andere Meinung gibt […]." In Kenntnis des aktuellen Literaturstandes wäre meiner Meinung nach zu konstatieren, daß dies der Komplexität und dem Facettenreichtum der Problematik nicht gerecht wird. Es liegt noch nicht einmal eine adäquate und einhellig akzeptierte Definition des Bi- bzw. Multilingualismus vor. Bereits vor mehr als zweieinhalb Jahrzehnten führte OVERBEKE (1972: 112 ff.) bei seiner Auseinandersetzung mit dem Terminus nicht weniger als 21 Definitionen der Zweisprachigkeit an, die er aus der Fachliteratur unter drei Gesichtspunkten - normativ, beschreibend und methodologisch - ermittelt hat. Trotz der stürmischen Entwicklung und vieler beachtenswerter Leistungen auf dem Gebiet der Bi- und Multilingualismusforschung bleibt nach wie vor festzustellen, daß die Skala der zur Verfügung stehenden Arbeitsdefinitionen ziemlich breit ist: Auf der einen Seite befinden sich die Forscher, die nur die "muttersprachähnliche Kontrolle über zwei Sprachen" (BLOOMFIELD 1933: 56) als Zweisprachigkeit anerkennen. Diese Position hält sich teilweise bis in die Gegenwart. Entsprechend hat BRADEAN-EBINGER kürzlich die "allgemeine Definition" so formuliert: "Zwei- und Mehrsprachigkeit ist die muttersprachähnliche Beherrschung, der aktive und passive Gebrauch von zwei oder mehreren Sprache [sic!], die Fähigkeit, diese Sprachen je nach Sprechsituation und -partner zu wechseln" (1997: 42). Am anderen Endpol liegen Minimaldefinitionen, wie etwa die von HAUGEN (1953: 7), "Die Zweisprachigkeit beginnt dort, wo der Sprecher einer Sprache komplette, inhalttragende Äußerungen in der anderen Sprache erzeugen kann." Für Anliegen und Charakter meines im weiteren vorzustellenden Projekts dürfte sich wohl die funktionale Herangehensweise von OKSAAR (1992: 24) am ehesten eignen, derzufolge Mehrsprachigkeit die Fähigkeit einer Person ist, zwei oder mehr Sprachen als Kommunikationsmittel zu verwenden und von einer Sprache in die andere hinüberzuwechseln, wenn die Situation es erfordert.
Der traditionsreiche Kultur-, Kontakt- und Integrationsraum Schlesien stellt eine Region im Überlappungs- und Durchdringungsbereich von Kulturen, Religionen, Sprachen und Nationen dar, wo sich im historischen Verlauf eine spezielle Sensibilität für Probleme und Chancen kultureller und sprachlicher Pluralität sowie für die Geschichtlichkeit und Dynamik multikultureller Zusammenhänge entwickeln konnte. Daher verkörpert er ein besonders wertvolles Erinnerungsgut (vgl. zur Thematik Engel/Honsza 2001 und Lasatowicz 2004). Solche Regionen werden nun mit Blick auf ihre Ressourcen des multikulturellen Gedächtnisses im Zuge von gesamteuropäischen Prozessen – auch im Sinne einer neuen „mentalen Welt“ – zunehmend aufgewertet. Die kulturelle und sprachliche Situation, einschließlich der Sprach gebrauchsstrukturen, ist in derartigen multi-ethnischen Arealen im Spannungsfeld von mehreren Sprachen, Kulturen und Identitäten naturgemäß äußerst vielschichtig. Entsprechend dieser komplexen sprachkommunikativen Realität in Mehrsprachigkeits-Kulturen setzt ihre wissenschaftlich adäquate Erfassung, Beschreibung und Explizierung ein mehrperspektivisches multi-, inter- und transdisziplinäres Herangehen voraus. Denn die Bearbeitung der entsprechend weiten Fragestellungen erfordert einen relevanten Betrachtungsrahmen und eine angepasste Methodologie, die sowohl dem komplexen Gegenstand als auch den Erkenntnisinteressen der Praxis gerecht werden. Müssen doch die Linguisten mit der mannigfaltigen sprachkommunikativen Realität mindestens (a) systemorientiert, (b) soziologisch und (c) „technologisch“ umgehen und sie entsprechend reflektieren können. Da aber die Gesamtthematik – wie sie auch im Titel der Tagung zum Ausdruck kommt – einen etwas sperrigen Gegenstand bildet, konzentriert sich der vorliegende Beitrag lediglich auf einen besonders wichtigen Aspekt. Mithin lautet die erkenntnisleitende Forschungsfrage: Wie kann man inter- bzw. transkulturelle,4 bi- bzw. multilinguale Kommunikationsräume im Kontakt der Kulturen mit den für sie charakteristischen zweisprachigen Diskursmodi (die oft durch verschiedene Ausprägungen von Hybridität gekennzeichnet sind) in disziplinärer Hinsicht sinnvoll analysieren? Also in welchem generellen Verstehensrahmen bzw. unter welchem "Blickwinkel", im Kompetenzbereich welcher linguistischen Teildisziplin, mit welcher Methodologie lassen sich die im Blickpunkt stehenden sprachkommunikativen Konstellationen, bilingualen Sprechhandlungen und entsprechenden Kontakt-, Interaktions-, Überblendungs- und Konvergenzphänomene sachangemessen untersuchen und heuristisch interpretieren? Solche Fragen erlangen m.E. angesichts der aktuellen Fachentwicklung der Sprachwissenschaft zunehmend Relevanz. War doch im Rahmen der kartesischen Sicht noch eine Einheit von Rationalität und Wissenschaft gegeben, ist spätestens seit Thomas Kuhn (1996) klar geworden, dass man es heute mit einem Nach- und Nebeneinander verschiedener (z.T. sogar inkommensurabler) „Paradigmen“ (Kuhn 1996), „Denkstile“ (vgl. Fleck 2002), „disziplinärer Matrizes“ (Kuhn 1977, 392 f.) oder Wissenschaftskulturen als diskursive Terrains zu tun hat.
We adopt Markert and Nissim (2005)’s approach of using the World Wide Web to resolve cases of coreferent bridging for German and discuss the strength and weaknesses of this approach. As the general approach of using surface patterns to get information on ontological relations between lexical items has only been tried on English, it is also interesting to see whether the approach works for German as well as it does for English and what differences between these languages need to be accounted for. We also present a novel approach for combining several patterns that yields an ensemble that outperforms the best-performing single patterns in terms of both precision and recall.
Tagging kausaler Relationen
(2005)
In dieser Diplomarbeit geht es um kausale Beziehungen zwischen Ereignissen und Erklärungsbeziehungen zwischen Ereignissen, bei denen kausale Relationen eine wichtige Rolle spielen. Nachdem zeitliche Relationen einerseits ihrer einfacheren Formalisierbarkeit und andererseits ihrer gut sichtbaren Rolle in der Grammatik (Tempus und Aspekt, zeitliche Konjunktionen) wegen in jüngerer Zeit stärker im Mittelpunkt des Interesses standen, soll hier argumentiert werden, dass kausale Beziehungen und die Erklärungen, die sie ermöglichen, eine wichtigere Rolle im Kohärenzgefüge des Textes spielen. Im Gegensatz zu “tiefen” Verfahren, die auf einer detaillierten semantischen Repr¨asentation des Textes aufsetzen und infolgedessen für unrestringierten Text m. E. nicht geeignet sind, wird hier untersucht, wie man dieses Ziel erreichen kann, ohne sich auf eine aufwändig konstruierte Wissensbasis verlassen zu müssen.
When a statistical parser is trained on one treebank, one usually tests it on another portion of the same treebank, partly due to the fact that a comparable annotation format is needed for testing. But the user of a parser may not be interested in parsing sentences from the same newspaper all over, or even wants syntactic annotations for a slightly different text type. Gildea (2001) for instance found that a parser trained on the WSJ portion of the Penn Treebank performs less well on the Brown corpus (the subset that is available in the PTB bracketing format) than a parser that has been trained only on the Brown corpus, although the latter one has only half as many sentences as the former. Additionally, a parser trained on both the WSJ and Brown corpora performs less well on the Brown corpus than on the WSJ one. This leads us to the following questions that we would like to address in this paper: - Is there a difference in usefulness of techniques that are used to improve parser performance between the same-corpus and the different-corpus case? - Are different types of parsers (rule-based and statistical) equally sensitive to corpus variation? To achieve this, we compared the quality of the parses of a hand-crafted constraint-based parser and a statistical PCFG-based parser that was trained on a treebank of German newspaper text.
In the past, a divide could be seen between ’deep’ parsers on the one hand, which construct a semantic representation out of their input, but usually have significant coverage problems, and more robust parsers on the other hand, which are usually based on a (statistical) model derived from a treebank and have larger coverage, but leave the problem of semantic interpretation to the user. More recently, approaches have emerged that combine the robustness of datadriven (statistical) models with more detailed linguistic interpretation such that the output could be used for deeper semantic analysis. Cahill et al. (2002) use a PCFG-based parsing model in combination with a set of principles and heuristics to derive functional (f-)structures of Lexical-Functional Grammar (LFG). They show that the derived functional structures have a better quality than those generated by a parser based on a state-of-the-art hand-crafted LFG grammar. Advocates of Dependency Grammar usually point out that dependencies already are a semantically meaningful representation (cf. Menzel, 2003). However, parsers based on dependency grammar normally create underspecified representations with respect to certain phenomena such as coordination, apposition and control structures. In these areas they are too "shallow" to be directly used for semantic interpretation. In this paper, we adopt a similar approach to Cahill et al. (2002) using a dependency-based analysis to derive functional structure, and demonstrate the feasibility of this approach using German data. A major focus of our discussion is on the treatment of coordination and other potentially underspecified structures of the dependency data input. F-structure is one of the two core levels of syntactic representation in LFG (Bresnan, 2001). Independently of surface order, it encodes abstract syntactic functions that constitute predicate argument structure and other dependency relations such as subject, predicate, adjunct, but also further semantic information such as the semantic type of an adjunct (e.g. directional). Normally f-structure is captured as a recursive attribute value matrix, which is isomorphic to a directed graph representation. Figure 5 depicts an example target f-structure. As mentioned earlier, these deeper-level dependency relations can be used to construct logical forms as in the approaches of van Genabith and Crouch (1996), who construct underspecified discourse representations (UDRSs), and Spreyer and Frank (2005), who have robust minimal recursion semantics (RMRS) as their target representation. We therefore think that f-structures are a suitable target representation for automatic syntactic analysis in a larger pipeline of mapping text to interpretation. In this paper, we report on the conversion from dependency structures to fstructure. Firstly, we evaluate the f-structure conversion in isolation, starting from hand-corrected dependencies based on the TüBa-D/Z treebank and Versley (2005)´s conversion. Secondly, we start from tokenized text to evaluate the combined process of automatic parsing (using Foth and Menzel (2006)´s parser) and f-structure conversion. As a test set, we randomly selected 100 sentences from TüBa-D/Z which we annotated using a scheme very close to that of the TiGer Dependency Bank (Forst et al., 2004). In the next section, we sketch dependency analysis, the underlying theory of our input representations, and introduce four different representations of coordination. We also describe Weighted Constraint Dependency Grammar (WCDG), the dependency parsing formalism that we use in our experiments. Section 3 characterises the conversion of dependencies to f-structures. Our evaluation is presented in section 4, and finally, section 5 summarises our results and gives an overview of problems remaining to be solved.
This paper is concerned with the tagging of spatial expressions in German newspaper articles, assigning a meaning to the expression and classifying the usages of the spatial expression and linking the derived referent to an event description. In our system, we implemented the activation of concepts in a very simple fashion, a concept is activated once (with a cost depending on the item that activated it) and is left activated thereafter. As an example, a city also activates the nodes for the region and the country it is part of, so that cities from one country are chosen over cities from different countries. A test corpus of 12 German newspaper articles was tested regarding several disambiguation strategies. Disambiguation was carried out via a beam search to find an approximately cost-optimal solution for the conflict set of potential grounding candidates for the tagged spatial expression. Test showed that the disambiguation strategies improved accuracy significantly.
Using a qualitative analysis of disagreements from a referentially annotated newspaper corpus, we show that, in coreference annotation, vague referents are prone to greater disagreement. We show how potentially problematic cases can be dealt with in a way that is practical even for larger-scale annotation, considering a real-world example from newspaper text.
We investigate methods to improve the recall in coreference resolution by also trying to resolve those definite descriptions where no earlier mention of the referent shares the same lexical head (coreferent bridging). The problem, which is notably harder than identifying coreference relations among mentions which have the same lexical head, has been tackled with several rather different approaches, and we attempt to provide a meaningful classification along with a quantitative comparison. Based on the different merits of the methods, we discuss possibilities to improve them and show how they can be effectively combined.
In this paper, we investigate the usefulness of a wide range of features for their usefulness in the resolution of nominal coreference, both as hard constraints (i.e. completely removing elements from the list of possible candidates) as well as soft constraints (where a cumulation of violations of soft constraints will make it less likely that a candidate is chosen as the antecedent). We present a state of the art system based on such constraints and weights estimated with a maximum entropy model, using lexical information to resolve cases of coreferent bridging.
Im Fokus dieser Magisterarbeit stehen Präpositionalphrasen (PP), deren Komplement eine unikale Komponente ist. Es handelt sich bei diesen Komplementen um Nomen, die außerhalb einer PP nicht vorkommen bzw. in anderen Umgebungen nicht die selbe Bedeutung haben. Um dieses Phänomen zu beschreiben wird eine Analyse innerhalb der Head-Driven Phrase Structure Grammar (HPSG) entwickelt. Grundkenntnisse über Struktur und Begrifflichkeiten der HPSG werden in dieser Arbeit vorausgesetzt, als Referenz siehe [PS94]. Die Gliederung gestaltet sich wie folgt: Zunächst werden die zu untersuchenden Daten im Detail dargestellt. Anschließend werden verschiedene Analysemöglichkeiten innerhalb der Theorie der HPSG in Betracht gezogen, nämlich Selektion, Konstruktion und Kollokation. Dabei muss festgestellt werden, dass die existierenden Ansätze den Daten nicht oder nur unbefriedigend gerecht werden können. Der Ansatz, der letztendlich verfolgt wird, besteht darin, den bereits existierenden Selektionsmechanismus über SPEC zu generalisieren. Dieses Vorgehen erlaubt dann der unikalen NP, die Präposition, mit welcher sie einhergeht, zu selegieren. Hierzu werden einige, jedoch vertretbare Änderungen in der HPSG-Architektur vorgenommen und es wird gezeigt, wie mit dem generalisierten Mechanismus die Daten behandelt werden können. Daran anschließend folgt eine Erweiterung des Phänomenbereichs auf Paarformeln. Ferner wird ein Einwand im Zusammenhang mit der Analyse des Komplements als NP bzw. DP diskutiert und zur weiteren Motivation des Ansatzes wird noch ein weiteres lokales Phänomen,die Distribution der Spur, mit der hier vorgestellten Herangehensweise modelliert. Darüberhinaus wird die Frage untersucht, ob man nicht auch PPs mit festen Verben geschickt analysieren kann. Dazu wird ein Weg, Lexeme zu selegieren, eingeführt und der entwickelte Mechanismus erweitert. Diese Erweiterung findet Anwendung bei der Modellierung der lokalen Distribution einer Partikel. Eine Zusammenfassung, sowie ein Ausblick auf weiterführende Fragestellungen schließen die Arbeit ab.
Freeze (1992) argued on the basis of data from several different languages that there is a close relationship between existential sentences (stating the existence of an entity) and locative sentences (stating the location of an entity). Freeze (1992) proposes that they are both derived from the same base structure and that the surface differences are rather due to the distinct information structures.This paper argues against this position with the data from Serbian existentials, which show clear syntactic differences from the locatives. Thus, the close relationship between existential and locative sentences that Freeze (1992) observes is conceptual, but not (necessarily) part of the syntax of the language. In order to account for the data, we propose that existential sentences originate from a different syntactic predication structure than the locative ones. The existential meaning arises, as we will show, from the interaction of this predication structure with the structure and meaning of the noun phrase.
In this paper I will discuss the formation of different types of yes/no questions in Serbian (examples in (1)), focusing on the syntactically and semantically puzzling example (1d), which involves the negative auxiliary inversion. Although there is a negative marker on the fronted auxiliary, the construction does not involve sentential negation. This coincides with the fact that the negative quantifying NPIs cannot be licensed. The question formation and sentential negation have similar syntactic effects cross-linguistically. This has led to various attempts to formulate a unifying syntactic account of the phenomena (ever since Klima 1964). One striking fact about the two syntactic contexts is that both license weak NPIs (Negative Polarity Items). It has been suggested (cf. Laka 1990, Culicover 1991) that the derivation of both interrogatives and negatives involves the same type of functional projection PolP (polarity phrase). One such account of the formation of negative interrogatives in Serbo- Croatian is offered by Progovac (2005). She proposes that there are two PolPs optionally cooccurring in the same clause, in which both positive and negative polarity items check their positive or negative features (following Haegeman and Zanuttini (1991) feature-checking account of negative structures, and the insights of Brown(1999) on the negation in Russian). On her account, the negative auxiliary question in (1d), is the case when both polarity phrases are present. The higher has [-pos +neg] features, and the lower one (below TP) is [-pos -neg]. Although her account correctly predicts the ungrammaticality of (2a) in contrast with (1c), it wrongly predicts the (2b) to be grammatical. I will argue that Progovac’s theory regarding the nature of the PolP is wrong. It employs both the binary feature valuation on the polarity head and the hierarchical ordering of the two polarity phrases, which eventually leads to overgeneration. On the account presented here the nature of the question marker (li vs zar) is highly relevant. Notice that (1b) and (1d) express presuppositions regarding the truth value of the propositions. In this way they contrast with (1a) and (1c). In addition, the type (1b) (with the question particle zar) can introduce both the positive and negative presupposition as shown in (3), which, semantically, makes this construction compatible with negative auxiliary questions in English (4a). The polarity items licensed in the relevant structures are also of the same type in both languages. The fronted-negative-auxiliary questions (1d) in Serbian are only possible with the particle li. In this case the presupposition is exclusively positive. The peculiar question/focus marking function of li (in Bulgarian and Russian) is well known. However, it is always assumed that its focus marking role is not relevant for the formation of yes/no questions. This I believe is not correct. The syntactic explanation of the interpretational facts points to the following: A) The possibility of the separate lexical encoding (particle zar) of the ‘rhetorical’ yes/no questions in Serbian allows the embedding of both positive and negated sentences, in which case the (weak) NPIs can remain in local relation with the negated verb. B) Recall that Serbian is an NC language, which requires local/c-command relation between the verbal negative marker and the NPI. With the negative inverted auxiliary questions this condition is not met, and the licensing of an n-word is not possible. C) The impossibility of licensing a weak NPI (i-words in the examples below) is due to the nature of the question marker li. (1) a. Da li je Vera videla ikoga / nekoga / *nikoga? DA Q aux Vera see.part.F.Sg anyone someone noone “Did Vera see anyone/someone/noone?” b. Zar je Vera videla ikoga / nekoga / *nikoga? ZAR aux Vera see.part.F.Sg anyone someone noone “Is it really the fact that Vera saw anyone/someone?” c. Je li Vera videla ikoga / nekoga /*nikoga? aux Q Vera see.part.F.Sg anyone someone noone “Did Vera see anyone/someone/noone?” d. Nije li Vera videla *ikoga / nekoga / *nikoga? neg+aux Q Vera see.part.F.Sg anyone someone noone “Didn’t Vera see someone?”/ “Vera saw someone, didn’t she?” (2) a. *Nije li Vera videla nikoga? neg+aux Q Vera see.part.F.Sg noone b. *Nije li Vera videla ikoga? neg+aux Q Vera see.part.F.Sg anyone (3) a. Zar je Vera videla nekoga / ikoga? ZAR aux Vera see.part.F.Sg someone/anyone b. Zar Vera nije videla nekoga/nikoga? ZAR Vera neg+aux see.part.F.Sg someone/anyone (4) a. Didn’t Vera (NOT) see someone/anyone? b. Vera saw someone, didn’t she?
The renowned Grimm Dictionary (1854-1961) makes the statement that the German copula sein (to be) is “the most general and colourless of all verbal concepts” (der allgemeinste und farbloseste aller verbalbegriffe). A more concise summary of the linguistic issues surrounding the copula is hardly possible. These two properties (and the latent tension between them!) make copulas a particularly interesting and vexing subject of linguistic research. Copulas appear to be almost colourless, i.e., devoid of any concrete meaning, thus leading to the question of why such expressions exist at all, not only in German but in the majority of the world’s languages. And at the same time copulas presumably provide the best window into the core of verbal concepts thereby telling us what it actually means to be a verb – at least in a language like German or English. While there is a rather rich body of research on copulas in philosophical and formal semantics including several in-depth studies on the copular systems of individual languages, copulas have received comparably little attention from a typological perspective. The monograph of Regina Pustet sets out to fill this gap. She presents an extensive cross-linguistic study of copula usage based on a sample of 154 languages drawn from the language families of the world. The analysis is embedded in the theoretical framework of functional typology. The study aims at uncovering universal principles that govern the distribution of copulas in nominal, adjectival, and verbal predications. Its major objective is the development of a “semantically-based model of copula distribution” (p.62) by means of which the presence vs. absence of copulas can be motivated through the inherent meaning of the lexical items they potentially combine with. Drawing mainly on the work by Givón (1979, 1984) and Croft (1991, 2001), who provide a functional foundation of the traditional parts of speech, Pustet identifies four semantic parameters which, if taken together, are claimed to support substantial generalisations on copula distribution – within a given language as well as crosslinguistically. These parameters are DYNAMICITY, TRANSIENCE, TRANSITIVITY, and DEPENDENCY. Pustet goes on to argue – and this is in fact the driving force behind the overall monograph – that the distributional behaviour of copulas, in turn, yields a useful methodology for developing a general approach to lexical categorization. Thus, in the long run Pustet aims at contributing to a better understanding of the traditional parts of speech, noun, adjective, and verb by defining them in terms of “semantic feature bundles, which can be arranged in [a] coherent semantic similarity space” (p.193).
Since Donald Davidson’s seminal work “The Logical Form of Action Sentences” (1967) event arguments have become an integral component of virtually every semantic theory. Over the past years Davidson´s proposal has been continuously extended such that nowadays event(uality) arguments are generally associated not only with action verbs but with predicates of all sorts. The reasons for such an extension are seldom explicitly justified. Most problematical in this respect is the case of stative expressions. By taking a closer look at copula sentences the present study assesses the legitimacy of stretching the Davidsonian notion of events and discusses its consequences. A careful application of some standard eventuality diagnostics (perception reports, combination with locative modifiers and manner adverbials) as well as some new diagnostics (behavior of certain degree adverbials) reveals that copular expressions do not behave as expected under a Davidsonian perspective: they fail all eventuality tests, regardless of whether they represent stage-level or individual-level predicates. In this respect, copular expressions pattern with stative verbs like know, hate, and resemble, which in turn differ sharply from state verbs like stand, sit, and sleep. The latter pass all of the eventuality tests and therefore qualify as true “Davidsonian state” expressions. On the basis of these empirical observations and taking up ideas of Kim (1969, 1976) and Asher (1993, 2000), an alternative account of copular expressions (and stative verbs) is provided, according to which the copula introduces a referential argument for a temporally bound property exemplification (= “Kimian state”). Considerations on some logical properties, viz. closure conditions and the latent infinite regress of eventualities, suggest that supplementing Davidsonian eventualities with Kimian states may yield not only a more adequate analysis of copula sentences but also a better understanding of eventualities in general.