Linguistik
Refine
Year of publication
- 2004 (30) (remove)
Document Type
- Preprint (11)
- Part of a Book (6)
- Conference Proceeding (6)
- Article (5)
- Working Paper (2)
Has Fulltext
- yes (30)
Is part of the Bibliography
- no (30)
Keywords
- Namenkunde (5)
- Computerlinguistik (4)
- Deutsch (4)
- Semantik (4)
- Syntax (4)
- Morphologie (3)
- Optimalitätstheorie (3)
- Phonologie (3)
- Frage (2)
- Japanisch (2)
Institute
- Extern (30) (remove)
Çeviribilimde Yöntem Sorunu
(2004)
Dieser Beitrag bearbeitet und behandelt die Funktion der Methodologie beim Erwerb wissenschaftlicher Erkenntnisse in Bezug auf das Verstehen des Übersetzungsvorgangs. Wie bekannt ist das Problem der Methodologie eines der meist diskutierten Themen in der Übersetzungswissenschaft. Obwohl inzwischen eine Reihe von wissenschaftlichen Ansätzen zu diesem Thema existiert, hat die Übersetzungswissenschaft noch keinen theoretischen Rahmen entwickelt, in dem der betreffende Forschungsgegenstand definiert wird. Aus diesem Grund unterscheiden sich die Arten der Angehensweise von übersetzungswissenschaftlichen Problemen. Außerdem scheinen die Definitionsbemühungen hinsichtlich des Forschungsgegenstandes der Übersetzungswissenschaft und der Methodenprobleme der übersetzungswissenschaftlichen Ansätze nicht unbedingt zufrieden stellende Antworten auf die Fragen in diesem Bereich zu liefern. Das Definitionsproblem der genauen theoretischen und methodologischen Orientierung der Übersetzungswissenschaft in der allgemeinen Wissenschaftswelt hängt neben ihrem strittigen Standort als einer neuen Disziplin auch von zwei weiteren Grundfaktoren ab: 1. Probleme, mit denen man bei der Festlegung einer vereinenden Übersetzungstheorie konfrontiert ist, da die Übersetzung einen vielseitigen und komplexen Objektbereich umfaßt; 2. ungenügende Forschungen in Bezug auf methodologische Ansätze in der Übersetzungswissenschaft. Wie bekannt profitiert man bei der Entwicklung einer Übersetzungstheorie auch von der Methodologie anderer Disziplinen. Diese Methoden sind wie vielseitige Mittel, die bei der Lösung von Problemen in Bereichen wie übersetzungswissenschaftliche Forschungen, Didaktik des Übersetzens und Übersetzungsprozess angewandt werden können. Diese Methoden werden außerdem einen Beitrag dazu leisten, definierende Übersetzungsmethoden hinsichtlich über-setzungswissenschaftlicher Ansätze für das Verstehen des Übersetzungsvor-ganges zu entwickeln.
Seit der zweiten Hälfte des zwanzigsten Jahrhunderts sind im theoretischen Bereich der Übersetzungswissenschaft wichtige Veränderungen zu beobachten. Von Cicero bis zur zweiten Hälfte des letzten Jahrhunderts verlagerte sich die ausgangssprachenorientierte Übersetzungsauffassung auf die zielsprachenorientierten. Somit haben sich immer mehr die zielsprachenorientierte Forschungen im Bereich der Übersetzungstheorie als ein übersetzungsrelevantes Phänomen durchgesetzt. Insbesondere haben die nach den 70’er Jahren entworfenen Übersetzungstheorien, in denen der Übersetzer immer mehr in das Zentrum des Forschungsinteresse rückt und entsprechende übersetzungsprozessualorientierte Ansätze sich aufdrängen, an Wichtigkeit eingebüßt. Nach diesen Ansätzen rücken normative Belange in Bezug auf erfolgreiche Übersetzung in Form von Prinzipien und Regeln in den Vordergrund. Heutzutage ist das Interesse an theoretische Forschungen besonders auf deskriptive Beschreibungen des Übersetzungsphänomens gerichtet. Damit die Theorie mit der Praxis übereinstimmt, sollte man vor allem die allgemeinen Grundsätze der Übersetzungstheorien, die Grundlage zur Praxis bilden, explizit verarbeiten. Wenn man auch nicht erwartet, dass die Übersetzungstheorien alle in der Praxis der Übersetzung entstandenen Probleme bewältigen können, ist aber trotzdem davon auszugehen, dass der Übersetzer, welcher über die allgemeine theoretische Grundlage verfügt, in seiner Übersetzungstätigkeit mehr Erfolg haben wird, weshalb die Praxis und Theorie voneinander recht gering abweichen werden. Die Auseinandersetzung mit diesem Tatbestand, also mit der Theorie, kann die Lösung der probablen Fehler erleichtern. Außerdem besteht somit die Möglichkeit, die Effizienz der Theorie auf die Anwendung herauszufinden und demzufolge kann die durch praktische Ausführung ermittelten Ergebnisse eine ganzheitliche Präzisierung der theoretischen Beschreibungen nach sich ziehen.
Japanese is often taken to be strictly head-final in its syntax. In our work on a broad-coverage, precision implemented HPSG for Japanese, we have found that while this is generally true, there are nonetheless a few minor exceptions to the broad trend. In this paper, we describe the grammar engineering project, present the exceptions we have found, and conclude that this kind of phenomenon motivates on the one hand the HPSG type hierarchical approach which allows for the statement of both broad generalizations and exceptions to those generalizations and on the other hand the usefulness of grammar engineering as a means of testing linguistic hypotheses.
Hybrid robust deep and shallow semantic processing for creativity support in document production
(2004)
The research performed in the DeepThought project (http://www.project-deepthought.net) aims at demonstrating the potential of deep linguistic processing if added to existing shallow methods that ensure robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. We use this approach to demonstrate the feasibility of three ambitious applications, one of which is a tool for creativity support in document production and collective brainstorming. This application is described in detail in this paper. Common to all three applications, and the basis for their development is a platform for integrated linguistic processing. This platform is based on a generic software architecture that combines multiple NLP components and on robust minimal recursive semantics (RMRS) as a uniform representation language.
The research performed in the DeepThought project aims at demonstrating the potential of deep linguistic processing if combined with shallow methods for robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. On the basis of this approach, the feasibility of three ambitious applications will be demonstrated, namely: precise information extraction for business intelligence; email response management for customer relationship management; creativity support for document production and collective brainstorming. Common to these applications, and the basis for their development is the XML-based, RMRS-enabled core architecture framework that will be described in detail in this paper. The framework is not limited to the applications envisaged in the DeepThought project, but can also be employed e.g. to generate and make use of XML standoff annotation of documents and linguistic corpora, and in general for a wide range of NLP-based applications and research purposes.
While the sortal constraints associated with Japanese numeral classifiers are wellstudied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broadcoverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
Außerhalb der indoeuropäischen Sprachen [erfreut sich] [d]ie Kategorie „Adjektiv“ […] einer geringeren Verbreitung als man als Laie vermuten würde, und es zeigen sich in nicht-indoeuropäischen Sprachen von den europäischen Sprachen stark verschiedene Aufteilungen der Welt in Nomina und Verba. Eine bisher nicht beschriebene Verteilung von Konzepten auf Wortarten in der Sprache Guarani, welche hauptsächlich in Paraguay gesprochen wird, ist das Thema dieser Arbeit.
Namenskunde
(2004)
Eigennamen (auch Propria, Onyme) werden unter die Substantive subsumiert und erfüllen spezifische referentielle Funktionen. Im Gegensatz zu den Appellativen (Gattungsbezeichnungen) wie z. B. Mensch oder Stadt, die eine ganze Klasse von Gegenständen bezeichnen, referieren Eigennamen prototypischerweise nur auf ein einziges Denotat (Monoreferentialität), z. B. Goethe oder Frankfurt.
Vom Name-n-forscher zum Name-ns-forscher : unbefugte oder befugte ns-Fuge in Namen(s)-Komposita?
(2004)
Um die nun im Titel gestellte Frage zu beantworten: Es ist befugt, Komposita mit Name als Erstglied mit -ns- zu verfugen. Die Korpusbefimde weisen überdeutlich aus, daß "ns- hier hochproduktiv ist. Als Grund fiir diese starke Bevorzugung der ns-Fuge wurde der "Rückzug" der n-Fuge auf die Klasse der belebten, schwachen Maskulina und damit die Funktionalisierung ebendieser Fuge als Klassen- und Belebtheitszeichen ermittelt. Der Name als Simplex hat sich zwar bereits mit dem starken Genitiv Singular Namens aus der Klasse der schwachen Maskulina entfernt, doch verharrt er weiterhin in einer kleinen Mischklasse, deren Mitglieder zum größten Teil bereits in die starke (sog. "Balken-") Klasse abgewandert sind oder dabei sind, dies zu tun. Daß der Name sich diesem Wandel entzieht, geschieht jedoch unbefugter- und unerklärtermaßen. Die Beschäftigung mit den Namen/s-Schwankungen hat ferner erbracht, daß gerade die ältere Schicht an Namens-Komposita lexikalisiert ist (Namenstag, Namensvetter) und daß die n-Fuge nur noch in fachsprachlicher Verwendung dominiert (Namenaktie, Namenkunde, Namenforschung). Als förderlich für die ns-Verfugung haben sich gerade die (ansonsten fugenhemmend wrrkenden) deverbalen Zweitglieder erweisen (Namensgebung), als hinderlich dagegen die Komplexität der 1. Konstitutente (Familiennamenforschung) - wenngleich diese Tendenzen nur fiir die s-Fuge ermittelt wurden. Die ns-Fuge erweist sich ilrrerseits als bessere Binnengrenzmarkierung, da [s] positionsbeschränkt, d.h. im Wortanlaut blockiert ist. Sowohl bei -n- als auch bei -ns- handelt es sich um paradigmische Fugen. Der Zufall bzw. das Alphabet will es, daß der Eintrag Name zwischen Naivling und Nandu (< span.-südam. nandu [njan'du]), dem südamerikanischen Kollegen des afrikanischen Straußenvogels, angesiedelt ist. Was den Nandu betrifft, so hat sich dieser Beitrag zumindest darum bemüht, den Kopf nicht in den Sand zu stecken. Was jedoch den Naivling anbelangt, so befinden wir uns bei dem faszinierenden Thema der Fugenelemente immer noch in diesem Stadium, auch wenn mittlerweile bei der Frage nach Funktion und Grammatik dieser "Grenzfälle morphologischer Einheiten" (so der Titel von Fuhrhop 1998) große Durchbrüche erzielt worden sind. Wenn es aber, wie in diesem Beitrag, um Schwankungs- und damit um Grenzfälle solcher Grenzfälle geht, so tut sich, um die Sache positiv zu wenden, ein ganzer Strauß (oder Nandu) an Desideraten, Herausforderungen und Forschungsperspektiven auf.
Zeitnamen
(2004)
Der menschliche Alltag, das gesamte gesellschaftliche und individuelle Leben, unser Denken, Planen und Handeln basiert auf der Unterscheidung und Benennung von Zeitpunkten (im Sinne punktuell wahrgenommener Zeit) und Zeitabschnitten (im Sinne von sich über einen Zeitraum erstreckender Zeit). Damit ist eine von mindestens drei Bedingungen, onymisch bezeichnet zu werden, hochgradig erfülllt: die Relevanz des Objekts (beziehungsweise der Entität) in seiner Singularität und Individualität für den Menschen.
Those principles of Naturalness as postulated by Mayerthaler (1981) claim to make predtictions about the direction of language change possible. It is true that the majority of morphological changes can be accounted for by these principles. However, systematic violations of these rules can be found in of all things, some of most frequent, elementary verbs such as HAVE, BE, BECOME, COME, GO, GIVE, TAKE, etc. Their irregularities cannot be accounted for solely - as Naturalness Theory would have it - by conflicts between phonological and morphological Naturalness. Rather, they have been systematically built up through other efficient strategies. This "regularity of irregularity" is the focus of this paper, which demonstrates several particularly well-beaten paths to irregularization through contrastive diachronic investigations of frequent verbs in different Germanic languages. lrregularity, a term laden with negative connotations, is substituted by the term differentiation, which names the actual function directly. Because differentiation typically correlates with word brevity, this constellation should be considered an ideal compromise between hearer and speaker interests. A further question to be addressed is which individual categories are expressed through irregularization. It is concluded that this process is guided by token frequency and degree of relevance.
Je nach regionaler Herkunft realisieren Sprecher des Deutschen die beiden Wörter "Verein" und "überall" unterschiedlich. [...] Der Grundgedanke dieser sprachtypologischen Unterscheidung, bei der wir uns hauptsächlich auf die Arbeiten von P. Auer (1993, 1994, 2001) sowie P. Auer / S. Uhmann (1988) beziehen, besteht darin, dass alle Sprachen eine Form von Isochronie anstreben.
Als Jürgen Udolph am 1. Oktober 2003 das Symposion "Völkernamen, Ländernamen, Landschaftsnamen" in Leipzig eröffnete, sagte er unter anderem: "Ich freue mich, daß Sie alle den Weg in die neuen Bundesländer gefunden haben". Genau dieser Satz leitete unbeabsichtigt die Fragestellung meines damaligen Vortrags bzw. des hier vorliegenden Beitrags ein: Ist das Syntagma die neuen Bundesländer bereits ein Eigenname, ist es noch eine definite Beschreibung, oder ist es etwas dazwischen? Wäre es auch möglich gewesen, zu sagen: "Ich freue mich, daß Sie den Weg in ein neues Bundesland ... " oder" ... in das neue Bundesland Sachsen gefunden haben"? Die muttersprachliche Kompetenz verneint diese Alternativen eher, und dies deutet daraufhin, daß dieses Syntagma bereits stark proprialisiert (oder onymisiert) sein muß.
Fluch- und Schimpfwortschätze sind aus kontrastiver Perspektive bisher kaum analysiert worden, sieht man von einer Vielzahl populärwissenschaftlicher Publikationen ab. Wissenschaftliche Publikationen beziehen sich meist auf eine Einzelsprache und greifen bei der Erklärung der Motive oft zu kurz, weil sie gerade benachbarte Kulturen und Sprachen (auch Dialektgebiete) zu wenig im Blick haben (Dundes 1983). Der vorliegende Beitrag leistet eine vergleichende Zusammenstellung der Fluch- und Schimpfwortschätze dreier mehr oder weniger benachbarter Sprachen, des (nördlichen) Niederländischen, des Deutschen und des Schwedischen, also zweier eng verwandter westgermanischer und einer nordgermanischen Sprache.
Prinzipien der Proprialitätsmarkierung : Familiennamenindikatoren in den nordeuropäischen Sprachen
(2004)
In dem grundlegenden Beitrag "Svenska släktnamn i gar, i dag - i morgon?" liefert Thorsten Andersson einen kompakten Überblick über ein bewegtes Jahrhundert schwedischer Familiennamengeschichte. Dabei handelt es sich zur Überraschung deutscher Leser/innen um das 20. Jahrhundert. In Deutschland wüsste man mit dem Titel ,,Deutsche Familiennamen gestern, heute -morgen?" nicht viel anzufangen, zumindest nicht mit der Frage nach dem Heute und dem Morgen: Die deutschen Familiennamen sind seit Jahrhunderten fixiert; von seltenen und wohlbegründeten Ausnahmen abgesehen kann niemand seinen Familiennamen wechseln geschweige denn frei kreieren. Und die Frage nach dem Morgen hat sich vermutlich noch nie jemand gestellt.
The argument that I tried to elaborate on in this paper is that the conceptual problem behind the traditional competence/performance distinction does not go away, even if we abandon its original Chomskyan formulation. It returns as the question about the relation between the model of the grammar and the results of empirical investigations – the question of empirical verification The theoretical concept of markedness is argued to be an ideal correlate of gradience. Optimality Theory, being based on markedness, is a promising framework for the task of bridging the gap between model and empirical world. However, this task not only requires a model of grammar, but also a theory of the methods that are chosen in empirical investigations and how their results are interpreted, and a theory of how to derive predictions for these particular empirical investigations from the model. Stochastic Optimality Theory is one possible formulation of a proposal that derives empirical predictions from an OT model. However, I hope to have shown that it is not enough to take frequency distributions and relative acceptabilities at face value, and simply construe some Stochastic OT model that fits the facts. These facts first of all need to be interpreted, and those factors that the grammar has to account for must be sorted out from those about which grammar should have nothing to say. This task, to my mind, is more complicated than the picture that a simplistic application of (not only) Stochastic OT might draw.
The aim of this paper is the exploration of an optimality theoretic architecture for syntax that is guided by the concept of "correspondence": syntax is understood as the mechanism of "translating" underlying representations into a surface form. In minimalism, this surface form is called "Phonological Form" (PF). Both semantic and abstract syntactic information are reflected by the surface form. The empirical domain where this architecture is tested are minimal link effects, especially in the case of "wh"-movement. The OT constraints require the surface form to reflect the underlying semantic and syntactic representations as maximally as possible. The means by which underlying relations and properties are encoded are precedence, adjacency, surface morphology and prosodic structure. Information that is not encoded in one of these ways remains unexpressed, and gets lost unless it is recoverable via the context. Different kinds of information are often expressed by the same means. The resulting conflicts are resolved by the relative ranking of the relevant correspondence constraints.
Weak function word shift
(2004)
The fact that object shift only affects weak pronouns in mainland Scandinavian is seen as an instance of a more general observation that can be made in all Germanic languages: weak function words tend to avoid the edges of larger prosodic domains. This generalisation has been formulated within Optimality Theory in terms of alignment constraints on prosodic structure by Selkirk (1996) in explaining thedistribution of prosodically strong and weak forms of English functionwords, especially modal verbs, prepositions and pronouns. But a purely phonological account fails to integrate the syntactic licensing conditions for object shift in an appropriate way. The standard semantico-syntactic accounts of object shift, onthe other hand, fail to explain why it is only weak pronouns that undergo object shift. This paper develops an Optimality theoretic model of the syntax-phonology interface which is based on the interaction of syntactic and prosodic factors. The account can successfully be applied to further related phenomena in English and German.
Die Ressource "Wissen" rückte in den letzten Jahrzehnten als Quelle wissenschaftlicher Innovation immer stärker ins Zentrum des Interesses. Diese Fokussierung mündete in eine Selbstreflexion der Wissenschaft und der wissenschaftlichen Disziplinen: Thematisiert werden vor allem die Art und Weise, wie Wissen gewonnen wird, sowie die damit zusammenhängende Frage nach der Konstruktion von Wissenschaftlichkeit, womit das Bewusstsein gleichzeitig auf die mehr und mehr sich auflösende Abgrenzung zwischen den Disziplinen beziehungsweise zwischen den drei hauptsächlichen Wissenschaftskulturen, von Natur-, Geistes- und Kultur- sowie Sozialwissenschaften gelenkt wird. Innerhalb und außerhalb der Universitäten bildeten und bilden sich nicht immer klar verortbare "trading zones" (Gallison 1997), in denen neue Formen und Techniken der Wissensproduktion und Wissensvermittlung geprüft, geübt und teilweise auch institutionalisiert werden. ...
This paper is concerned with the tagging of spatial expressions in German newspaper articles, assigning a meaning to the expression and classifying the usages of the spatial expression and linking the derived referent to an event description. In our system, we implemented the activation of concepts in a very simple fashion, a concept is activated once (with a cost depending on the item that activated it) and is left activated thereafter. As an example, a city also activates the nodes for the region and the country it is part of, so that cities from one country are chosen over cities from different countries. A test corpus of 12 German newspaper articles was tested regarding several disambiguation strategies. Disambiguation was carried out via a beam search to find an approximately cost-optimal solution for the conflict set of potential grounding candidates for the tagged spatial expression. Test showed that the disambiguation strategies improved accuracy significantly.
The purpose of this paper is to describe the TüBa-D/Z treebank of written German and to compare it to the independently developed TIGER treebank (Brants et al., 2002). Both treebanks, TIGER and TüBa-D/Z, use an annotation framework that is based on phrase structure grammar and that is enhanced by a level of predicate-argument structure. The comparison between the annotation schemes of the two treebanks focuses on the different treatments of free word order and discontinuous constituents in German as well as on differences in phrase-internal annotation.
The purpose of this paper is to describe recent developments in the morphological, syntactic, and semantic annotation of the TüBa-D/Z treebank of German. The TüBa-D/Z annotation scheme is derived from the Verbmobil treebank of spoken German [4, 10], but has been extended along various dimensions to accommodate the characteristics of written texts. TüBa-D/Z uses as its data source the "die tageszeitung" (taz) newspaper corpus. The Verbmobil treebank annotation scheme distinguishes four levels of syntactic constituency: the lexical level, the phrasal level, the level of topological fields, and the clausal level. The primary ordering principle of a clause is the inventory of topological fields, which characterize the word order regularities among different clause types of German, and which are widely accepted among descriptive linguists of German [3, 6]. The TüBa-D/Z annotation relies on a context-free backbone (i.e. proper trees without crossing branches) of phrase structure combined with edge labels that specify the grammatical function of the phrase in question. The syntactic annotation scheme of the TüBa-D/Z is described in more detail in [12, 11]. TüBa-D/Z currently comprises approximately 15 000 sentences, with approximately 7 000 sentences being in the correction phase. The latter will be released along with an updated version of the existing treebank before the end of this year. The treebank is available in an XML format, in the NEGRA export format [1] and in the Penn treebank bracketing format. The XML format contains all types of information as described above, the NEGRA export format contains all sentenceinternal information while the Penn treebank format includes only those layers of information that can be expressed as pure tree structures. Over the course of the last year, more fine grained linguistic annotations have been added along the following dimensions: 1. the basic Stuttgart-Tübingen tagset, STTS, [9] labels have been enriched by relevant features of inflectional morphology, 2. named entity information has been encoded as part of the syntactic annotation, and 3. a set of anaphoric and coreference relations has been added to link referentially dependent noun phrases. In the following sections, we will describe each of these innovations in turn and will demonstrate how the additional annotations can be incorporated into one comprehensive annotation scheme.
Transforming constituent-based annotation into dependency-based annotation has been shown to work for different treebanks and annotation schemes (e.g. Lin (1995) has transformed the Penn treebank, and Kübler and Telljohann (2002) the Tübinger Baumbank des Deutschen (TüBa-D/Z)). These ventures are usually triggered by the conflict between theory-neutral annotation, that targets most needs of a wider audience, and theory-specific annotation, that provides more fine-grained information for a smaller audience. As a compromise, it has been pointed out that treebanks can be designed to support more than one theory from the start (Nivre, 2003). We argue that information can also be added to an existing annotation scheme so that it supports additional theory-specific annotations. We also argue that such a transformation is useful for improving and extending the original annotation scheme with respect to both ambiguous annotation and annotation errors. We show this by analysing problems that arise when generating dependency information from the constituent-based TüBa-D/Z.
This paper reports on the SYN-RA (SYNtax-based Reference Annotation) project, an on-going project of annotating German newspaper texts with referential relations. The project has developed an inventory of anaphoric and coreference relations for German in the context of a unified, XML-based annotation scheme for combining morphological, syntactic, semantic, and anaphoric information. The paper discusses how this unified annotation scheme relates to other formats currently discussed in the literature, in particular the annotation graph model of Bird and Liberman (2001) and the pie-in-thesky scheme for semantic annotation.
Tree-local MCTAG with shared nodes : an analysis of word order variation in German and Korean
(2004)
Tree Adjoining Grammars (TAG) are known not to be powerful enough to deal with scrambling in free word order languages. The TAG-variants proposed so far in order to account for scrambling are not entirely satisfying. Therefore, an alternative extension of TAG is introduced based on the notion of node sharing. Considering data from German and Korean, it is shown that this TAG-extension can adequately analyse scrambling data, also in combination with extraposition and topicalization.
This paper sets up a framework for LTAG (Lexicalized Tree Adjoining Grammar) semantics that brings together ideas from different recent approaches addressing some shortcomings of TAG semantics based on the derivation tree. Within this framework, several sample analyses are proposed, and it is shown that the framework allows to analyze data that have been claimed to be problematic for derivation tree based LTAG semantics approaches.
LTAG semantics for questions
(2004)
This papers presents a compositional semantic analysis of interrogatives clauses in LTAG (Lexicalized Tree Adjoining Grammar) that captures the scopal properties of wh- and nonwh-quantificational elements. It is shown that the present approach derives the correct semantics for examples claimed to be problematic for LTAG semantic approaches based on the derivation tree. The paper further provides an LTAG semantics for embedded interrogatives.