Institutes
Refine
Year of publication
Document Type
- Conference Proceeding (37) (remove)
Has Fulltext
- yes (37)
Keywords
- Computerlinguistik (19)
- Japanisch (10)
- Maschinelle Übersetzung (8)
- Deutsch (5)
- Türkisch (4)
- Standardisierung (3)
- Technische Unterlage (3)
- Übersetzung (3)
- Fremdsprachenlernen (2)
- Grammatik (2)
Institute
- Extern (37)
No other country is influenced in its political, social and cultural structures by both western and eastern mentality such as Lebanon, and hardly any other country has such a pivotal function. In this mediator function it can be compared with a literary work, that merits its role in world literature as hardly any other piece of literature in regard to the co-operation of Orient and Occident. I am thinking of the collection of "A Thousand and One Nights", or with its original title "Alf Laila wa-Laila".
The discourses on textuality and literacy that can be observed in the Kyot-Excursus in 'Parcival' by Wolfram von Eschenbach and in the Magnetbergerzählung of the 'Reinfried von Braunschweig' will serve here as examples in an attempt to historicize textual models. My essay will focus on how the limits of textuality could be defines within those 13th-century aristocratic orders of knowledge to which court literature can provide an access. What emerges within this context are concepts and ideas that lie beyond the scope of modern scholarly systems; these narratives indicate a way of dealing with textuality and literacy that, rather than referring to the textual discourse, may remain instead on the phenomenal surface of the material or (as if the textual discourse did not exist) may embody implicitly the circumstances that it signifies.
Was die altgermanistische Fachidentität wo nicht zu gefährden droht, da doch neu zu bestimmen nahe legt, das lässt sich am einfachsten unter jenem gängigen Stichwort 'Kulturwissenschaft' fassen, welches überhaupt in den Programm- und Legitimierungdebatten solcher akademischen Fächer eine zentrale Rolle spielt, die man einmal ohne weiteres die Geisteswissenschaften nannte. Dabei scheint durchaus umstritten zu sein, ob mit 'Kulturwissenschaften' ein Bruch mit den Traditionen der Deutschen Philologie angesagt ist oder im Gegenteil deren neuerliche Stabilisierung.
In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.
This demo abstract describes the SmartWeb Ontology-based Information Extraction System (SOBIE). A key feature of SOBIE is that all information is extracted and stored with respect to the SmartWeb ontology. In this way, other components of the systems, which use the same ontology, can access this information in a straightforward way. We will show how information extracted by SOBIE is visualized within its original context, thus enhancing the browsing experience of the end user.
Seit der zweiten Hälfte des letzten Jahrhunderts zieht die Übersetzung im Fremdsprachenunterricht (FSU) das Interesse der Fremdsprachendidaktiker auf sich. In den anhaltenden Diskussionen über den Stellenwert der Übersetzung im FSU bestehen aber immer noch verschiedene Meinungen. Die Meinungsverschiedenheiten beruhen vor allem auf diversen miteinander konkurrierenden Lerntheorien und damit auch auf unterschiedlichen methodischen Prinzipien. Im Zusammenhang mit den herrschenden didaktischen Richtungen und mit den unterschiedlichen Lernzielen, die im Fremdsprachenunterricht verfolgt werden können, wird auch die Übersetzung unter mehreren Gesichtspunkten betrachtet und bewertet. Hinsichtlich der Funktion der Übersetzung ist es inzwischen üblich geworden, zwischen zwei Verwendungsweisen zu unterscheiden: Einerseits wird die Übersetzung als ein methodisches Mittel zur Festigung, Erweiterung und Prüfung sprachlicher Fertigkeiten angewendet, andererseits ist sie als eine eigene Fertigkeit selbst ein Übungs- und Unterrichtsziel.
This paper proposes an annotating scheme that encodes honorifics (respectful words). Honorifics are used extensively in Japanese, reflecting the social relationship (e.g. social ranks and age) of the referents. This referential information is vital for resolving zero
pronouns and improving machine translation outputs. Annotating honorifics is a complex task that involves identifying a predicate with honorifics, assigning ranks to referents of the
predicate, calibrating the ranks, and connecting referents with their predicates.
The Deep Linguistic Processing with HPSG Initiative (DELH-IN) provides the infrastructure needed to produce open-source semantic transfer-based machine translation systems. We have made available a prototype Japanese-English machine translation system built from existing resources include parsers, generators, bidirectional grammars and a transfer engine.
Japanese is often taken to be strictly head-final in its syntax. In our work on a broad-coverage, precision implemented HPSG for Japanese, we have found that while this is generally true, there are nonetheless a few minor exceptions to the broad trend. In this paper, we describe the grammar engineering project, present the exceptions we have found, and conclude that this kind of phenomenon motivates on the one hand the HPSG type hierarchical approach which allows for the statement of both broad generalizations and exceptions to those generalizations and on the other hand the usefulness of grammar engineering as a means of testing linguistic hypotheses.
While the sortal constraints associated with Japanese numeral classifiers are wellstudied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broadcoverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
Hybrid robust deep and shallow semantic processing for creativity support in document production
(2004)
The research performed in the DeepThought project (http://www.project-deepthought.net) aims at demonstrating the potential of deep linguistic processing if added to existing shallow methods that ensure robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. We use this approach to demonstrate the feasibility of three ambitious applications, one of which is a tool for creativity support in document production and collective brainstorming. This application is described in detail in this paper. Common to all three applications, and the basis for their development is a platform for integrated linguistic processing. This platform is based on a generic software architecture that combines multiple NLP components and on robust minimal recursive semantics (RMRS) as a uniform representation language.
The research performed in the DeepThought project aims at demonstrating the potential of deep linguistic processing if combined with shallow methods for robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. On the basis of this approach, the feasibility of three ambitious applications will be demonstrated, namely: precise information extraction for business intelligence; email response management for customer relationship management; creativity support for document production and collective brainstorming. Common to these applications, and the basis for their development is the XML-based, RMRS-enabled core architecture framework that will be described in detail in this paper. The framework is not limited to the applications envisaged in the DeepThought project, but can also be employed e.g. to generate and make use of XML standoff annotation of documents and linguistic corpora, and in general for a wide range of NLP-based applications and research purposes.
Seit der zweiten Hälfte des zwanzigsten Jahrhunderts sind im theoretischen Bereich der Übersetzungswissenschaft wichtige Veränderungen zu beobachten. Von Cicero bis zur zweiten Hälfte des letzten Jahrhunderts verlagerte sich die ausgangssprachenorientierte Übersetzungsauffassung auf die zielsprachenorientierten. Somit haben sich immer mehr die zielsprachenorientierte Forschungen im Bereich der Übersetzungstheorie als ein übersetzungsrelevantes Phänomen durchgesetzt. Insbesondere haben die nach den 70’er Jahren entworfenen Übersetzungstheorien, in denen der Übersetzer immer mehr in das Zentrum des Forschungsinteresse rückt und entsprechende übersetzungsprozessualorientierte Ansätze sich aufdrängen, an Wichtigkeit eingebüßt. Nach diesen Ansätzen rücken normative Belange in Bezug auf erfolgreiche Übersetzung in Form von Prinzipien und Regeln in den Vordergrund. Heutzutage ist das Interesse an theoretische Forschungen besonders auf deskriptive Beschreibungen des Übersetzungsphänomens gerichtet. Damit die Theorie mit der Praxis übereinstimmt, sollte man vor allem die allgemeinen Grundsätze der Übersetzungstheorien, die Grundlage zur Praxis bilden, explizit verarbeiten. Wenn man auch nicht erwartet, dass die Übersetzungstheorien alle in der Praxis der Übersetzung entstandenen Probleme bewältigen können, ist aber trotzdem davon auszugehen, dass der Übersetzer, welcher über die allgemeine theoretische Grundlage verfügt, in seiner Übersetzungstätigkeit mehr Erfolg haben wird, weshalb die Praxis und Theorie voneinander recht gering abweichen werden. Die Auseinandersetzung mit diesem Tatbestand, also mit der Theorie, kann die Lösung der probablen Fehler erleichtern. Außerdem besteht somit die Möglichkeit, die Effizienz der Theorie auf die Anwendung herauszufinden und demzufolge kann die durch praktische Ausführung ermittelten Ergebnisse eine ganzheitliche Präzisierung der theoretischen Beschreibungen nach sich ziehen.
Çeviribilimde Yöntem Sorunu
(2004)
Dieser Beitrag bearbeitet und behandelt die Funktion der Methodologie beim Erwerb wissenschaftlicher Erkenntnisse in Bezug auf das Verstehen des Übersetzungsvorgangs. Wie bekannt ist das Problem der Methodologie eines der meist diskutierten Themen in der Übersetzungswissenschaft. Obwohl inzwischen eine Reihe von wissenschaftlichen Ansätzen zu diesem Thema existiert, hat die Übersetzungswissenschaft noch keinen theoretischen Rahmen entwickelt, in dem der betreffende Forschungsgegenstand definiert wird. Aus diesem Grund unterscheiden sich die Arten der Angehensweise von übersetzungswissenschaftlichen Problemen. Außerdem scheinen die Definitionsbemühungen hinsichtlich des Forschungsgegenstandes der Übersetzungswissenschaft und der Methodenprobleme der übersetzungswissenschaftlichen Ansätze nicht unbedingt zufrieden stellende Antworten auf die Fragen in diesem Bereich zu liefern. Das Definitionsproblem der genauen theoretischen und methodologischen Orientierung der Übersetzungswissenschaft in der allgemeinen Wissenschaftswelt hängt neben ihrem strittigen Standort als einer neuen Disziplin auch von zwei weiteren Grundfaktoren ab: 1. Probleme, mit denen man bei der Festlegung einer vereinenden Übersetzungstheorie konfrontiert ist, da die Übersetzung einen vielseitigen und komplexen Objektbereich umfaßt; 2. ungenügende Forschungen in Bezug auf methodologische Ansätze in der Übersetzungswissenschaft. Wie bekannt profitiert man bei der Entwicklung einer Übersetzungstheorie auch von der Methodologie anderer Disziplinen. Diese Methoden sind wie vielseitige Mittel, die bei der Lösung von Problemen in Bereichen wie übersetzungswissenschaftliche Forschungen, Didaktik des Übersetzens und Übersetzungsprozess angewandt werden können. Diese Methoden werden außerdem einen Beitrag dazu leisten, definierende Übersetzungsmethoden hinsichtlich über-setzungswissenschaftlicher Ansätze für das Verstehen des Übersetzungsvor-ganges zu entwickeln.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
Based on a detailed case study of parallel grammar development distributed across two sites, we review some of the requirements for regression testing in grammar engineering, summarize our approach to systematic competence and performance profiling, and discuss our experience with grammar development for a commercial application. If possible, the workshop presentation will be organized around a software demonstration.
We present a broad coverage Japanese grammar written in the HPSG formalism with MRS semantics. The grammar is created for use in real world applications, such that robustness and performance issues play an important role. It is connected to a POS tagging and word segmentation tool. This grammar is being developed in a multilingual context, requiring MRS structures that are easily comparable across languages.
We present an architecture for the integration of shallow and deep NLP components which is aimed at flexible combination of different language technologies for a range of practical current and future applications. In particular, we describe the integration of a high-level HPSG parsing system with different high-performance shallow components, ranging from named entity recognition to chunk parsing and shallow clause recognition. The NLP components enrich a representation of natural language text with layers of new XML meta-information using a single shared data structure, called the text chart. We describe details of the integration methods, and show how information extraction and language checking applications for realworld German text benefit from a deep grammatical analysis.
In this paper we show an approach to the customization of GermaNet to the German HPSG grammar lexicon developed in the Verbmobil project. GermaNet has a broad coverage of the German base vocabulary and fine-grained semantic classification; while the HPSG grammar lexicon is comparatively small und has a coarse-grained semantic classification. In our approach, we have developed a mapping algorithm to relate the synsets in GermaNet with the semantic sorts in HPSG. The evaluation result shows that this approach is useful for the lexical extension of our deep grammar development to cope with real-world text understanding.
We present a solution for the representation of Japanese honorifical information in the HPSG framework. Basically, there are three dimensions of honorification. We show that a treatment is necessary that involves both the syntactic and the contextual level of information. The japanese grammar is part of a machine translation system.
Particles fullfill several distinct central roles in the Japanese language. They can mark arguments as well as adjuncts, can be functional or have semantic functions. There is, however, no straightforward matching from particles to functions, as, e.g., 'ga' can mark the subject, the object or the adjunct of a sentence. Particles can cooccur. Verbal arguments that could be identified by particles can be eliminated in the Japanese sentence. And finally, in spoken language particles are often omitted. A proper treatment of particles is thus necessary to make an analysis of Japanese sentences possible. Our treatment is based on an empirical investigation of 800 dialogues. We set up a type hierarchy of particles motivated by their subcategorizational and modificational behaviour. This type hierarchy is part of the Japanese syntax in VERBMOBIL.
An den Studiengängen der Abteilung für Germanistik und Deutsch als Fremdsprache unserer Universitäten nimmt das Fach „Deutsche Grammatik“ einen wichtigen Platz ein. Zu beobachten ist dabei, dass die Studierenden der grammatischen Strukturen des Deutschen sowohl in morphosyntaktischer und funktioneller Hinsicht nicht auf erforderlichem Niveau beherrschen. Dabei soll besondere Kraft darauf verwendet werden, die morphosyntaktischern Kenntnisse in aktive Sprachfähigkeit umzusetzen. Ziel dieser Arbeit ist, Gedanken und Vorschläge zu entwickeln, wie der Unterricht hinsichtlich unserer Zielgruppe fruchtbar, besonders für die funktionelle Beherrschung der deutschen Grammatik gestaltet werden kann.
Preferences and defaults for definiteness and number in japanese to german machine translation
(1996)
A significant problem when translating Japanese dialogues into German is the missing information on number and definiteness in the Japanese analysis output. The integration of the search for such information into the transfer process provides an efficient solution. General transfer includes conditions to make it possible to consider external knowledge. Thereby, grammatical and lexical knowledge of the source language, knowledge of lexical restrictions on the target language, domain knowledge and discourse knowledge are accessible.
Çağımızda bilim, teknik, sanat, kültür, ekonomi ve tıp alanındaki hızlı gelişmelerle birlikte çok sayıda yeni bilim dalları ve uzmanlık alanları ortaya çıkmıştır. Buna koşut olarak çeşitli bilim alanlarındaki çalışmalar ve araştırmalar da hızla artmış ve her bilim dalının kendine özgü bir uzmanlık dili oluşmuştur. Bu çalışmada, bir uzmanlık dili olan "Dilbilim Dili"nin özellikleri ve öğretimine ilişkin sorunlar irdelenecek ve çözüm önerileri geliştirilmeye çalışılacaktır. Bu konuyu ele alırken kısaca "Uzmanlık Dili" kavramı, tanımı ve özellikleri konusuna değinmek istiyorum.
Zeichnet Herbot aus didaktischen Impuls „das abschreckende Bild einer lasterhaft sündigen Welt“ (…), will er uns durch die Ausbreitung kriegerischer Leidenschaften über ihre Torheit belehren und zugleich die höfische Kultur implizit relativieren? (…) Dieser Frage nach der Aussage des Herbortschen Trojaliedes im Rahmen der literarischen und historischen Situation soll (…) [Volker Mertens’] Vortrag nachgehen. Dabei (…) [stellt er] zuerst de[n] Text selbst und seine literarischen Prätexte vor(…).
Die Forschung bediente sich (…) [des Begriffes Schwankroman] im Sinnes eine Gattungsbegriffes, auch wenn sie nicht übersah, daß 'Schwankroman' bei aller Praktikabilität zugleich Ausdruck einer Verlegenheit ist, in welche ursprünglich wohl die ästhetische Norm von der geschlossenen Einheitlichkeit jeder Dichtung, die diesen Namen verdienen soll, geführt hat, einer Verlegenheit nämlich angesichts der offenkundig episodischen Struktur der genannten epischen Großerzählungen, die ihr Zusammengesetztsein aus kurzen, in sich weithin vollständigen Erzähleinheiten kaum je verleugnen. Dieses Dilemma schlägt sich nieder in der Binnenspannung zwischen den beiden Komponenten des Begriffs auf quantitativer, formal-struktureller und kategorialer Ebene: (…)