31 search hits
-
Autorenunterstützung für die Maschinelle Übersetzung
(2011)
-
Melanie Siegel
- Der Übersetzungsprozess der Technischen Dokumentation wird zunehmend mit Maschineller Übersetzung (MÜ) unterstützt. Wir blicken zunächst auf die Ausgangstexte und erstellen automatisch prüfbare Regeln, mit denen diese Texte so editiert werden können, dass sie optimale Ergebnisse in der MÜ liefern. Diese Regeln basieren auf Forschungsergebnissen zur Übersetzbarkeit, auf Forschungsergebnissen zu Translation Mismatches in der MÜ und auf Experimenten.
-
Regeln für Sprache und Strukturen : Standardisierung auf allen Ebenen
(2011)
-
Wolfgang Ziegler
Melanie Siegel
- Standardisierung ist der bedeutendste Ansatz zu Qualitätssteigerung und Kostensenkung in der Technischen Dokumentation. Es gibt eine Reihe von Standardisierungsansätzen: Modularisierung, Informationsstrukturen, Terminologie, Sprachstrukturen. Dennoch werden diese Ebenen meist getrennt voneinander beschrieben. Wir untersuchen, wie Standardisierungen im Informationsmodell, in der Terminologie und in den sprachlichen Strukturen verknüpft werden und miteinander interagieren.
-
Sprachtechnologie für übersetzungsgerechtes Schreiben am Beispiel Deutsch, Englisch, Japanisch
(2009)
-
Melanie Siegel
- Wir [...] haben uns zur Aufgabe gesetzt, Wege zu finden, wie linguistisch basierte Software den Prozess des Schreibens technischer Dokumentation unterstützen kann. Dabei haben wir einerseits die Schwierigkeiten im Blick, die japanische und deutsche Autoren (und andere Nicht-Muttersprachler des Englischen) beim Schreiben englischer Texte haben. Besonders japanische Autoren haben mit Schwierigkeiten zu kämpfen, weil sie hochkomplexe Ideen in einer Sprache ausdrücken müssen, die von Informationsstandpunkt her sehr unterschiedlich zu ihrer Muttersprache ist. Andererseits untersuchen wir technische Dokumentation, die von Autoren in ihrer Muttersprache geschrieben wird. Obwohl hier die fremdsprachliche Komponente entfällt, ist doch auch erhebliches Verbesserungspotential vorhanden. Das Ziel ist hier, Dokumente verständlich, konsistent und übersetzungsgerecht zu schreiben. Der fundamentale Ansatz in der Entwicklung linguistisch-basierter Software ist, dass gute linguistische Software auf Datenmaterial basiert und sich an den konkreten Zielen der besseren Dokumentation orientiert.
-
Praxis des kreativen Standardisierens
(2008)
-
Melanie Siegel
Sabine Lehmann
- Die Entwicklung eines individuellen Standards „vom grünen Tisch“ führt selten zu zufriedenstellenden Ergebnissen. Bei der automatischen Prüfung stellt man schnell fest, dass die „ausgedachten“ Regeln einer systematischen Anwendung nicht standhalten. Bei der Implementierung solcher Richtlinien stellt man fest, dass sie oft zu wenig konkret formuliert sind, wie z.B. „formulieren Sie Handlungsanweisungen knapp und präzise“. Wie jedoch kann ein Standard entwickelt werden, der zu einem Unternehmen, seiner Branche und Zielgruppen passt und für die automatische Prüfung implementiert werden kann? Sprachtechnologie hilft effizient bei der Entwicklung individueller Richtlinien. Durch Datenanalyse, Satzcluster und Parametrisierung entsteht ein textspezifischer individueller Standard. Ist damit aber der Gegensatz von Kreativität und Standardisierung aufgehoben?
-
Wie Texte standardisiert und sprachtechnologisch qualitätsgesichert werden können
(2007)
-
Melanie Siegel
Roland Schmeling
- Dass die Standardisierung der bedeutendste Ansatz zu gleichzeitiger Qualitätssteigerung und Kostensenkung ist, gilt als hinreichend belegt. Unbekannter sind dagegen die weitgehenden Möglichkeiten der methodischen Textproduktion und die dadurch ermöglichte automatische Prüfung.
-
Generating and Visualizing a Soccer Knowledge Base
(2006)
-
Paul Buitelaar
Thomas Eigner
Greg Gulrajani
Alexander Schutz
Melanie Siegel
Nicolas Weber
Philipp Cimiano
Günter Ladwig
Matthias Mantel
Honggang Zhu
- This demo abstract describes the SmartWeb Ontology-based Information Extraction System (SOBIE). A key feature of SOBIE is that all information is extracted and stored with respect to the SmartWeb ontology. In this way, other components of the systems, which use the same ontology, can access this information in a straightforward way. We will show how information extracted by SOBIE is visualized within its original context, thus enhancing the browsing experience of the end user.
-
Ontology-based Information Extraction with SOBA
(2006)
-
Paul Buitelaar
Philipp Cimiano
Stefania Racioppa
Melanie Siegel
- In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.
-
JACY - A Grammar for Annotating Syntax, Semantics and Pragmatics of Written and Spoken Japanese for NLP Application Purposes
(2006)
-
Melanie Siegel
- In this text, we describe the development of a broad coverage grammar for Japanese that has
been built for and used in different application contexts. The grammar is based on work done
in the Verbmobil project (Siegel 2000) on machine translation of spoken dialogues in the
domain of travel planning. The second application for JACY was the automatic email
response task. Grammar development was described in Oepen et al. (2002a). Third, it was
applied to the task of understanding material on mobile phones available on the internet, while
embedded in the project DeepThought (Callmeier et al. 2004, Uszkoreit et al. 2004).
Currently, it is being used for treebanking and ontology extraction from dictionary definition
sentences by the Japanese company NTT (Bond et al. 2004).
-
Implementing the Syntax of Japanese Numeral Classifiers
(2005)
-
Emily M. Bender
Melanie Siegel
- While the sortal constraints associated with Japanese numeral classifiers are well-studied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broad-coverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
-
Open-Source Machine Translation with DELPH-IN
(2005)
-
Francis Bond
Ann Copestake
Dan Flickinger
Stephan Oepen
Melanie Siegel
- The Deep Linguistic Processing with HPSG Initiative (DELH-IN) provides the infrastructure needed to produce open-source semantic transfer-based machine translation systems. We have made available a prototype Japanese-English machine translation system built from existing resources include parsers, generators, bidirectional grammars and a transfer engine.