Linguistik
Refine
Year of publication
Document Type
- Conference Proceeding (9)
- Book (3)
- Article (1)
- Working Paper (1)
Has Fulltext
- yes (14)
Is part of the Bibliography
- no (14)
Keywords
- Maschinelle Übersetzung (14) (remove)
Institute
- Extern (11)
Im Rahmen dieser Studie wurden jeweils ein türkischer und deutscher Gebrauchs-und Informationstext und einige Sätze von literarischen Texten mit Hilfe der Online-Übersetzungsprogramme "google translate", "Babylon", "Almanca Sözlük" und "İngilizceturkce.gen" übersetzt und überprüft, ob, wenn man die Texte in der Zielsprache mit den Ausgangstexten vergleicht, syntaktische und semantische Fehler aufträten und welche der Online-Übersetzungsprogramme beim Übersetzen zuverlässig sind.
Die Daten haben dargelegt, das bei der Sprachkombination Deutsch-Türkisch/Türkisch-Deutsch Gebrauchstexte und Informationstexte, auch wenn sie einige syntaktische und semantische Fehler beinhalten, im Ganzen und Großen in die Zielsprache richtig transferiert werden, wobei literarische Texte einen höheren Anteil an Fehlern beinhalten. Laut der Untersuchungsergebnisse sollten die übersetzten Texte zur Sicherheit immer von jemand Fachkundigem gelesen werden, da beim Übersetzen von ganzen Sätzen bzw. Textpassagen aus der türkischen Sprache ins Deutsche und umgekehrt aus der deutschen Sprache ins Türkische der Sinn nicht immer erfasst wird.
Zur Kontrolle könnten außerdem noch übersetzte Passagen mit verschiedenen Programmen stückweise mehrmals oder in eine Drittsprache z. B. ins Englische übersetzt werden. Bei feststehenden Aussagen bzw. Ausdrücken hingegen ist ein hohes Maß an Aufmerksamkeit erforderlich.
Der Beitrag behandelt zunächst die Frage, welche Vorteile elektronische Wörterbücher gegenüber traditionell gedruckten Wörterbüchern besitzen. Danach werden drei Online-Programme zur automatischen Übersetzung (Babelfish, Google Übersetzer, Bing Translator) vorgestellt. Beispieltexte werden mit diesen Programmen übersetzt, danach wird die jeweilige Qualität der Übersetzungen beurteilt. Schließlich diskutiert der Beitrag noch die Folgen, die durch die Möglichkeiten automatischen Übersetzens für die Auslandsgermanistik zu erwarten sind. Dabei zeigt sich, dass Programme für das automatische Übersetzen künftig durchaus ernstzunehmende Auswirkungen auf die philologischen Wissenschaften haben können.
The aim of any Automatic Translation project is to give a mechanical procedure for finding an equivalent expression in the target language to any sentence in the source language. The aim of my linguistic translation project is to find the corresponding structures of the languages dealt with. The two main problems that have to be solved by such a project are the difference of word order between the source language and the target language and the ambiguous words of the source language for which the appropriate word in the target language has to be chosen. The first problem is of major linguistic interest: once the project has been worked out, it will give us the parallel sentence structures for the two languages in question. Since there is no complete analysis of any language that could be used for the purpose of automatic translation, we decided to build up our project sentence by sentence. The rules which are needed for translating each sentence will have to be included in the complete program anyway, and the translation may be checked and corrected immediately. The program is split up into subroutines for each word-class, so that a correction of the program in case of an unsatisfactory translation does not complicate the program unnecessarily.
In this text, we describe the development of a broad coverage grammar for Japanese that has been built for and used in different application contexts. The grammar is based on work done in the Verbmobil project (Siegel 2000) on machine translation of spoken dialogues in the domain of travel planning. The second application for JACY was the automatic email response task. Grammar development was described in Oepen et al. (2002a). Third, it was applied to the task of understanding material on mobile phones available on the internet, while embedded in the project DeepThought (Callmeier et al. 2004, Uszkoreit et al. 2004). Currently, it is being used for treebanking and ontology extraction from dictionary definition sentences by the Japanese company NTT (Bond et al. 2004).
Hybrid robust deep and shallow semantic processing for creativity support in document production
(2004)
The research performed in the DeepThought project (http://www.project-deepthought.net) aims at demonstrating the potential of deep linguistic processing if added to existing shallow methods that ensure robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. We use this approach to demonstrate the feasibility of three ambitious applications, one of which is a tool for creativity support in document production and collective brainstorming. This application is described in detail in this paper. Common to all three applications, and the basis for their development is a platform for integrated linguistic processing. This platform is based on a generic software architecture that combines multiple NLP components and on robust minimal recursive semantics (RMRS) as a uniform representation language.
In this paper we show an approach to the customization of GermaNet to the German HPSG grammar lexicon developed in the Verbmobil project. GermaNet has a broad coverage of the German base vocabulary and fine-grained semantic classification; while the HPSG grammar lexicon is comparatively small und has a coarse-grained semantic classification. In our approach, we have developed a mapping algorithm to relate the synsets in GermaNet with the semantic sorts in HPSG. The evaluation result shows that this approach is useful for the lexical extension of our deep grammar development to cope with real-world text understanding.
Particles fullfill several distinct central roles in the Japanese language. They can mark arguments as well as adjuncts, can be functional or have semantic functions. There is, however, no straightforward matching from particles to functions, as, e.g., 'ga' can mark the subject, the object or the adjunct of a sentence. Particles can cooccur. Verbal arguments that could be identified by particles can be eliminated in the Japanese sentence. And finally, in spoken language particles are often omitted. A proper treatment of particles is thus necessary to make an analysis of Japanese sentences possible. Our treatment is based on an empirical investigation of 800 dialogues. We set up a type hierarchy of particles motivated by their subcategorizational and modificational behaviour. This type hierarchy is part of the Japanese syntax in VERBMOBIL.
Sprachtechnologie für übersetzungsgerechtes Schreiben am Beispiel Deutsch, Englisch, Japanisch
(2009)
Wir [...] haben uns zur Aufgabe gesetzt, Wege zu finden, wie linguistisch basierte Software den Prozess des Schreibens technischer Dokumentation unterstützen kann. Dabei haben wir einerseits die Schwierigkeiten im Blick, die japanische und deutsche Autoren (und andere Nicht-Muttersprachler des Englischen) beim Schreiben englischer Texte haben. Besonders japanische Autoren haben mit Schwierigkeiten zu kämpfen, weil sie hochkomplexe Ideen in einer Sprache ausdrücken müssen, die von Informationsstandpunkt her sehr unterschiedlich zu ihrer Muttersprache ist. Andererseits untersuchen wir technische Dokumentation, die von Autoren in ihrer Muttersprache geschrieben wird. Obwohl hier die fremdsprachliche Komponente entfällt, ist doch auch erhebliches Verbesserungspotential vorhanden. Das Ziel ist hier, Dokumente verständlich, konsistent und übersetzungsgerecht zu schreiben. Der fundamentale Ansatz in der Entwicklung linguistisch-basierter Software ist, dass gute linguistische Software auf Datenmaterial basiert und sich an den konkreten Zielen der besseren Dokumentation orientiert.
Preferences and defaults for definiteness and number in japanese to german machine translation
(1996)
A significant problem when translating Japanese dialogues into German is the missing information on number and definiteness in the Japanese analysis output. The integration of the search for such information into the transfer process provides an efficient solution. General transfer includes conditions to make it possible to consider external knowledge. Thereby, grammatical and lexical knowledge of the source language, knowledge of lexical restrictions on the target language, domain knowledge and discourse knowledge are accessible.
Die Domäne in VERBMOBIL sind Terminaushandlungsdialoge. Für die Syntax bedeutet das zunächst, daß die Sytnax sich an gesprochener Sprache orientieren muß. Das beinhaltet Nullanaphern, Phrasen, die auf die Kommunikationssituation bezogen sind und Phrasen, die für geschriebene Sprache als nicht wohlgeformt bezeichnet werden. Weitergehend gibt es einige domänenspezifische syntaktische besonderheiten, wie zum Biepsiel die Realisierung von Zeitangaben.