418 Standardsprache; Angewandte Linguistik
Refine
Year of publication
Document Type
- Conference Proceeding (23)
- Book (7)
- Article (6)
- Working Paper (4)
- Part of a Book (3)
- Review (1)
Language
- English (27)
- German (13)
- Portuguese (2)
- Turkish (2)
Has Fulltext
- yes (44)
Is part of the Bibliography
- no (44) (remove)
Keywords
- Computerlinguistik (27)
- Japanisch (18)
- Maschinelle Übersetzung (11)
- Deutsch (4)
- Diskursanalyse (3)
- Erzählen (3)
- Spracherwerb (3)
- Sprachtest (3)
- Standardisierung (3)
- Technische Unterlage (3)
Institute
- Extern (33)
updated version --
The Multilingual Assessment Instrument for Narratives (MAIN) was designed in order to assess narrative skills in children who acquire one or more languages from birth or from early age. MAIN is suitable for children from 3 to 10 years and evaluates both comprehension and production of narratives. Its design allows for the assessment of several languages in the same child, as well as for different elicitation modes: Model Story, Retelling, and Telling. MAIN contains four parallel stories, each with a carefully designed six-picture sequence. The stories are controlled for cognitive and linguistic complexity, parallelism in macrostructure and microstructure, as well as for cultural appropriateness and robustness. The instrument has been developed on the basis of extensive piloting with more than 550 monolingual and bilingual children aged 3 to 10, for 15 different languages and language combinations. Even though MAIN has not been norm-referenced yet, its standardized procedures can be used for evaluation, intervention and research purposes. MAIN is currently available in the following languages: English, Afrikaans, Albanian, Basque, Bulgarian, Croatian, Cypriot Greek, Danish, Dutch, Estonian, Finnish, French, German, Greek, Hebrew, Icelandic, Italian, Lithuanian, Norwegian, Polish, Russian, Spanish, Standard Arabic, Swedish, Turkish, Vietnamese, and Welsh.
Hier soll [...] der Versuch einer sprachwissenschaftlichen Beschreibung des Genderns unternommen werden, um die Sachlage zu klären und zwischen Ärger und sprachlicher Funktionalität einen wissenschaftlich vertretbaren Standpunkt zu finden. Angesichts der komplexen Datenlage ist das nur ein Essay, beschränkt auf eine kleine Zusammenstellung von Daten und auf eine kleine, doch bewusst ausgewählte wissenschaftliche Literatur. Hin und wieder möge man mir einen eigenen Zugang zur Diskussion, kleine stilistische Wagnisse und einige persönliche Bemerkungen gestatten; durchwegs wird aber auf Belegbarkeit und Überprüfbarkeit geachtet.
Im Beitrag wird gezeigt, dass sich mündliche Kommunikation im Zentrum sprachlicher Fehlertoleranz bewegt, während schriftliche Texte an seiner Peripherie verortet sind. Übersetzungen hingegen basieren auf Fehler-Intoleranz. Jede Übersetzung in die Fremdsprache, die ohne Rücksprache mit einem linguistisch geschulten und translatorisch erfahrenen Muttersprachler der Zielsprache in den Druck gegeben wird, weist ihren Urheber als unprofessionellen Einzelkämpfer aus, der respektlos gegenüber dem Autor des Originals, geringschätzig gegenüber seinem Auftraggeber, zynisch gegenüber dem Leser seiner Übersetzung und leichtfertig gegenüber seinen Landsleuten handelt, weil er das Scheitern internationaler Kommunikation billigend in Kauf nimmt. Indessen minimieren Übersetzungsteams aus Muttersprachlern der Ausgangs- und der Zielsprache, die eng mit dem Auftraggeber, dem Autor und ggf. mit den entsprechenden Fachleuten zusammenarbeiten, sprachliche und inhaltliche Fehler und dokumentieren dadurch ihren tiefen Respekt und ihre aktive und kreative Toleranz gegenüber dem anderen Land, seinen Menschen, Sprachen und Kulturen.
The Multilingual Assessment Instrument for Narratives (MAIN) was designed in order to assess narrative skills in children who acquire one or more languages from birth or from early age. MAIN is suitable for children from 3 to 10 years and evaluates both comprehension and production of narratives. Its design allows for the assessment of several languages in the same child, as well as for different elicitation modes: Model Story, Retelling, and Telling. MAIN contains four parallel stories, each with a carefully designed six-picture sequence. The stories are controlled for cognitive and linguistic complexity, parallelism in macrostructure and microstructure, as well as for cultural appropriateness and robustness. The instrument has been developed on the basis of extensive piloting with more than 550 monolingual and bilingual children aged 3 to 10, for 15 different languages and language combinations. Even though MAIN has not been norm-referenced yet, its standardized procedures can be used for evaluation, intervention and research purposes. MAIN is currently available in the following languages: English, Afrikaans, Albanian, Basque, Bulgarian, Croatian, Cypriot Greek, Danish, Dutch, Estonian, Finnish, French, German, Greek, Hebrew, Icelandic, Italian, Lithuanian, Norwegian, Polish, Russian, Spanish, Standard Arabic, Swedish, Turkish, Vietnamese, and Welsh.
The Multilingual Assessment Instrument for Narratives (MAIN) was designed in order to assess narrative skills in children who acquire one or more languages from birth or from early age. MAIN is suitable for children from 3 to 10 years and evaluates both comprehension and production of narratives. Its design allows for the assessment of several languages in the same child, as well as for different elicitation modes: Model Story, Retelling, and Telling.
MAIN contains four parallel stories, each with a carefully designed six-picture sequence. The stories are controlled for cognitive and linguistic complexity, parallelism in macrostructure and microstructure, as well as for cultural appropriateness and robustness.
The instrument has been developed on the basis of extensive piloting with more than 550 monolingual and bilingual children aged 3 to 10, for 15 different languages and language combinations.
Even though MAIN has not been norm-referenced yet, its standardized procedures can be used for evaluation, intervention and research purposes. MAIN is currently available in the following languages: English, Afrikaans, Albanian, Basque, Bulgarian, Croatian, Cypriot Greek, Danish, Dutch, Estonian, Finnish, French, German, Greek, Hebrew, Icelandic, Italian, Lithuanian, Norwegian, Polish, Russian, Spanish, Standard Arabic, Swedish, Turkish, Vietnamese, and Welsh.
Nesse trabalho, será mostrado que fórmulas dão evidência de padrões convencionais de interação e também os inicializam. Esses padrões de interação não são universais, mas são configurados por cada comunidade lingüística. Conhecê-los faz parte da competência idiomática. Um dicionário bilíngüe semasiológico e onomasiológico pode contribuir tanto para a aquisição de fórmulas, quanto transmitir o conhecimento de padrões de interação.
Estudo linguístico comparativo sobre onomatopeias em histórias em quadrinhos : Português / Alemão
(2011)
Nesta pesquisa foi investigado o uso peculiar das onomatopeias na linguagem das histórias em quadrinhos e como o processo de criação de novas expressões nesse context respeita o sistema fonético e fonotático de cada língua. Foi realizada uma pesquisa empírica, para a qual falantes nativos de língua portuguesa e alemã foram solicitados a sugerir ou criar as onomatopeias que julgassem adequadas para diversas cenas de histórias em quadrinhos que lhes foram apresentadas editadas, com as onomatopeias originais retiradas. Através da análise dos dados foi possível identificar algumas características específicas quanto à sequência fonética e a organização silábica das onomatopeias nesses idiomas.
Um sich in Brasilien auf eine wissenschaftliche Stelle zu bewerben, muss oftmals ein "Memorial Acadêmico" eingereicht werden. Eine Textart, die es so im deutschsprachigen Raum nicht gibt. Eine in funktionaler Hinsicht ähnliche Textart liegt im "Akademischen Lebenslauf" vor. In diesem Artikel sollen anhand eines Korpus von sechs "Memoriais" Unterschiede und Gemeinsamkeiten in Illokution und Proposition dieser beiden Textarten aufgezeigt werden.
This study examines the particularities of multilingual discourse, based on the example of recorded conversations in a trilingual family in Canada. It combines two different fields of linguistic research: multilingualism and conversation analysis. The study of multilingualism has developed into a popular field of linguistic research over the past two decades. In general, it focuses on bilingualism as a social and individual phenomenon, and in particular on the alternation between two languages in the speech of bilinguals. For this alternation, the term code-switching is widely used. Usually, the term refers to language alternation both between sentences and within sentence boundaries. From a sociolinguistic perspective code-switching is often interpreted as a means of signaling group membership in bilingual communities, whereas grammatical analyses examine how morphosyntactic units from different languages are combined (and can be combined) within one sentence. Auer (1998: 3) suggests the study of the conversational structure of code-switching as a third perspective on bilingual language usage, one that he claims has been widely neglected by linguistic research in the past. In particular, those cases of language alternation between utterances (sentences) but within the same conversation cannot be described adequately from either a macro-sociolinguistic or a morphosyntactic perspective.
Çeviribilimde Yöntem Sorunu
(2004)
Dieser Beitrag bearbeitet und behandelt die Funktion der Methodologie beim Erwerb wissenschaftlicher Erkenntnisse in Bezug auf das Verstehen des Übersetzungsvorgangs. Wie bekannt ist das Problem der Methodologie eines der meist diskutierten Themen in der Übersetzungswissenschaft. Obwohl inzwischen eine Reihe von wissenschaftlichen Ansätzen zu diesem Thema existiert, hat die Übersetzungswissenschaft noch keinen theoretischen Rahmen entwickelt, in dem der betreffende Forschungsgegenstand definiert wird. Aus diesem Grund unterscheiden sich die Arten der Angehensweise von übersetzungswissenschaftlichen Problemen. Außerdem scheinen die Definitionsbemühungen hinsichtlich des Forschungsgegenstandes der Übersetzungswissenschaft und der Methodenprobleme der übersetzungswissenschaftlichen Ansätze nicht unbedingt zufrieden stellende Antworten auf die Fragen in diesem Bereich zu liefern. Das Definitionsproblem der genauen theoretischen und methodologischen Orientierung der Übersetzungswissenschaft in der allgemeinen Wissenschaftswelt hängt neben ihrem strittigen Standort als einer neuen Disziplin auch von zwei weiteren Grundfaktoren ab: 1. Probleme, mit denen man bei der Festlegung einer vereinenden Übersetzungstheorie konfrontiert ist, da die Übersetzung einen vielseitigen und komplexen Objektbereich umfaßt; 2. ungenügende Forschungen in Bezug auf methodologische Ansätze in der Übersetzungswissenschaft. Wie bekannt profitiert man bei der Entwicklung einer Übersetzungstheorie auch von der Methodologie anderer Disziplinen. Diese Methoden sind wie vielseitige Mittel, die bei der Lösung von Problemen in Bereichen wie übersetzungswissenschaftliche Forschungen, Didaktik des Übersetzens und Übersetzungsprozess angewandt werden können. Diese Methoden werden außerdem einen Beitrag dazu leisten, definierende Übersetzungsmethoden hinsichtlich über-setzungswissenschaftlicher Ansätze für das Verstehen des Übersetzungsvor-ganges zu entwickeln.
Seit der zweiten Hälfte des zwanzigsten Jahrhunderts sind im theoretischen Bereich der Übersetzungswissenschaft wichtige Veränderungen zu beobachten. Von Cicero bis zur zweiten Hälfte des letzten Jahrhunderts verlagerte sich die ausgangssprachenorientierte Übersetzungsauffassung auf die zielsprachenorientierten. Somit haben sich immer mehr die zielsprachenorientierte Forschungen im Bereich der Übersetzungstheorie als ein übersetzungsrelevantes Phänomen durchgesetzt. Insbesondere haben die nach den 70’er Jahren entworfenen Übersetzungstheorien, in denen der Übersetzer immer mehr in das Zentrum des Forschungsinteresse rückt und entsprechende übersetzungsprozessualorientierte Ansätze sich aufdrängen, an Wichtigkeit eingebüßt. Nach diesen Ansätzen rücken normative Belange in Bezug auf erfolgreiche Übersetzung in Form von Prinzipien und Regeln in den Vordergrund. Heutzutage ist das Interesse an theoretische Forschungen besonders auf deskriptive Beschreibungen des Übersetzungsphänomens gerichtet. Damit die Theorie mit der Praxis übereinstimmt, sollte man vor allem die allgemeinen Grundsätze der Übersetzungstheorien, die Grundlage zur Praxis bilden, explizit verarbeiten. Wenn man auch nicht erwartet, dass die Übersetzungstheorien alle in der Praxis der Übersetzung entstandenen Probleme bewältigen können, ist aber trotzdem davon auszugehen, dass der Übersetzer, welcher über die allgemeine theoretische Grundlage verfügt, in seiner Übersetzungstätigkeit mehr Erfolg haben wird, weshalb die Praxis und Theorie voneinander recht gering abweichen werden. Die Auseinandersetzung mit diesem Tatbestand, also mit der Theorie, kann die Lösung der probablen Fehler erleichtern. Außerdem besteht somit die Möglichkeit, die Effizienz der Theorie auf die Anwendung herauszufinden und demzufolge kann die durch praktische Ausführung ermittelten Ergebnisse eine ganzheitliche Präzisierung der theoretischen Beschreibungen nach sich ziehen.
Die Fachsprachen existieren nicht als "selbständiges Sprachsystem" mit eigener grammatischer, Struktur und eigenem Wortschatz. Sie stellen nur Teile des Gesamtsystems der jeweiligen Nationalsprache dar, die häufig als Gemeinsprache bezeichnet wird. Die Fachsprachen sind vielmehr "durch Differenzierung und Erweiterung aus der Gemeinsprache" hervorgegangen, wobei die Gemeinsprache "die lexikalische Basis und das grammatische Gerüst für die Fachsprachen liefert". In diesem Sinne sind sie in erster Linie durch einen spezifischen Fachwortschatz und spezifische Verwendung gemeinsprachlicher grammatischer, morphologischer sowie lexikalischer Mittel oder die Häufigkeit bestimmter syntaktischer Strukturen und bestimmter Wortbildungstypen gekennzeichnet. […] Eine Fachsprache läßt sich sowohl von anderen Fachsprachen abgrenzen, als auch in sich differenzieren, weil sie auf verschiedenen kommunikativ-funktionellen Ebenen völlig unterschiedliche Besonderheiten und Funktionsstile besitzt. Bei der Fachabgrenzung zeigen sich große Schwierigkeiten, weil durch die Fortentwicklung der Wissenschaft ständig neue Fachgebiete entstehen, die verschiedene Disziplinen übergreifen und die gleichzeitig weiter untergliedert werden müssen. Trotz alledem könnten die Unterschiede zwischen den einzelnen Fachsprachen darin bestehen, daß jede Fachsprache ihre eigenen Merkmale besitzt und die allgemeinen fachsprachlichen Eigenschaften nicht in gleichem Maße darstellt. […] Die Fachsprachen können unter verschiedenen bzw. kommunikativen, funktionellen, pragmatischen, stilistischen, fach- oder textbezogenen Gesichtspunkten betrachtet werden. Und daher werden sie unterschiedlich beschrieben. In diesem Sinne gibt es keine einheitliche Fachsprache. Jeder Fachbereich verfügt über seine eigene Fachsprache und damit über seine eigene Fachterminologie.
In this text, we describe the development of a broad coverage grammar for Japanese that has been built for and used in different application contexts. The grammar is based on work done in the Verbmobil project (Siegel 2000) on machine translation of spoken dialogues in the domain of travel planning. The second application for JACY was the automatic email response task. Grammar development was described in Oepen et al. (2002a). Third, it was applied to the task of understanding material on mobile phones available on the internet, while embedded in the project DeepThought (Callmeier et al. 2004, Uszkoreit et al. 2004). Currently, it is being used for treebanking and ontology extraction from dictionary definition sentences by the Japanese company NTT (Bond et al. 2004).
Das Problem des Transfers in der maschinellen Übersetzung von Japanisch nach Englisch ist fehlende Information über Numerus und Definitheit im Japanischen, die für die Wahl der englischen Artikel und die Nomenmarkierung gebraucht wird. Obwohl dieses Problem signifikant ist, beschäftigt sich die Forschungsliteratur kaum damit. [...] Wir bsaieren unsere Untersuchungen auf experimentell erhobenen Daten aus einem Experiment über deutsch-japanische gedolmetschte Terminaushandlungsdialoge [...]. Auf diese Weise können Phänomene bestimmt werden, die für die Domäne von VERBMOBIL relevant sind. Wir sehen unser Vorgehen in Übereinstimmung mit dem 'Sublanguage'-Ansatz [...].
Eins der signifikanten Probleme in der maschinellen Übersetzung japanische in deutsche Sprache ist die fehlende Information und Definitheit im japanischen Analyse-Output. Eine effiziente Lösung dieses Problems ist es, die Suche nach der relevanten Information in den Transfer zu integrieren. Transferregeln werden mit Präferenzregeln und Default-Regeln kombiniert. Dadurch wird Information über lexikalische Restriktionen der Zielsprache, über die Domäne und über den Diskurs zugänglich.
Japanese is often taken to be strictly head-final in its syntax. In our work on a broad-coverage, precision implemented HPSG for Japanese, we have found that while this is generally true, there are nonetheless a few minor exceptions to the broad trend. In this paper, we describe the grammar engineering project, present the exceptions we have found, and conclude that this kind of phenomenon motivates on the one hand the HPSG type hierarchical approach which allows for the statement of both broad generalizations and exceptions to those generalizations and on the other hand the usefulness of grammar engineering as a means of testing linguistic hypotheses.
We present a broad coverage Japanese grammar written in the HPSG formalism with MRS semantics. The grammar is created for use in real world applications, such that robustness and performance issues play an important role. It is connected to a POS tagging and word segmentation tool. This grammar is being developed in a multilingual context, requiring MRS structures that are easily comparable across languages.
Based on a detailed case study of parallel grammar development distributed across two sites, we review some of the requirements for regression testing in grammar engineering, summarize our approach to systematic competence and performance profiling, and discuss our experience with grammar development for a commercial application. If possible, the workshop presentation will be organized around a software demonstration.
This paper proposes an annotating scheme that encodes honorifics (respectful words). Honorifics are used extensively in Japanese, reflecting the social relationship (e.g. social ranks and age) of the referents. This referential information is vital for resolving zero
pronouns and improving machine translation outputs. Annotating honorifics is a complex task that involves identifying a predicate with honorifics, assigning ranks to referents of the
predicate, calibrating the ranks, and connecting referents with their predicates.
Some requirements for a VERBMOBIL system capable of processing Japanese dialogue input have been explored. Based on a pilot study in the VERBMOBIL domain, dialogues between 2 participants and a professional Japanese interpreter have been analyzed with respect to a very typical and frequent feature: zero pronouns. Zero pronouns in Japanese texts or dialogues as well as overt pronouns in English texts or dialogues are an important element of discourse coherence. As to translation, this difference in the use of pronouns is a case of translation mismatch: information not explicitly expressed in the source language is needed in the target language. (Verb argument positions, normally obligatory in English, are rather frequently omitted in Japanese. Furthermore, verbs in Japanese are not marked with respect to features necessary for pronoun selection in English.)
Hybrid robust deep and shallow semantic processing for creativity support in document production
(2004)
The research performed in the DeepThought project (http://www.project-deepthought.net) aims at demonstrating the potential of deep linguistic processing if added to existing shallow methods that ensure robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. We use this approach to demonstrate the feasibility of three ambitious applications, one of which is a tool for creativity support in document production and collective brainstorming. This application is described in detail in this paper. Common to all three applications, and the basis for their development is a platform for integrated linguistic processing. This platform is based on a generic software architecture that combines multiple NLP components and on robust minimal recursive semantics (RMRS) as a uniform representation language.
In this paper we show an approach to the customization of GermaNet to the German HPSG grammar lexicon developed in the Verbmobil project. GermaNet has a broad coverage of the German base vocabulary and fine-grained semantic classification; while the HPSG grammar lexicon is comparatively small und has a coarse-grained semantic classification. In our approach, we have developed a mapping algorithm to relate the synsets in GermaNet with the semantic sorts in HPSG. The evaluation result shows that this approach is useful for the lexical extension of our deep grammar development to cope with real-world text understanding.
Particles fullfill several distinct central roles in the Japanese language. They can mark arguments as well as adjuncts, can be functional or have semantic functions. There is, however, no straightforward matching from particles to functions, as, e.g., 'ga' can mark the subject, the object or the adjunct of a sentence. Particles can cooccur. Verbal arguments that could be identified by particles can be eliminated in the Japanese sentence. And finally, in spoken language particles are often omitted. A proper treatment of particles is thus necessary to make an analysis of Japanese sentences possible. Our treatment is based on an empirical investigation of 800 dialogues. We set up a type hierarchy of particles motivated by their subcategorizational and modificational behaviour. This type hierarchy is part of the Japanese syntax in VERBMOBIL.
Sprachtechnologie für übersetzungsgerechtes Schreiben am Beispiel Deutsch, Englisch, Japanisch
(2009)
Wir [...] haben uns zur Aufgabe gesetzt, Wege zu finden, wie linguistisch basierte Software den Prozess des Schreibens technischer Dokumentation unterstützen kann. Dabei haben wir einerseits die Schwierigkeiten im Blick, die japanische und deutsche Autoren (und andere Nicht-Muttersprachler des Englischen) beim Schreiben englischer Texte haben. Besonders japanische Autoren haben mit Schwierigkeiten zu kämpfen, weil sie hochkomplexe Ideen in einer Sprache ausdrücken müssen, die von Informationsstandpunkt her sehr unterschiedlich zu ihrer Muttersprache ist. Andererseits untersuchen wir technische Dokumentation, die von Autoren in ihrer Muttersprache geschrieben wird. Obwohl hier die fremdsprachliche Komponente entfällt, ist doch auch erhebliches Verbesserungspotential vorhanden. Das Ziel ist hier, Dokumente verständlich, konsistent und übersetzungsgerecht zu schreiben. Der fundamentale Ansatz in der Entwicklung linguistisch-basierter Software ist, dass gute linguistische Software auf Datenmaterial basiert und sich an den konkreten Zielen der besseren Dokumentation orientiert.
Preferences and defaults for definiteness and number in japanese to german machine translation
(1996)
A significant problem when translating Japanese dialogues into German is the missing information on number and definiteness in the Japanese analysis output. The integration of the search for such information into the transfer process provides an efficient solution. General transfer includes conditions to make it possible to consider external knowledge. Thereby, grammatical and lexical knowledge of the source language, knowledge of lexical restrictions on the target language, domain knowledge and discourse knowledge are accessible.
Ein einer Äußerung können Nullpronomina aus mehreren [...] Gruppen vorkommen. Die [...] Gruppen können auf die Ebenen eines Schicht-Dialogmodells bezogen werden; andererseits können sie Hinweise geben, welche Informationen in einem Dialogmodell verfügbar sein sollten. Dies wird in der Folgezeit genauer zu untersuchen sein. Im folgenden werden die genannten Typen von Nullpronomina genauer dargestellt und Lösungsverfahren zum Auffinden der Referenten genannt.
Die Entwicklung eines individuellen Standards „vom grünen Tisch“ führt selten zu zufriedenstellenden Ergebnissen. Bei der automatischen Prüfung stellt man schnell fest, dass die „ausgedachten“ Regeln einer systematischen Anwendung nicht standhalten. Bei der Implementierung solcher Richtlinien stellt man fest, dass sie oft zu wenig konkret formuliert sind, wie z.B. „formulieren Sie Handlungsanweisungen knapp und präzise“. Wie jedoch kann ein Standard entwickelt werden, der zu einem Unternehmen, seiner Branche und Zielgruppen passt und für die automatische Prüfung implementiert werden kann? Sprachtechnologie hilft effizient bei der Entwicklung individueller Richtlinien. Durch Datenanalyse, Satzcluster und Parametrisierung entsteht ein textspezifischer individueller Standard. Ist damit aber der Gegensatz von Kreativität und Standardisierung aufgehoben?
Die Domäne in VERBMOBIL sind Terminaushandlungsdialoge. Für die Syntax bedeutet das zunächst, daß die Sytnax sich an gesprochener Sprache orientieren muß. Das beinhaltet Nullanaphern, Phrasen, die auf die Kommunikationssituation bezogen sind und Phrasen, die für geschriebene Sprache als nicht wohlgeformt bezeichnet werden. Weitergehend gibt es einige domänenspezifische syntaktische besonderheiten, wie zum Biepsiel die Realisierung von Zeitangaben.
A comprehensive investigation of Japanese particle was missing up to now. General implications were set up without the fact that a comprehensive analysis was carried out. [...] We offer a lexicalist treatment of the problem. Instead of assuming different phrase structure rules we state a type hierarchy of Japanese particles. This makes a uniform treatment of phrase structure as well as a differentiation of subcategorization patterns possible.
We present a solution for the representation of Japanese honorifical information in the HPSG framework. Basically, there are three dimensions of honorification. We show that a treatment is necessary that involves both the syntactic and the contextual level of information. The japanese grammar is part of a machine translation system.
The research performed in the DeepThought project aims at demonstrating the potential of deep linguistic processing if combined with shallow methods for robustness. Classical information retrieval is extended by high precision concept indexing and relation detection. On the basis of this approach, the feasibility of three ambitious applications will be demonstrated, namely: precise information extraction for business intelligence; email response management for customer relationship management; creativity support for document production and collective brainstorming. Common to these applications, and the basis for their development is the XML-based, RMRS-enabled core architecture framework that will be described in detail in this paper. The framework is not limited to the applications envisaged in the DeepThought project, but can also be employed e.g. to generate and make use of XML standoff annotation of documents and linguistic corpora, and in general for a wide range of NLP-based applications and research purposes.
In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.
This demo abstract describes the SmartWeb Ontology-based Information Extraction System (SOBIE). A key feature of SOBIE is that all information is extracted and stored with respect to the SmartWeb ontology. In this way, other components of the systems, which use the same ontology, can access this information in a straightforward way. We will show how information extracted by SOBIE is visualized within its original context, thus enhancing the browsing experience of the end user.
Dialogue acts in Verbmobil 2
(1998)
This report describes the dialogue phases and the second edition dialogue acts which are used in the VERBMOBIL 2 project [...]. While in the first project phase the scenario was restricted to appointment scheduling dialogues, it has been extended to travel planning in the second phase with appointment scheduling being only a part of the new scenario.
The Deep Linguistic Processing with HPSG Initiative (DELH-IN) provides the infrastructure needed to produce open-source semantic transfer-based machine translation systems. We have made available a prototype Japanese-English machine translation system built from existing resources include parsers, generators, bidirectional grammars and a transfer engine.
While the sortal constraints associated with Japanese numeral classifiers are well-studied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broad-coverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
While the sortal constraints associated with Japanese numeral classifiers are wellstudied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broadcoverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
Standardisierung ist der bedeutendste Ansatz zu Qualitätssteigerung und Kostensenkung in der Technischen Dokumentation. Es gibt eine Reihe von Standardisierungsansätzen: Modularisierung, Informationsstrukturen, Terminologie, Sprachstrukturen. Dennoch werden diese Ebenen meist getrennt voneinander beschrieben. Wir untersuchen, wie Standardisierungen im Informationsmodell, in der Terminologie und in den sprachlichen Strukturen verknüpft werden und miteinander interagieren.
Der Übersetzungsprozess der Technischen Dokumentation wird zunehmend mit Maschineller Übersetzung (MÜ) unterstützt. Wir blicken zunächst auf die Ausgangstexte und erstellen automatisch prüfbare Regeln, mit denen diese Texte so editiert werden können, dass sie optimale Ergebnisse in der MÜ liefern. Diese Regeln basieren auf Forschungsergebnissen zur Übersetzbarkeit, auf Forschungsergebnissen zu Translation Mismatches in der MÜ und auf Experimenten.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
Frauen- und Männerstimmen in Medien (Moderatorinnen und Moderatoren in Rundfunk und Fernsehen)
(2010)
Just 30 % of the effect of female and male speakers are activated by the lexems and sentences. 70 % are activated by paraverbal and extraverbal constituents. A deep voice is associated with authority and objectivity. We can realise this phenomenon at male voices. Women never reach such a deepness in their voices Their voice is sensed more expressive and it activates stereotypes like „emotional“ and „trivial“. The contents of female speakers are not taken as seriously as the contents of male speakers.