Refine
Year of publication
Document Type
- Article (23)
- Part of a Book (10)
- Review (8)
- Conference Proceeding (4)
- Working Paper (1)
Language
- German (37)
- English (4)
- Portuguese (4)
- Croatian (1)
Has Fulltext
- yes (46)
Is part of the Bibliography
- no (46)
Keywords
- Korpus <Linguistik> (46) (remove)
Institute
- Extern (2)
This paper presents an overview of Corpus Linguistics and some possibilities of studies with corpora. It gives suggestions on how to build a corpus and shows the application of Corpus Linguistics in different areas of linguistic research.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
Die kontrastive Sprachwissenschaft spezialisiert sich auf den Vergleich von unterschiedlichen Sprachsystemen. Aus dieser Perspektive gesehen stellen die bi- bzw. multilingualen Korpora in allen ihren Erscheinungsformen eine effiziente Vergleichsbasis für die Konfrontation von zwei oder mehreren Sprachsystemen dar. Die konkreten Ergebnisse werden von der mehrsprachigen Lexikographie oder in der Übersetzungswissenschaft angewandt, da die korpuslinguistische Sprachbetrachtung den authentischen Sprachgebrauch beobachtet. Zur Feststellung der andersprachigen
Äquivalenz, sowohl grammatikalischen als auch lexikalischen, ist es notwendig, das jeweilige Sprachelement im aktuellen Kontext, d. h. im Korpus, zu betrachten.
In diesem Artikel wird auf die lückenhafte lexikografische Darbietung von paradigmatisch-syntagmatischen Beziehungen hingewiesen und auf neue, korpusgestützte methodologische Verfahren der lexikosemantischen Analyse eingegangen. Im Mittelpunkt steht das am Mannheimer Institut für Deutsche Sprache entwickelte topografische Modell CNS (Contrasting Near Synonyms), dessen Beitrag für die Erforschung der Synonymie am Beispiel deutscher Adjektive "fühlbar" vs. "spürbar" präsentiert wird.
Der vorliegende Beitrag stellt eine linguistische Studie vor, die zwei nicht nah verwandte Sprachen auf dem Gebiet der Wortbildung vergleicht – das Deutsche und das Tschechische. Das Forschungsziel der Arbeit stellt die Untersuchung deutscher Determinativkomposita und der ihnen entsprechenden Wortbildungskonstruktionen im Tschechischen dar. Es wird eine relativ junge sprachwissenschaftliche Disziplin, die Korpuslinguistik, rein praktisch vorgestellt und die konkreten Ergebnisse der kontrastiven Untersuchung werden präsentiert.
The article addresses the growing importance of corpus-based research in the field of German foreign language acquisition. German corpora in general and learner corpora in particular are briefly introduced. A short overview of existing German learner corpora is followed by a detailed description of the error-annotated learner corpus Falko, a learner corpus of advanced learner German, which is accessible via internet (without any prior registration) and free of charge. Finally, a short example analysis demonstrates some of the functionalities of Falko. The aim of the article is to encourage researchers to employ corpora as helpful tools in their own work.
Při vyjadřování emocí v ústní komunikaci hraje hlas významnou roli. Článek se zabývá otázkou, jak je hlas v souvislosti s emocemi popisován v psaných textech, a sice německých románech. Na ukázkách z německého korpusu Cosmas II je ukázáno, jaké strategie volí spisovatelé, aby čtenáři přiblížili emoce prožívané postavami románu a která slovesa a přídavná jména používají nejčastěji při znázornění emoce "hněv".