Linguistik
Refine
Year of publication
Document Type
- Article (12)
- Review (7)
- Part of a Book (6)
- Conference Proceeding (4)
- Working Paper (1)
Language
- German (22)
- English (4)
- Portuguese (3)
- Croatian (1)
Has Fulltext
- yes (30)
Is part of the Bibliography
- no (30)
Keywords
- Korpus <Linguistik> (30) (remove)
Institute
- Extern (2)
Das Ziel dieses Beitrags besteht darin, am Beispiel der türkischen Germanistikstudenten an der Ege Universität die Merkmale und Entwicklung der pragmatisch-diskursiven Fähigkeit als eine Teilkompetenz der fremdsprachlichen Gesprächskompetenz zu untersuchen. Die Arbeit gliedert sich in zwei Abschnitte: Der erste Teil befasst sich mit der ausführlichen Beschreibung der Gesprächskompetenz als fremdsprachliche Kompetenz im Deutschen als Fremdsprache, der Bewertung der fremdsprachlichen Gesprächskompetenz als sprachproduktive Leistung und der Vorstellung von Subkategorien der pragmatisch-diskursiven Fähigkeit anhand der Beispiele aus dem Arbeitskorpus. Im zweiten Teil wird das Untersuchungsdesign und die Analyseergebnisse ausführlich dargestellt.
The 'Deutsche Referenzkorpus (DeReKo)' of the Mannheimer Institut für Deutsche Sprache currently contains over 28 billion words, and it is constantly being expanded. The sheer size of the corpus makes it impractical for researchers to analyze its entire content. On the other hand, the DeReKo offers the possibility of taking seriously the principle that every research project needs its own corpus - by acting as a 'reference corpus' that can be used in combination with special corpora. This paper addresses the question of whether a corpus should contain complete texts or only statistically relevant extracts; it also discusses the uses and necessity of 'small corpora'.
Při vyjadřování emocí v ústní komunikaci hraje hlas významnou roli. Článek se zabývá otázkou, jak je hlas v souvislosti s emocemi popisován v psaných textech, a sice německých románech. Na ukázkách z německého korpusu Cosmas II je ukázáno, jaké strategie volí spisovatelé, aby čtenáři přiblížili emoce prožívané postavami románu a která slovesa a přídavná jména používají nejčastěji při znázornění emoce "hněv".
Die Studie bietet eine umfangreiche Korpusanalyse von direktiven und manipulativen Matrixprädikaten des Deutschen, deren Komplemente zwischen finiten und infiniten Sätzen variieren. In synchroner Sicht sind die unterschiedlichen Varianten des Komplementsatzes zwar grundsätzlich synonym, ihre Verteilungsmuster werden aber wesentlich von konzeptuell-semantischen, gebrauchsorientierten und psycholinguistischen Faktoren beeinflusst. In der diachronen Perspektive zeigt sich, dass einige auf den ersten Blick voneinander unabhängige Entwicklungslinien Interdependenzen aufweisen und auf einen gemeinsamen Entwicklungsprozess hindeuten. Für den dass-Satz und für den zu-Infinitiv wird jeweils eine Entwicklungslinie rekonstruiert, die sich von den traditionellen Ansichten in einigen wichtigen Aspekten unterscheidet.
[Smirnova, Elena: Deutsche Komplementsatzstrukturen : synchrones System und diachrone Entwicklung / Elena Smirnova. - [1. Auflage]. - Heidelberg : Universitätsverlag Winter, [2017]. - 286 Seiten : Illustrationen. - (Sprache - Literatur und Geschichte ; Band 48)
ISBN 978-3-8253-6722-0]
Mit der mittelhochdeutschen Nebensilbenabschwächung beschäftigt sich Tanja Stevanovićs Beitrag "Wo sind die vollen Vokale geblieben? Eine Untersuchung möglicher Einflussfaktoren auf die Nebensilbenabschwächung". Dafür hat sie in einer Korpusuntersuchung im Referenzkorpus Mittelhochdeutsch schwache Verben analysiert, die trotz der fortschreitenden Nebensilbenabschwächung noch im Mittelhochdeutschen Vollvokale in Endsilben aufweisen.
Wie öffentlich ist die Hand? : Über Sinn und Unsinn eines Signifikanztests in der Korpuslinguistik
(2012)
In this article it will be shown that the use of a special statistical method for testing the significance of the co-occurrence of the type öffentlich+Hand (the Chi square test) does not make sense in a very large corpus. That means that one main test for measuring the significance of a collocation cannot be applied under standard conditions.
This paper presents an overview of Corpus Linguistics and some possibilities of studies with corpora. It gives suggestions on how to build a corpus and shows the application of Corpus Linguistics in different areas of linguistic research.
Brit Schwerin nimmt sich in ihrem Artikel "die bisher jedermann unbekannt gewesen [ist/war/sei/wäre] -Zum Rückgang des ersparten Finitums in Nebensätzen des frühen Neuhochdeutsch" des Phänomens der afiniten Nebensätze an, die in der Frühen Neuzeit im deutschen Sprachraum weit verbreitet waren. Ihre Analyse von Nebensätzen mit und ohne finites Verb in Texten aus dem 17. und 18. Jh. ergibt, dass der Rückgang der afiniten Konstruktionen in Verbindung mit dem Bedürfnis nach eindeutiger Markierung grammatischer Kategorien wie Tempus und Modus steht. Die diachronen Studien decken somit Sprachwandel auf verschiedenen Ebenen ab.
In diesem Artikel wird auf die lückenhafte lexikografische Darbietung von paradigmatisch-syntagmatischen Beziehungen hingewiesen und auf neue, korpusgestützte methodologische Verfahren der lexikosemantischen Analyse eingegangen. Im Mittelpunkt steht das am Mannheimer Institut für Deutsche Sprache entwickelte topografische Modell CNS (Contrasting Near Synonyms), dessen Beitrag für die Erforschung der Synonymie am Beispiel deutscher Adjektive "fühlbar" vs. "spürbar" präsentiert wird.
The article addresses the growing importance of corpus-based research in the field of German foreign language acquisition. German corpora in general and learner corpora in particular are briefly introduced. A short overview of existing German learner corpora is followed by a detailed description of the error-annotated learner corpus Falko, a learner corpus of advanced learner German, which is accessible via internet (without any prior registration) and free of charge. Finally, a short example analysis demonstrates some of the functionalities of Falko. The aim of the article is to encourage researchers to employ corpora as helpful tools in their own work.
Due to its specific features, the German participle has numerous functions and uses in word-formation. As partially deverbalized adjectives, participles take on the syntactic role of an adjective while at the same time retaining the valency of a verb. The paper presents the various steps in an analysis using graded (partial) corpora. Drawing on research into the properties and functions of various participle forms, it explores their specific uses in texts.
What do corpora reveal about ongoing grammaticalization and transitions between word class categories? Everything, something, or nothing? Using the example of the lexemes nicneříkající, nichtssagend, všeříkající and vielsagend the authors examine the syntactic distribution and semantics of participial adjectives. To what extent do the Czech and German equivalents differ? What (if any) effect does the orthography have (i.e. whether the expressions are written as compounds or as chains of separate words)? Is a new form accompanied by a new function? The text presents an analysis of monolingual corpora (SYN, DeReKo) and a parallel corpus (InterCorp).
Este trabalho se propõe a utilizar os princípios inerentes à Linguística de Corpus – listas de palavras, palavras-chave e linhas de concordância – com o intuito de fazer uma análise comparativa do texto Trauer und Melancholie, escrito por Freud em 1917, e suas cinco retraduções publicadas em português no Brasil. Devido à insatisfação em relação às traduções indiretas dos escritos freudianos, desde a década de 1990 têm surgido propostas de retraduções que visam recuperar nos textos em português a terminologia e o estilo que o pai da Psicanálise utilizou em alemão. A fim de verificar até que ponto as escolhas tradutórias estão diretamente ligadas ao texto-fonte, partimos de dados empíricos levantados por ferramentas computacionais. As análises quantitativas e qualitativas revelaram que as retraduções diretas foram influenciadas pelas anteriores – indiretas –, mostrando que outros fatores, além do texto de partida, afetam o texto traduzido, ainda que os tradutores não se deem conta disso.
Die Monographie über Körperhaltungen von Doris Schöps ist das Ergebnis eines Promotionsprojektes, das in der Arbeitsstelle für Semiotik der Technischen Universität Berlin durchgeführt worden ist. Sie ergänzt eine Reihe von semiotisch orientierten Dissertationen, die im gleichen Forschungskontext entstanden sind und die der lexikographischen Beschreibung emblematischer Gesten dienen. Die Verfasserin ließ sich in ihrem umfassenden Werk von diesem Ansatz der Gestenforschung inspirieren, wobei sie den Besonderheiten von Körperhaltungen Rechnung trägt, und ergänzt ihn um eine korpusanalytisch basierte Filmanalyse.
Der vorliegende Beitrag stellt eine linguistische Studie vor, die zwei nicht nah verwandte Sprachen auf dem Gebiet der Wortbildung vergleicht – das Deutsche und das Tschechische. Das Forschungsziel der Arbeit stellt die Untersuchung deutscher Determinativkomposita und der ihnen entsprechenden Wortbildungskonstruktionen im Tschechischen dar. Es wird eine relativ junge sprachwissenschaftliche Disziplin, die Korpuslinguistik, rein praktisch vorgestellt und die konkreten Ergebnisse der kontrastiven Untersuchung werden präsentiert.
Nsong is a western Bantu language spoken in the neighbourhood of Kikwit (5°2'28"S 18°48'58"E, Kwilu District, Bandundu Province, DRC) and encoded as B85d in the New Updated Guthrie List (Maho 2009). To this B80 or Tiene-Yanzi group also belongs Mbuun, encoded as B87 by Guthrie (1971: 39) and spoken in the wider vicinity of Idiofa (4°57'35"S 19°35'40", Kwilu District, Bandundu Province, Democratic Republic of the Congo). Both languages are closely related. They share a high percentage of fundamental and other vocabulary as well as several rather atypical phonological innovations (Bostoen & Koni Muluwa 2014; Koni Muluwa 2014; Koni Muluwa & Bostoen 2012). Preliminary elicitation-based research on Mbuun has pointed out that the pre-verbal domain plays a crucial role in the marking of argument focus in Mbuun (Bostoen & Mundeke 2011, 2012). In this paper, we assess whether this is also the case in Nsong on the basis of a text corpus which the first author has been collecting, transcribing and annotating in 2013 and 2014 as part of an endangered language documentation project funded by the DoBeS program of the Volkswagen Foundation through a 3-year grant (2012-2015). More information on the project can be found on http://www.kwilubantu.ugent.be/. This Nsong text corpus exclusively consists of oral discourse and currently counts 48.022 tokens and 11.973 types. The team’s 2013 fieldwork aimed at documenting Nsong speech events in as many different cultural settings as possible. As a result, the corpus comprises different text genres, such as political speeches, historical traditions, folk music, tales, proverbs, hunting language, ceremonial language used during circumcision and twin rites, and popular biological knowledge. In line with previous research on Mbuun, we concentrate here on mono-clausal argument focus constructions, even if preliminary research has pointed out that bi-clausal focus structures are more common in the Nsong corpus.
Carlotta J. Hübener diskutiert in ihrem Beitrag "Nicht/keinen/kein Fußball spielen? - Inkorporationsprozesse in Substantiv-Verb-Verbindungen" Inkorporationprozesse bei Substantiv-Verb-Verbindungen wie bspw. Fußball spielen. Hierbei fokussiert sie auf die Negation: Während kein(en) Fußball spielen einen Hinweis darauf gibt, dass Fußball noch als eigenständiges Substantiv interpretiert wird, ist nicht Fußball spielen ein Indiz dafür, dass Fußball und spielen als eine konzeptionelle Einheit wahrgenommen werden. Kein negiert nämlich Nomen (Ich mag keinen Spinat), während nicht Verben negiert (Ich hab‘ noch nicht gegessen). Hübener überprüft in ihrem Beitrag anhand des Deutschen Referenzkorpus, inwiefern Frequenz, Idiomatik und Individuiertheit Einfluss auf die Negation von Substativ-Verb-Verbindungen nehmen können.
Wie sich Konzessivkonnektoren im 18. und 19. Jh. entwickelt haben, untersuchen Lisa Bürgerhoff, Jana Giesenschlag, Linda Kunow und Alexandra Kern für ihren Beitrag "Von ob ich schon wanderte zu obschon ich wanderte?! - Eine Korpusuntersuchung zur Konzessivität von 1700-1900". Ihre Untersuchungen im Deutschen Textarchiv zeigen unter anderem einen Zusammenhang zwischen der Zusammenschreibung der Konnektoren und einer eindeutig konzessiven Lesart, der für obschon, obgleich, obwohl und obzwar allerdings unterschiedlich stark ist. Auch die Faktizität der Teilsätze und das Auftreten verstärkender Partikeln sind für die Entwicklung der ob-Gruppe von Bedeutung. Als eindeutigste und frequenteste Konzessivkonnektoren stellen sich insgesamt obwohl und vor allem obzwar heraus.
This paper deals with spelling normalization of historical texts with regard to further processing with modern part-of-speech taggers. Different methods for this task are presented and evaluated on a set of historical German texts from the 15th–18th century, and specific problems inherent to the processing of historical data are discussed. A chain combination using word-based and character-based techniques is shown to be best for normalization, while POS tagging of normalized data is shown to benefit from ignoring punctuation marks. Using these techniques, when 500 manually normalized tokens are used as training data for the normalization, the tagging accuracy of a manuscript from the 15th century can be raised from 28.65% to 76.27%.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
In dem Beitrag wird am Beispiel von zwei Emotionsverben des Deutschen und Tschechischen exemplarisch der Frage nachgegangen, wie typische Kollokationen zum Emotionswortschatz für die Belange eines zweisprachigen (tschechischdeutschen und deutsch-tschechischen) (Lerner-)Wörterbuches zu ermitteln sind. Im Mittelpunkt des Interesses befinden sich Kollokationen des Strukturtyps Verb + Adverb, weil dieser Typ von der Forschung bis jetzt nur ungenügend beachtet wurde. In einem ersten Schritt wird die Beschreibungspraxis in neueren ein- und zweisprachigen Wörterbüchern untersucht. In einem zweiten Schritt werden die Ergebnisse der Kookkurrenzanalyse zu den ausgewählten Ausdrücken anhand des Deutschen Referenzkorpus des IDS Mannheim und des Tschechischen Nationalkorpus ausgewertet. Zum Schluss werden aus den Ergebnissen der Gegenüberstellung Beschreibungsvorschläge für die lexikographische Praxis gemacht.