Refine
Year of publication
Document Type
- Article (23)
- Part of a Book (10)
- Review (8)
- Conference Proceeding (4)
- Working Paper (1)
Language
- German (37)
- English (4)
- Portuguese (4)
- Croatian (1)
Has Fulltext
- yes (46)
Is part of the Bibliography
- no (46) (remove)
Keywords
- Korpus <Linguistik> (46) (remove)
Institute
- Extern (2)
Der vorliegende Beitrag ist dem korpusbasierten Vergleich von vier Phrasemen des Deutschen mit der Bedeutung 'jemanden/etwas antreiben' gewidmet. Anhand einer maschinellen Auswertung von Belegen aus dem Deutschen Referenzkorpus (DeReKo) werden syntaktische, semantische und kombinatorische Eigenschaften dieser Phraseme beschrieben. Die semantischen Eigenschaften wurden mit der DeReKo-eigenen Kookkurrenzanalyse ermittelt, die morpho-syntaktischen Besonderheiten mit GATE. Verglichen wurden solche Merkmale wie Besetzung der Objektvalenz, Kombinierbarkeit mit Adverbien, Gebrauch mit Negation und Vorkommen unterschiedlicher Zeitformen des Verbs. Es wurden sowohl Gemeinsamkeiten als auch Unterschiede festgestellt.
Die vorliegende kontrastive Analyse stützt sich auf das heuristische Verfahren des PREPCON-kontrastiv Moduls, das am Leibniz-Institut für Deutsche Sprache in Mannheim entwickelt worden ist. Das deutsch-slowakisch-spanische PREPCON-Projekt mit insgesamt drei linguistischen Modulen (PREPCON explorativ, temporal und kontrastiv) reflektiert ein breites Forschungsspektrum der sog. Präposition-Nomen-Verbindungen (kurz PWVs). Das Modul PREPCON explorativ bietet eine exhaustive Liste der PWVs im Deutschen entweder aus der Präposition- oder aus der Nomenperspektive. PREPCON temporal nimmt die temporalen PWVs ins Visier und erweitert die Angabe der KWIC3-Belege für die PWVs um verwandte Wörter und Wortgruppen, die Häufigkeit der PWVs im Korpus, ihre typischen Partnerwörter und Muster. Die Vorgehensweise des dritten, d.h. des kontrastiven Moduls, nimmt die PWVs "am Anfang", "auf Anhieb", "mit Genugtuung", "nach Belieben" im interlingualen Kontext unter die Lupe. Das Analysewerkzeug lexpan, das bei der Kontrastierung zum Einsatz gebracht wird, enthüllt wertvolle Muster und typische Kollokationspartner der untersuchten präpositionalen Wortverbindungen und kondensiert die Ergebnisse für eine benutzerfreundliche Verwendung. Eine detaillierte Beschreibung des Modells, Methoden und Formen der Onlinepräsentation der analysierten lexikalisch geprägten Mus-
ter ist in Steyer 2018 zu finden. Die linguistische Aufmerksamkeit wird im Rahmen dieses Beitrags der PWV "bez váhania" (wörtlich "ohne Zögern") geschenkt, bei der sich neben der primär beobachtbaren modalen Ausprägung auch eine hypothetische temporale Ladung zeigt. Der Grund für die Auswahl der konkreten Wortverbindung liegt in der unzureichenden Reflektion der temporalen Bedeutung aus lexikografischer Sicht und in der bemerkenswerten, eventuell nicht auf Anhieb erkennbaren "Bipolarität" (modal-temporal) dieses Minimalphrasems.
Das Thema fokussiert die Problematik der binären Präposition-Substantiv-Wortverbindungen (PWV) und -Wortverbindungsmuster (PWVM) mit ihren rekurrenten Kollokationspartnern und syntagmatischen Kontextmustern. Untersucht werden deutsche präpositionale Wortverbindungen, bei denen die interne Stelle zwischen der Präposition und dem Nomen überproportional häufig nicht mit einem Artikel besetzt ist. Solche Kombinationen kann man als autonome Einheiten auffassen und als feste Wortverbindungen untersuchen. Die Analyse stützt sich auf die Daten in der PRECON Datenbank, die vom Projekt Usuelle Wortverbindungen (UWV) modular erarbeitet wurde. Der im vorliegenden Artikel präsentierte empirische Zugang wirft ein neues Licht auf die Bestimmung der Äquivalenz, was bisher bei der Festlegung des sogenannten Systemäquivalents gar nicht oder nur annähernd beschrieben werden konnte. Das methodologische und lexikographische Novum beim Kontrastieren ist die Erweiterung der Beschreibung der Kernbedeutung(en) und ihrer Kernäquivalente um die Gebrauchsspezifika der Verwendung der äquivalenten PWV(M). Die korpusempirischen Analysen bestätigen die heute vertretene These, dass sich die Bedeutungs- und andere Gebrauchsaspekte nur schwer trennen lassen. Für die adäquate Beschreibung einer fremdsprachigen Einheit sind somit die verfestigte sprachliche Struktur, die verfestigte sprachliche Umgebung, die verfestigten situativ-kontextuellen Gebrauchsspezifika und die usualisierten Kontextmuster wichtig, in die die kontrastierten PWV eingebettet sind.
O modo como a mídia representa migrantes e refugiados desempenha um papel importante na percepção e recepção desse grupo em seu novo país (Ferreira/ Flister, 2019). Este estudo visa a problematizar o olhar da mídia online sobre imigração e refúgio no quadro de uma discussão sobre o tema a partir de uma perspectiva teórica da linguística cognitiva, por meio da análise de metáforas conceituais utilizadas por dois jornais online (um brasileiro e outro alemão) em torno da conceitualização do termo 'refúgio' ('Flucht' em alemão). Este estudo foi desenvolvido com apoio de metodologia da linguística de corpus. Nosso objetivo é contrastar os usos linguísticos em dois contextos culturais e pragmáticos distintos, i.e. a cultura brasileira e a cultura alemã respectivamente, por meio da análise de mapeamentos metafóricos sobre refúgio e imigração na mídia online através de enquadramentos metafóricos presentes nesses jornais. Algumas questões que pretendemos responder são: Que frames e que metáforas surgem na mídia online brasileira e alemã, a exemplo dos jornais online "Folha de São Paulo" (FSP), no Brasil, e o jornal online "Frankfurter Allgemeine Online" (FaZ) na Alemanha, para representar o conceito refúgio? Quais são suas implicações? Os resultados apontaram o uso de frames e metáforas do domínio experiencial DESASTRES/ FENÔMENOS NATURAIS com conotação negativa como 'ondas de imigração', 'avalanche imigratória', 'Flüchtlingsströme' ('correntes de refugiados') e 'Flüchtlingsbestie' ('monstro refugiado').
Im Beitrag wird die Problematik rekurrenter, strukturell und semantisch sehr heterogener Wortverbindungen fokussiert. Es geht um in der Mehrwortforschung eher vernachlässigte Konstruktionen, die man als binäre Präposition-Substantiv-Verbindungen bezeichnen kann. Die Analyse lexikalisch-syntagmatischer Kombinatorik von minimalen Wortverbindungen eröffnet neue Ergebnisse, denn auch Funktionswörter sind restringiert im Gebrauch. In diesem Artikel wird versucht, die Problematik der Äquivalenz dieser Wortverbindungen näher zu bringen und durch reiche Belege auf die Wichtigkeit kontrastiver Analysen aus der sprachpraktischen und didaktischen Perspektive hinzuweisen. Die Auseinandersetzung mit dem Thema der präpositionalen Wortverbindungen aus der kontrastiven Sicht stellt ein Desiderat in der bisherigen Forschung dar.
Beim Lesen einer Tageszeitung wird man mit vielen Fachwörtern kon-frontiert: Einen Teil davon stellen innovative Benennungen dar, deren Bedeutung den Lesern nicht bekannt sein muss. In diesem Beitrag wird der Frage nachgegangen, wie neue Fachwörter aus dem EDV-Bereich von Journalisten präsentiert werden und ob dem Leser eine Hilfe in Form von Definitionen oder Erklärungen angeboten wird.
Nur wenige Themen geben in der Gegenwart so häufig Anlass zu Kontroversen wie die Zuwanderung (Migration). Es ist zum Teil auch dadurch bedingt, dass sie so viele andere Bereiche berührt - Wirtschaft, Demografie, Politik, innere Sicherheit, Kultur, Sprache und sogar die Religion. Wie kann Europa von der Zuwanderung profitieren und gleichzeitig die Menschenrechte achten? Diese Problematik wird im medialen Diskurs sehr unterschiedlich präsentiert und in der Öffentlichkeit verschieden wahrgenommen. Zudem scheint sich das Thema besonders für politische Polemiken zu eignen, denen dann auch die bereits (nicht nur) in Deutschland lebenden Menschen mit ausländischen Wurzeln, die man jetzt "Bürger mit Migrationshintergrund" nennt, unterworfen werden. Im Fokus des vorliegenden Beitrags steht ein kurzer Entwurf (als Beispiel) der diversen sprachlichen Repräsentation der Migration im Hinblick auf die ausgewählten schriftlichen Texte im Deutschen Referenzkorpus (kurz DeReKo). Es ist ein elektronisches Archiv von deutsch-sprachigen Textkorpora geschriebener Sprache, das seit 1964 existiert und vom Institut für Deutsche Sprache (IDS) in Mannheim gepflegt und kontinuierlich ausgebaut wird.
The paper will focus on the analysis of selected linguistic markers of argumentation structures in Czech and German. On the basis of corpus‑based analysis, I work with the assumption that argumentation structures are one of the parameters of equivalence in translation. The theoretical starting point for this analysis is the hypothesis that the linguistic form of arguments has a significant impact on their identification and potential. In my paper, I will pursue the following specific questions: 1) What are the linguistic markers of argument strength / weakness in German and in Czech? 2) How do the mutual relationships between structure and linguistic outcome change as a result of the translation? 3) Might the effects resulting from the translation of the argumentation structures be interpreted as processes of explicitation and implicitation? 4) What are the advantages and disadvantages of working with a parallel corpus as a basis for the analysis of the translation of local argumentative structures? Since the structures of argumentation are one of the elementary fundamentals of a text, issues connected to their translation represent one of the central research interests in Translation Studies.
Wie sich Konzessivkonnektoren im 18. und 19. Jh. entwickelt haben, untersuchen Lisa Bürgerhoff, Jana Giesenschlag, Linda Kunow und Alexandra Kern für ihren Beitrag "Von ob ich schon wanderte zu obschon ich wanderte?! - Eine Korpusuntersuchung zur Konzessivität von 1700-1900". Ihre Untersuchungen im Deutschen Textarchiv zeigen unter anderem einen Zusammenhang zwischen der Zusammenschreibung der Konnektoren und einer eindeutig konzessiven Lesart, der für obschon, obgleich, obwohl und obzwar allerdings unterschiedlich stark ist. Auch die Faktizität der Teilsätze und das Auftreten verstärkender Partikeln sind für die Entwicklung der ob-Gruppe von Bedeutung. Als eindeutigste und frequenteste Konzessivkonnektoren stellen sich insgesamt obwohl und vor allem obzwar heraus.
Carlotta J. Hübener diskutiert in ihrem Beitrag "Nicht/keinen/kein Fußball spielen? - Inkorporationsprozesse in Substantiv-Verb-Verbindungen" Inkorporationprozesse bei Substantiv-Verb-Verbindungen wie bspw. Fußball spielen. Hierbei fokussiert sie auf die Negation: Während kein(en) Fußball spielen einen Hinweis darauf gibt, dass Fußball noch als eigenständiges Substantiv interpretiert wird, ist nicht Fußball spielen ein Indiz dafür, dass Fußball und spielen als eine konzeptionelle Einheit wahrgenommen werden. Kein negiert nämlich Nomen (Ich mag keinen Spinat), während nicht Verben negiert (Ich hab‘ noch nicht gegessen). Hübener überprüft in ihrem Beitrag anhand des Deutschen Referenzkorpus, inwiefern Frequenz, Idiomatik und Individuiertheit Einfluss auf die Negation von Substativ-Verb-Verbindungen nehmen können.
Mit der mittelhochdeutschen Nebensilbenabschwächung beschäftigt sich Tanja Stevanovićs Beitrag "Wo sind die vollen Vokale geblieben? Eine Untersuchung möglicher Einflussfaktoren auf die Nebensilbenabschwächung". Dafür hat sie in einer Korpusuntersuchung im Referenzkorpus Mittelhochdeutsch schwache Verben analysiert, die trotz der fortschreitenden Nebensilbenabschwächung noch im Mittelhochdeutschen Vollvokale in Endsilben aufweisen.
Brit Schwerin nimmt sich in ihrem Artikel "die bisher jedermann unbekannt gewesen [ist/war/sei/wäre] -Zum Rückgang des ersparten Finitums in Nebensätzen des frühen Neuhochdeutsch" des Phänomens der afiniten Nebensätze an, die in der Frühen Neuzeit im deutschen Sprachraum weit verbreitet waren. Ihre Analyse von Nebensätzen mit und ohne finites Verb in Texten aus dem 17. und 18. Jh. ergibt, dass der Rückgang der afiniten Konstruktionen in Verbindung mit dem Bedürfnis nach eindeutiger Markierung grammatischer Kategorien wie Tempus und Modus steht. Die diachronen Studien decken somit Sprachwandel auf verschiedenen Ebenen ab.
Die vorliegende Studie setzt sich mit dem Adjektiv "neu" und seinem slowakischen Äquivalent "nový" systembezogen und pragmatisch auseinander. Wir befassen uns kontrastiv mit der Bedeutungsstruktur, mit der Kollokabilität und lexikographischen Auffassung dieser Adjektive. Um alle erwähnten Ebenen in ihrer Komplexität zu erfassen, darf man sie nicht voneinander getrennt untersuchen. Bei unserer Untersuchung gehen wir von der kodifizierten Bedeutung aus, die wir mit der realen Sprachverwendung vergleichen und ihre Anwendbarkeit an der aus den Korpora gewonnenen Daten überprüfen. Bei unserer kontrastiven Vorhegensweise ist der Ausgangspunkt die Auslegung der slowakischen Bedeutungsbeschreibung der lexikalischen Einheit "nový". Zunächst erweitert sich der Forschungsgegenstand um den Vergleich der jeweiligen Erläuterungen der deutschen lexikalischen Einheit "neu" in verschiedenen deutschen Wörterbüchern. Im Anschluss an die semantische Analyse der einzelnen Adjektive in den zwei von uns ausgewählten Sprachen überprüfen wir, ob und inwiefern bei der Bedeutungsbeschreibung der Übersetzungsäquivalente "nový" und "neu" eine analogische Auslegung verwendbar ist.
Das Ziel dieses Beitrags besteht darin, am Beispiel der türkischen Germanistikstudenten an der Ege Universität die Merkmale und Entwicklung der pragmatisch-diskursiven Fähigkeit als eine Teilkompetenz der fremdsprachlichen Gesprächskompetenz zu untersuchen. Die Arbeit gliedert sich in zwei Abschnitte: Der erste Teil befasst sich mit der ausführlichen Beschreibung der Gesprächskompetenz als fremdsprachliche Kompetenz im Deutschen als Fremdsprache, der Bewertung der fremdsprachlichen Gesprächskompetenz als sprachproduktive Leistung und der Vorstellung von Subkategorien der pragmatisch-diskursiven Fähigkeit anhand der Beispiele aus dem Arbeitskorpus. Im zweiten Teil wird das Untersuchungsdesign und die Analyseergebnisse ausführlich dargestellt.
Der vorliegende Beitrag möchte die Perspektiven einer solchen akteursorientierten Diskursanalyse aufzeigen. Die Akteure stellen nämlich diejenige "Kraft" dar, die den Diskurs ins Leben ruft, diesen formuliert und dynamisiert. Auf die Lexik ausgerichtete Untersuchungen fokussieren in erster Linie auf die sprachliche Oberfläche, d.h. etwa auf Fahnenwörter, Schlüsselwörter oder auf die Metaphorik. Diese können jedoch erst als Endprodukte der sprachlichen Tätigkeit der Akteure betrachtet werden, in denen sich deren Motivationen, Meinungen, Positionierungen und Einstellungen konstituieren. Akteursorientierte Analysen möchten hingegen auch den Hintergrund beleuchten: die Ebene der Argumentation, die Topoi, die im Diskurs in konkreten Sprachgebrauchsmustern sich materialisieren. Diese Muster sind als kollektive Denkmuster zu betrachten, die einer Gemeinschaft im kollektiven Gedächtnis zur Verfügung stehen. Als kollektiv gespeichertes und durch die Sprache zugänglich gemachtes Wissen prägen sie das Weltbild der jeweiligen Sprachgemeinschaft. Das bedeutet zugleich, dass der Sprache eine fundamentale Rolle als wissensstiftendes Medium zukommt. Sie bestimmt, wie die Welt wahrgenommen und daraus Faktizität hergestellt wird. Ferner heißt das auch, dass Diskurse zugleich als Orientierungsrahmen dienen. Sie stellen den Sprachbenutzern Wissensbestände zur Verfügung, die sowohl bei der Deutung von Ereignissen und Entitäten eine kognitive Basis bilden, als auch eine Struktur anbieten, in die neue Kenntnisse integriert werden können.
Dieser Vortrag stellt Kriterien der Auswahl von deutsch-tschechischen und tschechisch-deutschen Teilkorpora für die Analyse der deutsch-tschechischen Wortstellungsunterschiede, einen Kommentar zur Analyse der Dependenzgrammatik und der Thema-Rhema-Gliederung und die Veröffentlichung einiger Erkenntnisse dieser Forschungsarbeit vor.
Um die zentralen Spracherscheinungen von den peripheren unterscheiden zu können, braucht man sprachliche Daten. Nicht nur aus dem Bedürfnis heraus, authentische Beispiele einfach und schnell finden zu können, greift man heutzutage nach Textkorpora unterschiedlicher Art. Im Beitrag wird am Beispiel des deutschen Verbs lassen gezeigt, wie man sich ein Parallelkorpus bei prachvergleichenden Analysen zu Nutze machen kann und wie man die Korpusbelege auswertet, um die zentralen Phänomene des jeweiligen Sprachsystems hervorzuheben.
Die Studie bietet eine umfangreiche Korpusanalyse von direktiven und manipulativen Matrixprädikaten des Deutschen, deren Komplemente zwischen finiten und infiniten Sätzen variieren. In synchroner Sicht sind die unterschiedlichen Varianten des Komplementsatzes zwar grundsätzlich synonym, ihre Verteilungsmuster werden aber wesentlich von konzeptuell-semantischen, gebrauchsorientierten und psycholinguistischen Faktoren beeinflusst. In der diachronen Perspektive zeigt sich, dass einige auf den ersten Blick voneinander unabhängige Entwicklungslinien Interdependenzen aufweisen und auf einen gemeinsamen Entwicklungsprozess hindeuten. Für den dass-Satz und für den zu-Infinitiv wird jeweils eine Entwicklungslinie rekonstruiert, die sich von den traditionellen Ansichten in einigen wichtigen Aspekten unterscheidet.
[Smirnova, Elena: Deutsche Komplementsatzstrukturen : synchrones System und diachrone Entwicklung / Elena Smirnova. - [1. Auflage]. - Heidelberg : Universitätsverlag Winter, [2017]. - 286 Seiten : Illustrationen. - (Sprache - Literatur und Geschichte ; Band 48)
ISBN 978-3-8253-6722-0]
Den Untersuchungsgegenstand dieses Beitrags bilden Partizipien in der deutschen Sprache. Der Begriff 'Partizip' wird in der Form, in der ihn die Lerner in Grammatiken und Schulbüchern als Partizip I (laufend) und Partizip II (gelaufen) kennen lernen, je nach zugrundeliegender Auffassung als 'Mittelwort', 'Verb', 'Adjektiv', 'Verbaladjektiv', 'adjektivisches Verb' oder 'verbalbasiertes Adjektiv' bezeichnet. Diese Benennungen spiegeln auf der einen Seite die vielfältigen Eigenschaften des Partizips wider, auf der anderen Seite führen sie zu zahlreichen Fragen, denen in dieser Arbeit nachgegangen wird. Da die Verwendungs- und Wortbildungsmöglichkeiten eines Partizips sehr vielfältig sind und da es anscheinend nicht eindeutig als Wort einer einzigen Wortart einzustufen ist, stellt das deutsche Partizip einen vielversprechenden Untersuchungsgegenstand dar. Der Beitrag setzt sich zum Ziel, die Verwendungsmöglichkeiten von Partizipien zu beschreiben, und zwar auf der Basis analysierter Korpusdaten, die als authentisches Sprachmaterial den tatsächlichen Gebrauch des Partizips in der modernen deutschen Sprache widerspiegeln.
Die Monographie über Körperhaltungen von Doris Schöps ist das Ergebnis eines Promotionsprojektes, das in der Arbeitsstelle für Semiotik der Technischen Universität Berlin durchgeführt worden ist. Sie ergänzt eine Reihe von semiotisch orientierten Dissertationen, die im gleichen Forschungskontext entstanden sind und die der lexikographischen Beschreibung emblematischer Gesten dienen. Die Verfasserin ließ sich in ihrem umfassenden Werk von diesem Ansatz der Gestenforschung inspirieren, wobei sie den Besonderheiten von Körperhaltungen Rechnung trägt, und ergänzt ihn um eine korpusanalytisch basierte Filmanalyse.
The 'Deutsche Referenzkorpus (DeReKo)' of the Mannheimer Institut für Deutsche Sprache currently contains over 28 billion words, and it is constantly being expanded. The sheer size of the corpus makes it impractical for researchers to analyze its entire content. On the other hand, the DeReKo offers the possibility of taking seriously the principle that every research project needs its own corpus - by acting as a 'reference corpus' that can be used in combination with special corpora. This paper addresses the question of whether a corpus should contain complete texts or only statistically relevant extracts; it also discusses the uses and necessity of 'small corpora'.
Due to its specific features, the German participle has numerous functions and uses in word-formation. As partially deverbalized adjectives, participles take on the syntactic role of an adjective while at the same time retaining the valency of a verb. The paper presents the various steps in an analysis using graded (partial) corpora. Drawing on research into the properties and functions of various participle forms, it explores their specific uses in texts.
"Zentrum und Peripherie". Internationale Konferenz des Germanistenverbandes der Tschechischen Republik an der Schlesischen Universität in Opava, 25.-27. Mai 2016
Die internationale Tagung Zentrum und Peripherie wurde vom Germanistenverband der Tschechischen Republik und der Abteilung für Germanistik am Institut für Fremdsprachen der Schlesischen Universität in Opava veranstaltet. Das Organisationsteam aus Opava bestand aus Dr. habil. Gabriela Rykalová, Dr. habil. Veronika Kotůlková und Dr. Miroslav Urbanec. Fast hundert FachteilnehmerInnen aus der Tschechischen Republik, Deutschland, Österreich, Polen, der Slowakei, Spanien, der Türkei und Ungarn konnten in Opava begrüßt werden, außerdem VertreterInnen des DAAD, der Deutschen Welle, des Österreichischen Kulturforums Prag sowie Germanistikstudierende verschiedener Universitäten. Im Rahmen der Konferenz fand auch die Mitgliederversammlung des Germanistenverbands der Tschechischen Republik statt.
Este trabalho se propõe a utilizar os princípios inerentes à Linguística de Corpus – listas de palavras, palavras-chave e linhas de concordância – com o intuito de fazer uma análise comparativa do texto Trauer und Melancholie, escrito por Freud em 1917, e suas cinco retraduções publicadas em português no Brasil. Devido à insatisfação em relação às traduções indiretas dos escritos freudianos, desde a década de 1990 têm surgido propostas de retraduções que visam recuperar nos textos em português a terminologia e o estilo que o pai da Psicanálise utilizou em alemão. A fim de verificar até que ponto as escolhas tradutórias estão diretamente ligadas ao texto-fonte, partimos de dados empíricos levantados por ferramentas computacionais. As análises quantitativas e qualitativas revelaram que as retraduções diretas foram influenciadas pelas anteriores – indiretas –, mostrando que outros fatores, além do texto de partida, afetam o texto traduzido, ainda que os tradutores não se deem conta disso.
Rezension zu Kratochvílová, Iva/Wolf, Norbert Richard (Hgg.) (2013): Grundlagen einer sprachwissenschaftlichen Quellenkunde (Studien zur Deutschen Sprache 66). Tübingen: Narr Francke Attempto Verlag GmbH + Co. KG, ISBN 978-3-8233-6836-6, 382 S.
Der Sammelband, der Beiträge zu allgemeinen korpuslinguistischen Problemen und spezifischen korpusbasierten bzw. -gestützten Studien enthält, ist dem Andenken Hans Wellmanns (1936–2012) gewidmet - sein letzter Beitrag befindet sich in diesem Band.
Nsong is a western Bantu language spoken in the neighbourhood of Kikwit (5°2'28"S 18°48'58"E, Kwilu District, Bandundu Province, DRC) and encoded as B85d in the New Updated Guthrie List (Maho 2009). To this B80 or Tiene-Yanzi group also belongs Mbuun, encoded as B87 by Guthrie (1971: 39) and spoken in the wider vicinity of Idiofa (4°57'35"S 19°35'40", Kwilu District, Bandundu Province, Democratic Republic of the Congo). Both languages are closely related. They share a high percentage of fundamental and other vocabulary as well as several rather atypical phonological innovations (Bostoen & Koni Muluwa 2014; Koni Muluwa 2014; Koni Muluwa & Bostoen 2012). Preliminary elicitation-based research on Mbuun has pointed out that the pre-verbal domain plays a crucial role in the marking of argument focus in Mbuun (Bostoen & Mundeke 2011, 2012). In this paper, we assess whether this is also the case in Nsong on the basis of a text corpus which the first author has been collecting, transcribing and annotating in 2013 and 2014 as part of an endangered language documentation project funded by the DoBeS program of the Volkswagen Foundation through a 3-year grant (2012-2015). More information on the project can be found on http://www.kwilubantu.ugent.be/. This Nsong text corpus exclusively consists of oral discourse and currently counts 48.022 tokens and 11.973 types. The team’s 2013 fieldwork aimed at documenting Nsong speech events in as many different cultural settings as possible. As a result, the corpus comprises different text genres, such as political speeches, historical traditions, folk music, tales, proverbs, hunting language, ceremonial language used during circumcision and twin rites, and popular biological knowledge. In line with previous research on Mbuun, we concentrate here on mono-clausal argument focus constructions, even if preliminary research has pointed out that bi-clausal focus structures are more common in the Nsong corpus.
In dem Beitrag wird am Beispiel von zwei Emotionsverben des Deutschen und Tschechischen exemplarisch der Frage nachgegangen, wie typische Kollokationen zum Emotionswortschatz für die Belange eines zweisprachigen (tschechischdeutschen und deutsch-tschechischen) (Lerner-)Wörterbuches zu ermitteln sind. Im Mittelpunkt des Interesses befinden sich Kollokationen des Strukturtyps Verb + Adverb, weil dieser Typ von der Forschung bis jetzt nur ungenügend beachtet wurde. In einem ersten Schritt wird die Beschreibungspraxis in neueren ein- und zweisprachigen Wörterbüchern untersucht. In einem zweiten Schritt werden die Ergebnisse der Kookkurrenzanalyse zu den ausgewählten Ausdrücken anhand des Deutschen Referenzkorpus des IDS Mannheim und des Tschechischen Nationalkorpus ausgewertet. Zum Schluss werden aus den Ergebnissen der Gegenüberstellung Beschreibungsvorschläge für die lexikographische Praxis gemacht.
This paper deals with spelling normalization of historical texts with regard to further processing with modern part-of-speech taggers. Different methods for this task are presented and evaluated on a set of historical German texts from the 15th–18th century, and specific problems inherent to the processing of historical data are discussed. A chain combination using word-based and character-based techniques is shown to be best for normalization, while POS tagging of normalized data is shown to benefit from ignoring punctuation marks. Using these techniques, when 500 manually normalized tokens are used as training data for the normalization, the tagging accuracy of a manuscript from the 15th century can be raised from 28.65% to 76.27%.
What do corpora reveal about ongoing grammaticalization and transitions between word class categories? Everything, something, or nothing? Using the example of the lexemes nicneříkající, nichtssagend, všeříkající and vielsagend the authors examine the syntactic distribution and semantics of participial adjectives. To what extent do the Czech and German equivalents differ? What (if any) effect does the orthography have (i.e. whether the expressions are written as compounds or as chains of separate words)? Is a new form accompanied by a new function? The text presents an analysis of monolingual corpora (SYN, DeReKo) and a parallel corpus (InterCorp).
Wie öffentlich ist die Hand? : Über Sinn und Unsinn eines Signifikanztests in der Korpuslinguistik
(2012)
In this article it will be shown that the use of a special statistical method for testing the significance of the co-occurrence of the type öffentlich+Hand (the Chi square test) does not make sense in a very large corpus. That means that one main test for measuring the significance of a collocation cannot be applied under standard conditions.
Při vyjadřování emocí v ústní komunikaci hraje hlas významnou roli. Článek se zabývá otázkou, jak je hlas v souvislosti s emocemi popisován v psaných textech, a sice německých románech. Na ukázkách z německého korpusu Cosmas II je ukázáno, jaké strategie volí spisovatelé, aby čtenáři přiblížili emoce prožívané postavami románu a která slovesa a přídavná jména používají nejčastěji při znázornění emoce "hněv".
The article addresses the growing importance of corpus-based research in the field of German foreign language acquisition. German corpora in general and learner corpora in particular are briefly introduced. A short overview of existing German learner corpora is followed by a detailed description of the error-annotated learner corpus Falko, a learner corpus of advanced learner German, which is accessible via internet (without any prior registration) and free of charge. Finally, a short example analysis demonstrates some of the functionalities of Falko. The aim of the article is to encourage researchers to employ corpora as helpful tools in their own work.
Der vorliegende Beitrag stellt eine linguistische Studie vor, die zwei nicht nah verwandte Sprachen auf dem Gebiet der Wortbildung vergleicht – das Deutsche und das Tschechische. Das Forschungsziel der Arbeit stellt die Untersuchung deutscher Determinativkomposita und der ihnen entsprechenden Wortbildungskonstruktionen im Tschechischen dar. Es wird eine relativ junge sprachwissenschaftliche Disziplin, die Korpuslinguistik, rein praktisch vorgestellt und die konkreten Ergebnisse der kontrastiven Untersuchung werden präsentiert.
In diesem Artikel wird auf die lückenhafte lexikografische Darbietung von paradigmatisch-syntagmatischen Beziehungen hingewiesen und auf neue, korpusgestützte methodologische Verfahren der lexikosemantischen Analyse eingegangen. Im Mittelpunkt steht das am Mannheimer Institut für Deutsche Sprache entwickelte topografische Modell CNS (Contrasting Near Synonyms), dessen Beitrag für die Erforschung der Synonymie am Beispiel deutscher Adjektive "fühlbar" vs. "spürbar" präsentiert wird.
Die kontrastive Sprachwissenschaft spezialisiert sich auf den Vergleich von unterschiedlichen Sprachsystemen. Aus dieser Perspektive gesehen stellen die bi- bzw. multilingualen Korpora in allen ihren Erscheinungsformen eine effiziente Vergleichsbasis für die Konfrontation von zwei oder mehreren Sprachsystemen dar. Die konkreten Ergebnisse werden von der mehrsprachigen Lexikographie oder in der Übersetzungswissenschaft angewandt, da die korpuslinguistische Sprachbetrachtung den authentischen Sprachgebrauch beobachtet. Zur Feststellung der andersprachigen
Äquivalenz, sowohl grammatikalischen als auch lexikalischen, ist es notwendig, das jeweilige Sprachelement im aktuellen Kontext, d. h. im Korpus, zu betrachten.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
This paper presents an overview of Corpus Linguistics and some possibilities of studies with corpora. It gives suggestions on how to build a corpus and shows the application of Corpus Linguistics in different areas of linguistic research.