Linguistik
Refine
Year of publication
Document Type
- Article (186)
- Preprint (69)
- Part of a Book (65)
- Working Paper (40)
- Conference Proceeding (33)
- Book (24)
- Review (12)
- Part of Periodical (7)
- Course Material (1)
- Report (1)
Language
- Croatian (150)
- English (141)
- German (120)
- Portuguese (9)
- Turkish (7)
- mis (4)
- French (3)
- Italian (2)
- Multiple languages (1)
- Spanish (1)
Has Fulltext
- yes (438)
Is part of the Bibliography
- no (438)
Keywords
- Kroatisch (50)
- Linguistik (50)
- Rezension (48)
- Deutsch (35)
- Computerlinguistik (32)
- Syntax (19)
- Japanisch (18)
- Grammatik (17)
- Namenkunde (17)
- Rezensionen (17)
Institute
- Extern (438) (remove)
Während Anglizismen in deutscher Jugend- und Standardsprache bereits gut untersucht sind, stellt der Einfluss des Englischen auf multiethnolektale Varietäten des Deutschen noch ein unbestelltes Feld dar. Mit diesem Beitrag möchten wir einen Anstoß für künftige Forschungsarbeit in diesem Gebiet geben und zugleich einige erste Schritte unternehmen
Der folgende Beitrag stellt kein GIP-Projekt vor, das Projekt hat aber doch Einfluss auf die GIP Bochum-Ulan Ude genommen, die sich seit langem mit Multimediaaspekten im DaF-Unterricht beschäftigt. So werden etwa einige der im Folgenden beschriebenen Erfahrungen genutzt, um für das landeskundlich orientierte Lehrwerk Burjatien im Deutschunterricht (2005) eine multimediale Ergänzung zu schaffen.
U radu se daje pregled problema povezanih s normativnim statusom čestičnih/vezničkih skupina da li, je li i čestice/veznika li. Pokazuje se da postoji nekoliko pogrješaka povezanih s tumačenjem normativnog statusa i raspodjele tih skupina i te čestice te se provjerava normativno pravilo prema kojemu skupinu da li treba u standardnome jeziku zamijeniti česticom li (o tome se posve pogrješno često piše kao o zamjeni da li s je li, a skupina je li, s iznimkom skupine je li da koja ima funkciju dopunskoga pitanja, u standardnome jeziku ne postoji kao čestična/veznička skupina jer je njezin prvi član uvijek 3. lice prezenta glagola biti). Određuje se normativni status skupine je li, tj. pokazuje se da je ona u hrvatskome jeziku ili zastarjela ili da pripada razgovornomu stilu. Također se provjeravaju pravila u skladu s kojima se normativni status skupine da li u izravnome pitanju razlikuje od njezina statusa u neizravnome pitanju i prema kojima se skupina da li i u standardnome jeziku pojavljuje pri izricanju potvrdnosti te u alternativnim pitanjima. Donose se uvjeti zamjenjivosti skupina da li česticom/veznikom li, tj. izdvajaju se sintaktički konteksti u kojima ta zamjena nije potrebna ili nije moguća.
Eine unübersehbare Menge neuer Anglizismen findet über Fach- und Gruppensprachen Eingang in die deutsche Alltagssprache, in der ein Teil von ihnen inzwischen seinen festen Platz hat. […] Insbesondere in den Bereichen der Lautung und der Schreibung bleibt bei den neueren Entlehnungen oberflächlich eine große Nähe zu gebersprachlichen Strukturen erhalten. Diese Entwicklung wird von einigen Fachleuten und Politikern […] als Indiz für eine schleichende ‚Kolonialisierung’ der deutschen Sprache durch das Englische herangezogen. [...] Dieser Einschätzung widersprechen zahlreiche Organe […] und Autoren […] ausdrücklich. […] Im Kontext dieser Auseinandersetzung ist die vorliegende Arbeit verortet. Ihr Ziel ist es zu zeigen, daß die Sprecher des Deutschen Anglizismen sehr wohl phonologisch, graphematisch und morphologisch in die deutsche Sprache integrieren. Untersuchungsgegenstand sind mehrgliedrige Verben, die aus dem Englischen entlehnt wurden und überwiegend in Fach- und Gruppensprachen und/oder in informellem, vorwiegend mündlichem Text auftreten. Für das Problemfeld der verbalen Wortbildung wird dargelegt, daß morphologische Integration nicht unsystematisch erfolgt, sondern sich an den Flexionsmustern deutscher komplexer Verben orientiert. Der Integrationsgrad der einzelnen Lexeme ist dynamisch und sprecherabhängig.
"Ich mag so Wasserpfeifeladen" : the interaction of grammar and information structure in Kiezdeutsch
(2008)
Mit Erstaunen stellen LinguistInnen aus Deutschland, Österreich und der Schweiz immer wieder fest, dass sich in der "kleinen" Schweiz der geschlechtergerechte Sprachgebrauch in Öffentlichkeit und Alltag weit stärker durchgesetzt hat als in den anderen deutschsprachigen Ländern. Diese Einschätzung gilt es hier zu überprüfen und, falls sie zutrifft, zu belegen. Ausserdem werden - als erster Schritt fur weitere Untersuchungen - Thesen formuliert, die Erklärungen liefern, worauf diese Entwicklung zurückgeführt werden kann. Mit diesem Artikel geben wir anband von ausgewählten, konkreten Beispielen einen Einblick in die Situation, wie sie sich zur Zeit in der Schweiz präsentiert. Wir konzentrieren uns - unter sprachsoziologischer Perspektive - auf eine erste Bestandesaufnahme mit dem Blick auf die Diskussion in den Medien, die Institutionalisierung und die Einstellungen, die die spezifische sprachliche Situation in der Deutschschweiz prägen. Einen Rahmen fur unsere Untersuchung bilden die Überlegungen von Schräpel (SCHRÄPEL 1986), die die Auseinandersetzung um nichtsexistische Sprache als ein besonderes Sprachwandelphänomen untersucht. Sprachwandel im Vollzug ist einerseits einfacher zu erfassen als einer, der weiter zurückliegt, andererseits erschwert die Fülle des greifbaren Materials auch den Durchblick und das klare Erkennen von Tendenzen. Aus diesem Grund werten wir unser Datenmaterial nicht quantitativ aus, sondern konzentrieren uns darauf, für verschiedene Aspekte typische Beispiele zu geben und so den Stand der öffentlichen Diskussion und die Breite der vertretenen Meinungen darzustellen. Es wäre verlockend, das hier vorliegende Material auch allgemeinerer Form unter der Thematik "Sprachkritik" oder "Einstellungen" zu analysieren. Dies ist jedoch nicht im Zentrum unserer Fragestellung, weshalb wir bei einigen Beispielen auf entsprechende Untersuchungen (z.B. BLAUBERGS 1980, SCHOENTHAL 1989) verweisen.
This article presents linguistic features of and educational approaches to a new variety of German that has emerged in multi-ethnic urban areas in Germany: Kiezdeutsch (‘Hood German’). From a linguistic point of view, Kiezdeutsch is very interesting, as it is a multi-ethnolect that combines features of a youth language with those of a contact language. We will present examples that illustrate the grammatical productivity and innovative potential of this variety. From an educational perspective, Kiezdeutsch has also a high potential in many respects: school projects can help enrich intercultural communication and weaken derogatory attitudes. In grammar lessons, Kiezdeutsch can be a means to enhance linguistic competence by having the adolescents analyse their own language. Keywords: German, Kiezdeutsch, multi-ethnolect, migrants’ language, language change, educational proposals
Seit einem Jahrzehnt zählt Russisch zu den häufig gesprochenen Migrationssprachen an deutschen Schulen und rückt nun als weitere Lernersprache in den Fokus der linguistischen Migrationsforschung. Russischsprachige Schüler und Schülerinnen, die als Aussiedler vornehmlich aus Russland und Kasachstan immigrieren, bilden seit Beginn der 90er Jahre die bedeutendste Gruppe jugendlicher Einwanderer nach Deutschland. Aussiedlerjugendliche erhalten zwar in den meisten Fällen kurz nach ihrer Einreise die deutsche Staatsangehörigkeit, diese ist jedoch längst kein Garant mehr für eine reibungslose Integration. Neuere Befunde zeigen, dass eine wachsende Zahl junger AussiedlerInnen aus den GUS-Staaten Gefahr läuft, den Anschluss an eine adäquate schulische und berufliche Ausbildung zu verpassen (vgl. Dietz/Roll 1998, Strobl/Kühnel 2000). Ihre Bildungsbeteiligung hat sich der benachteiligten Bildungssituation anderer Immigrantenjugendlicher angenähert.
U radu se prvi put objavljuje jedina zasad pronađena inačica glagoljičke pasionske pjesme, koju smo nazvali Ja, Marija, glasom zovu, zapisane u Berčićevu kodeksu br. 5 s kraja 15. st. Donosi se latinička transkripcija teksta te njegove osnovne književnopovijesne, grafijsko-ortografske i jezično-stilske značajke.
In this paper, we investigate the usefulness of a wide range of features for their usefulness in the resolution of nominal coreference, both as hard constraints (i.e. completely removing elements from the list of possible candidates) as well as soft constraints (where a cumulation of violations of soft constraints will make it less likely that a candidate is chosen as the antecedent). We present a state of the art system based on such constraints and weights estimated with a maximum entropy model, using lexical information to resolve cases of coreferent bridging.
Multicomponent Tree Adjoining Grammars (MCTAGs) are a formalism that has been shown to be useful for many natural language applications. The definition of non-local MCTAG however is problematic since it refers to the process of the derivation itself: a simultaneity constraint must be respected concerning the way the members of the elementary tree sets are added. Looking only at the result of a derivation (i.e., the derived tree and the derivation tree), this simultaneity is no longer visible and therefore cannot be checked. I.e., this way of characterizing MCTAG does not allow to abstract away from the concrete order of derivation. In this paper, we propose an alternative definition of MCTAG that characterizes the trees in the tree language of an MCTAG via the properties of the derivation trees (in the underlying TAG) the MCTAG licences. We provide similar characterizations for various types of MCTAG. These characterizations give a better understanding of the formalisms, they allow a more systematic comparison of different types of MCTAG, and, furthermore, they can be exploited for parsing.
Multicomponent Tree Adjoining Grammars (MCTAG) is a formalism that has been shown to be useful for many natural language applications. The definition of MCTAG however is problematic since it refers to the process of the derivation itself: a simultaneity constraint must be respected concerning the way the members of the elementary tree sets are added. This way of characterizing MCTAG does not allow to abstract away from the concrete order of derivation. In this paper, we propose an alternative definition of MCTAG that characterizes the trees in the tree language of an MCTAG via the properties of the derivation trees (in the underlying TAG) the MCTAG licences. This definition gives a better understanding of the formalism, it allows a more systematic comparison of different types of MCTAG, and, furthermore, it can be exploited for parsing.
Multicomponent Tree Adjoining Grammars (MCTAG) is a formalism that has been shown to be useful for many natural language applications. The definition of MCTAG however is problematic since it refers to the process of the derivation itself: a simultaneity constraint must be respected concerning the way the members of the elementary tree sets are added. Looking only at the result of a derivation (i.e., the derived tree and the derivation tree), this simultaneity is no longer visible and therefore cannot be checked. I.e., this way of characterizing MCTAG does not allow to abstract away from the concrete order of derivation. Therefore, in this paper, we propose an alternative definition of MCTAG that characterizes the trees in the tree language of an MCTAG via the properties of the derivation trees the MCTAG licences.
A hierarchy of local TDGs
(1998)
Many recent variants of Tree Adoining Grammars (TAG) allow an underspecifiaction of the parent relation between nodes in a tree, i.e. they do not deal with fully specified trees as it is the case with TAGs.Such TAG variants are for example Description Tree Grammars (DTG), Unordered Vector Grammars with Dominance Links (UVG-DL), a definition of TAGs via so-called quasi trees and Tree Description Grammars (TDG. The last TAg variant, local TDG, is an extension of TAG generating Tree Descriptions. Local TDGs even allow an underspecification of the dominance relation between node names and thereby provide the possibility to generate underspecified representations for structural ambiguities such as quantifier scope ambiguities. This abstract deals with formal properties of local TDGs. A hierarchiy of local TDGs is established together with a pumping lemma for local TDGs of a certain rank.
This paper provides an overview of current research on a hybrid and robust parsing architecture for the morphological, syntactic and semantic annotation of German text corpora. The novel contribution of this research lies not in the individual parsing modules, each of which relies on state-of-the-art algorithms and techniques. Rather what is new about the present approach is the combination of these modules into a single architecture. This combination provides a means to significantly optimize the performance of each component, resulting in an increased accuracy of annotation.
This paper investigates the class of Tree-Tuple MCTAG with Shared Nodes, TT-MCTAG for short, an extension of Tree Adjoining Grammars that has been proposed for natural language processing, in particular for dealing with discontinuities and word order variation in languages such as German. It has been shown that the universal recognition problem for this formalism is NP-hard, but so far it was not known whether the class of languages generated by TT-MCTAG is included in PTIME. We provide a positive answer to this question, using a new characterization of TT-MCTAG.
Traditionally, parsers are evaluated against gold standard test data. This can cause problems if there is a mismatch between the data structures and representations used by the parser and the gold standard. A particular case in point is German, for which two treebanks (TiGer and TüBa-D/Z) are available with highly different annotation schemes for the acquisition of (e.g.) PCFG parsers. The differences between the TiGer and TüBa-D/Z annotation schemes make fair and unbiased parser evaluation difficult [7, 9, 12]. The resource (TEPACOC) presented in this paper takes a different approach to parser evaluation: instead of providing evaluation data in a single annotation scheme, TEPACOC uses comparable sentences and their annotations for 5 selected key grammatical phenomena (with 20 sentences each per phenomena) from both TiGer and TüBa-D/Z resources. This provides a 2 times 100 sentence comparable testsuite which allows us to evaluate TiGer-trained parsers against the TiGer part of TEPACOC, and TüBa-D/Z-trained parsers against the TüBa-D/Z part of TEPACOC for key phenomena, instead of comparing them against a single (and potentially biased) gold standard. To overcome the problem of inconsistency in human evaluation and to bridge the gap between the two different annotation schemes, we provide an extensive error classification, which enables us to compare parser output across the two different treebanks. In the remaining part of the paper we present the testsuite and describe the grammatical phenomena covered in the data. We discuss the different annotation strategies used in the two treebanks to encode these phenomena and present our error classification of potential parser errors.
This paper reports on the SYN-RA (SYNtax-based Reference Annotation) project, an on-going project of annotating German newspaper texts with referential relations. The project has developed an inventory of anaphoric and coreference relations for German in the context of a unified, XML-based annotation scheme for combining morphological, syntactic, semantic, and anaphoric information. The paper discusses how this unified annotation scheme relates to other formats currently discussed in the literature, in particular the annotation graph model of Bird and Liberman (2001) and the pie-in-thesky scheme for semantic annotation.
Türkiye’de son yıllarda birçok üniversitede çeşitli dillere yönelik “mütercim-tercümanlık”, daha yeni bir tanımla “çeviribilim” bölümlerinin açılmasıyla birlikte çeviri eğitimi, bilimsel açıdan araştırmaya değer bir konu haline gelmiştir. Sayıları yıldan yıla artarak bugün 20’ye ulaşan çeviri bölümlerinin hedef ve temel ilkeleri, son on yıllarla ifade edilen evreli bir gelişim sürecinde kurumsallaşmaya yaklaşan “çeviribilim” alanı açısından araştırılmaya değer olgusal durum olarak karşımızda durmaktadır. Bu çalışmanın amacı, bir yandan Türkiye’deki üniversitelerin çeviri programlarını temel alarak sürdürülen eğitim-öğretim etkinliklerini, ortaya koydukları hedefler açısından ele alıp irdelemek; diğer yandan ise çeviri eğitimi uygulamaları ile çeviri eğitimine dönük olarak ortaya atılan yaklaşımlar arasındaki benzerlikleri - farklılıkları tartışmak, çeviri bölümlerinin eğitim-öğretim izlenceleri üzerinden çeviri eğitiminde görülen olası eksikliklere ve yetersizliklere ilişkin çözüm önerileri geliştirmektir.
U radu se promatraju akuzativne dopune uz desetak neprijelaznih glagola u hrvatskome jeziku te se razmatra njihova pripadnost kategoriji unutrašnjih objekata. Uspoređuju se sintaktička i semantička svojstva takvih dopuna: broj imenica koje se pojavljuju uz neprijelazni glagol, obvezatnost modifikacije imenice, paralelnost instrumentalnih i akuzativnih sintagmā, mogućnost parafraze instrumentalnom sintagmom te mogućnost pronominalizacije i pasivizacije. Autorice zaključuju da sve dopune istraživanih neprijelaznih glagola ne pripadaju istomu tipu dopuna te ih je potrebno gramatički i terminološki razdvojiti. Također pretpostavljaju da unutrašnji objekti u hrvatskome mogu imati argumentno i adjunktno čitanje, što je u skladu s nekim nedavno iznesenim tvrdnjama za druge jezike.
Prefácio Este esboço gramatical teve origem nos trabalhos da Sociedade Internacional de Linguística (SIL) em Moçambique. O que se procura nesta modesta contribuição ao ambiente sociocultural é apresentar um modelo simples da descrição de aspectos gramaticais para encorajar o uso da língua local e facilitar ao público um melhor acesso a um aspecto da sua rica cultura. O esboço aqui apresentado é uma breve introdução à língua Ekoti que foi produzido durante um seminário linguístico em Julho 2004 no escritório do programa Ekoti em Angoche. Este pequeno estudo segue o padrão das “Notas Gramaticais sobre a Língua Emakhuwa”, o primeiro estudo na série “Monografias Linguísticas Moçambicanas, elaborado em 2003, imprimido em 2006. Queremos endereçar os nossos agradecimentos calorosos ao Governo Distrital do Distrito de Angoche, ao Conselho Municipal, e à Direcção Distrital da Educação e Cultura que facilitam um clima vantajoso para o desenvolvimento e a pesquisa da língua Ekoti. Também queríamos agradecer ao povo Koti que tem o orgulho de elogiar a sua própria língua e sabedoria cultural. Akhili maali 'Ideias são riqueza' (provérbio local) Os autores Angoche, Abril de 2007
Prefácio Estas notas gramaticais são o resultado dos trabalhos da Sociedade Internacional de Linguística (SIL), em Moçambique. O propósito da série Mongrafias Linguísticas Moçambicanas é de encorajar o uso da língua local, neste caso concreto, do Echuwabo através da descrição estruturada e facilitar ao público em geral um melhor acesso a mais um aspecto da rica cultura moçambicana. As notas sobre Ecuwabu foram produzidas durante o workshop “Descubra a Sua Língua”, conduzido no centro de treinamento da SIL, na cidade de Nampula, de 4 a 20 de Junho de 2006. Os participantes receberam formação na estrutura das línguas bantu em geral, depois investigaram suas línguas maternas. Esta brochura não serve como “a última palavra” sobre a língua Ecuwabu, mas serve para estimular mais interesse no uso e estudo da língua Ecuwabu, seja pelos falantes, seja por não falantes deste idioma. Importa salientar que a audiência que tinhamos na mente é o cidadão sem formação académica, aos estudiosos recomendamos a leitura dos livros e artigos linguísticos indicados no anexo bibliográfico. Queria agradecer o Sr. Romão Marçal, que teclou este documento no computador, e as nossas colegas, Sra. Susan Seiler e Sra. Marijane Beutler que fizeram o trabalho de formatação e impressão do presente livro. dr. Oliver Kröger Nampula, Junho de 2003
Prefácio (...) O Objectivo A finalidade deste livrinho é de publicar dados de uma língua minoritária para contribuir ao património cultural da nação moçambicana, de que Imarenje faz parte. O próximo passo será a implem-entação de mais correcções e modificações necessárias, seja nos detalhes ortográficos, seja na escolha de exemplos e frases. Neste sentido faço um apelo a todos que se interessam pelo desenvolvi-mento das línguas nacionais, em particular aos falantes de Imarenje: Façam comentários, contribuam para que futuras edições deste livrinho possam ser mais ricas! Oliver Kröger Editor da série Monografias Linguísticas Moçambicanas Nampula, Outubro de 2006
1 Introdução Os falantes da língua Xingoni são os descendentes do grupo etnolinguístico oriundo das migrações dos Nguni. No mfecane, causado pelas guerras do Shaka Zulu e Dingiswayo, numerosas populações foram movimentadas em vastas zonas geográficas de África Austral. Essas ondas demográficas chegaram até a província de Cabo Delgado. Xingoni é a variante de referência, falada nos distritos de Montepuez, Nangade, Meluco, Mueda, Muidumbe e Nangade. Existe a probabilidade da existência de mais falantes do Xingoni na província do Niassa, no distrito de Milepa e na província de Tete, concretamente no distrito de Angônia. Fora do território nacional, o Xingoni é também falado no Malawi e na Tanzânia. Também se ouve falar duma língua Xingoni na Zâmbia. Dado que a língua Xingoni pertence às línguas moçambicanas menos estudadas, achei oportuno convidar um grupo de falantes ao workshop “Descubra a sua língua” que teve lugar em Abril deste ano. Juntaram-se aos outros participantes e desenvolveram actividades que culminaram na produção desta versão experimental daquilo que mais tarde se possam tornar “Algumas Notas gramaticais sobre a língua Xingoni.” O modelo da descrição segue os mesmos princípios que norteavam as notas gramaticais das línguas Emakhuwa, Etakwane, Imarenje e Ekoti. Espero que essas notas possam servir de modelo e inspiração para elaborar mais descrições gramaticais nas línguas menos estudadas. Oliver Kröger Assessor linguístico da SIL Moçambique Nampula, dia 3 de Agosto de 2006
An den Studiengängen der Abteilung für Germanistik und Deutsch als Fremdsprache unserer Universitäten nimmt das Fach „Deutsche Grammatik“ einen wichtigen Platz ein. Zu beobachten ist dabei, dass die Studierenden der grammatischen Strukturen des Deutschen sowohl in morphosyntaktischer und funktioneller Hinsicht nicht auf erforderlichem Niveau beherrschen. Dabei soll besondere Kraft darauf verwendet werden, die morphosyntaktischern Kenntnisse in aktive Sprachfähigkeit umzusetzen. Ziel dieser Arbeit ist, Gedanken und Vorschläge zu entwickeln, wie der Unterricht hinsichtlich unserer Zielgruppe fruchtbar, besonders für die funktionelle Beherrschung der deutschen Grammatik gestaltet werden kann.
We present a CYK and an Earley-style algorithm for parsing Range Concatenation Grammar (RCG), using the deductive parsing framework. The characteristic property of the Earley parser is that we use a technique of range boundary constraint propagation to compute the yields of non-terminals as late as possible. Experiments show that, compared to previous approaches, the constraint propagation helps to considerably decrease the number of items in the chart.
We present an architecture for the integration of shallow and deep NLP components which is aimed at flexible combination of different language technologies for a range of practical current and future applications. In particular, we describe the integration of a high-level HPSG parsing system with different high-performance shallow components, ranging from named entity recognition to chunk parsing and shallow clause recognition. The NLP components enrich a representation of natural language text with layers of new XML meta-information using a single shared data structure, called the text chart. We describe details of the integration methods, and show how information extraction and language checking applications for realworld German text benefit from a deep grammatical analysis.
Most systematic discussion of dyad morphemes has focussed on Australian languages, owing to a combination of their relative prevalence there, and the development of a descriptive tradition that investigates them in some depth. In the course of researching this paper, however, I became aware of functionally and semantically similar morphemes in many other parts of the world, almost invariably described in isolation from any typological reference point. I have incorporated such data as far as I am aware of it, in the hope that a systematic study will encourage other investigators to identify, and investigate in detail, similar constructions in a range of languages. The current state of our research, however, as well as some interesting geographical skewings that I discuss below, such that outside Australia dyad constructions almost exclusively employ reciprocal morphology, means that most of this paper will focus on Australian languages.
U radu se analizira poglavlje Sprichwörter – Prirečja iz Kristijanovićeva Anhanga, aneksnog rječnika dodanog njegovoj Grammatik der kroatischen Mundart. Prirečja sadrže kajkavsku paremiološku građu s njemačkim ekvivalentima koja se analizira s obzirom na njezine izvore i leksikografsku obradbu. Pokazuje se da osim poslovica rječnik sadrži i frazeme i kolokvijalne izraze. Posebna se pozornost posvećuje semantičkoj analizi poslovica i naznačuje na koji se aspekt ljudskog života pouka i poruka odnose.
This paper proposes an annotating scheme that encodes honorifics (respectful words). Honorifics are used extensively in Japanese, reflecting the social relationship (e.g. social ranks and age) of the referents. This referential information is vital for resolving zero
pronouns and improving machine translation outputs. Annotating honorifics is a complex task that involves identifying a predicate with honorifics, assigning ranks to referents of the
predicate, calibrating the ranks, and connecting referents with their predicates.
This report explores the question of compatibility between annotation projects including translating annotation formalisms to each other or to common forms. Compatibility issues are crucial for systems that use the results of multiple annotation projects. We hope that this report will begin a concerted effort in the field to track the compatibility of annotation schemes for part of speech tagging, time annotation, treebanking, role labeling and other phenomena.
We investigate methods to improve the recall in coreference resolution by also trying to resolve those definite descriptions where no earlier mention of the referent shares the same lexical head (coreferent bridging). The problem, which is notably harder than identifying coreference relations among mentions which have the same lexical head, has been tackled with several rather different approaches, and we attempt to provide a meaningful classification along with a quantitative comparison. Based on the different merits of the methods, we discuss possibilities to improve them and show how they can be effectively combined.
Im Rahmen einer Projektarbeit zum Thema Argumentationstheorie im WS 2008/09 haben sich die teilnehmenden Studentinnen und Studenten der Universität zu Köln das Ziel gesetzt, ca. 600 Kommentare zur Frage „Do smoking bans mean a cultural shift for Paris and Berlin?“ des „Have your say“-Forums der BBC auf ihre Argumentationsmuster hin zu analysieren. Die Ausgangsfrage im BBC-Forum richtete sich also nach dem „cultural shift“, also der kulturellen Veränderung, die das Rauchverbot in Kneipen und Cafés für die beiden Metropolen bedeuten könnte. Sehr bald ergab unsere Analyse jedoch, dass dies nicht die Frage war, die innerhalb der Kommentare im Zentrum der Aufmerksamkeit stand: Stattdessen wurde in erster Linie darüber diskutiert, wie das Rauchverbot generell – und zwar nicht nur in den beiden genannten Städten – bewertet werden sollte. Gut zwei Drittel der Beiträge bezogen klar Stellung für oder gegen ein Rauchverbot in der Gastronomie. Für unsere Analyse der Argumentationsmuster haben wir zum einen die klassischen argumentationstheoretisch relevanten Faktoren berücksichtigt wie Fallacies und verdeckte Prämissen. Hinzu kamen dann zwei weitere Arten von Parametern: erstens Faktoren, die in argumentationstheoretischen Abhandlungen eher nur am Rande berücksichtigt werden wie z.B. Evidenztyp und Überzeugungskraft, und zweitens Informationen, die speziell mit der Art des Diskussionsforums bzw. dem Inhalt der Diskussion zu tun haben, wie etwa Selbstauskünfte über das eigene Raucherverhalten.
Die vorliegende Arbeit geht hervor aus dem Hauptseminar „Argumentationstheorie“, das im Wintersemester 2008/09 am Institut für Linguistik der Universität zu Köln unter der Leitung von PD Dr. Leila Behrens abgehalten wurde. Ziel dieses Seminars war es, ausgehend von traditionellen Begriffen der Rhetorik, Dialektik und Logik, in die Terminologie sowie in zentrale Modelle der zeitgenössischen Argumentationsforschung einzuführen. Die dabei erworbenen Kenntnisse sollen im Folgenden bei der Analyse von Beiträgen eines Diskussionsforums im Internet angewendet werden. Hierbei handelt es sich um ein sogenanntes „newsforum“ der BBC mit dem Titel „Have Your Say“ (BBC 2008), in dem aktuelle Themen und Nachrichten von Internetnutzern weltweit diskutiert werden können. Im untersuchten Fall behandeln wir die Frage, wie mit der Unabhängigkeitserklärung des Kosovo vom 17. Februar 2008 umzugehen sei: „Should the world recognise an independent Kosovo?“ […]. Zu dieser Fragestellung wurden insgesamt 3195 Beiträge im Forum veröffentlicht, von denen hier 780 ausgewertet werden. Diese folgen chronologisch aufeinander und umfassen den Zeitraum zwischen 7:49 Uhr (mittlere Greenwich-Zeit) und 14:26 Uhr des 17. Februar 2008.
Dieses Arbeitspapier geht aus einem Hauptseminar zur Argumentationstheorie hervor, das [von Leila Behrens] im Wintersemester 2008/09 am Institut für Linguistik der Universität zu Köln gehalten [wurde]. In den beiden Arbeiten in diesem Band (Badtke et al. und Benning et al.) stellen die Studierenden dieses Hauptseminars die Ergebnisse vor, die sie (in zwei parallelen Projektgruppen mit unterschiedlichen Diskussionsgegenständen) bei der empirischen Analyse von Argumentationen in einem Internet-Forum gewonnen haben. Der Gegenstand der Diskussion betraf bei der einen Gruppe (Badtke et al.) die Unabhängigkeit des Kosovo, bei der anderen Gruppe (Benning et al.) die Einführung eines generellen Rauchverbots in europäischen Hauptstädten.
Aspektsysteme
(1991)
„Die folgenden Papiere sind im Umfeld eines Hauptseminars "Aspekt und Tempus" entstanden, das im Wintersemester 1989/90 am Institut für Sprachwissenschaft der Universität zu Köln stattfand. In den folgenden Beiträgen werden nicht alle Aspekte des Aspekts gedeckt; im Vordergrund steht hauptsächlich die Frage der Interaktion von lexikalischer Semantik und Aspektmorphologie, so daß sich die Beschreibung der Aspektmorphologie auf aspektrelevante Fälle beschränkt und Nebenfunktionen (z.B. temporale), Konventionalisierungen, Neutralisierungen usw. weitgehend vernachlässigt werden. Kritik und Anregungen sind höchst willkommen.“ ---
Inhalt:
Aspekttheorie (Hans-Jürgen Sasse); Albanisch (Christina Leluda); Spanisch (Olga Chapado Chorro & Luisa Garcia Garcia); Japanisch (Antje Seidel & Helga Weyerts); Maa (Christa König); Modemes Chinesisch (Chor-Shing Li); Samoanisch (Mario Longino)
Die synchrone wie diachrone Untersuchung von vier Passivauxiliaren in der deutschen Standardsprache und in deutschen Dialekten, im Schwedischen und im Luxemburgischen liefert deutliche Evidenz dafür, dass Vollverben nicht direkt zu Passivauxiliaren grammatikalisieren, sondern dass dieser Pfad über die Inchoativkopula verläuft. Inchoativkopulas sind soweit grammatikalisiert (und damit reduziert), dass sie über den Weg einer Reanalyse zu Vorgangspassivauxiliaren mutieren können: Erst verbinden sie sich mit (prädikativen) Substantiven, dann mit Adjektiven und schließlich partizipialen Verben. Bereits im Kopulastadium haben sie sich (sofern vorhanden gewesen) ihres Dativ- und Akkusativobjekts entledigt (Intransitivierung). Das Subjekt ist nach seiner Entkoppelung mit dem Agens eine neue Koppelung mit dem Patiens eingegangen. Damit hat die einstige Handlungsperspektive eine Umkehr zur Geschehensperspektive erfahren. Diese Schritte dokumentiert die folgende Figur: .... Als weniger problematisch hat sich, bedingt durch die Ausgangssemantik, der Grammatikalisierungspfad bei nhd. werden, bair.lalem. kommen und schwed. bli erwiesen im Gegensatz zu lux. ginn 'geben', das in jeder Hinsicht die stärksten Reduktionen erfahren hat und einen besonders langen, verschlungenen und "steinigen" Weg absolviert hat. Mit Sicherheit kann geben nicht als Idealkandidat für Passivgrarnmatikalisierungen gelten. Nur so lässt sich erklären, weshalb diese Grarnmatikalisierung in anderen Sprachen der Welt bisher nicht beobachtet wurde.
Auto - bil, Reha - rehab, Mikro - mick, Alki - alkis : Kurzwörter im Deutschen und Schwedischen
(2001)
Das Kurzwort wird nach BELLMANN 1980 und KOBLER-TRILL 1994 definiert als eine sowohl graphisch als auch phonisch realisierte gekürzte Form, die aus einem längeren sog. Basislexem (einschließlich eines Wortgruppenlexems) hervorgeht (im Folgenden auch Vollform genannt). Dabei besteht zwischen Kurzwort und Basislexem, die weiterhin nebeneinander bestehen, eine Synonymie-Beziehung, d.h. beide referieren auf das gleiche Objekt (vgl. Limo und Limonade, Kripo und Kriminalpolizei).
Der Übersetzungsprozess der Technischen Dokumentation wird zunehmend mit Maschineller Übersetzung (MÜ) unterstützt. Wir blicken zunächst auf die Ausgangstexte und erstellen automatisch prüfbare Regeln, mit denen diese Texte so editiert werden können, dass sie optimale Ergebnisse in der MÜ liefern. Diese Regeln basieren auf Forschungsergebnissen zur Übersetzbarkeit, auf Forschungsergebnissen zu Translation Mismatches in der MÜ und auf Experimenten.
The retreat of BE as perfect auxiliary in the history of English is examined. Corpus data are presented showing that the initial advance of HAVE was most closely connected to a restriction against BE in past counterfactuals. Other factors which have been reported to favor the spread of HAVE are either dependent on the counterfactual effect, or significantly weaker in comparison. It is argued that the effect can be traced to the semantics of the BE perfect, which denoted resultativity rather than anteriority proper. Related data from other older Germanic and Romance languages are presented, and finally implications for existing theories of auxiliary selection stemming from the findings presented are discussed.
Son yıllarda Avrupa’daki toplumsal ve siyasal gelişmeler her alanda olduğu gibi eğitim alanında da köklü değişimleri beraberinde getirmiştir. Avrupa Birliğindeki bu gelişmeler, aynı zamanda birden çok yabancı dil öğrenme gereksiniminin artmasına da yol açmıştır. Böylece, yabancı dil öğretimi ve izlenecek yabancı dil politikası gittikçe önem kazanmaya başlamıştır. Bu bağlamda Avrupa Konseyi, yabancı dil öğretiminin daha etkin ve verimli olmasını sağlayacak yeni düzenlemeler yapmayı öncelikli görevleri arasına almıştır. Avrupa Birliği ülkelerinde dil ve kültür çeşitliliği korunması ve geliştirilmesi gereken bir zenginlik olarak değerlendirilmektedir. Bu düşünceye uygun olarak tüm Avrupa Birliği ülkelerinde “Avrupa Konseyi Yabancı Diller Eğitimi Ortak Kriterleri” çerçevesinde yabancı dil eğitim-öğretim izlencelerinin oluşturulmasına, ders araç-gereçleri geliştirilmesine, aynı zamanda bireylerin yabancı dil düzeylerinin saptanması ve belgelendirilmesinde ortak ölçütlerin belirlenmesine ve böylece bireylerde yaşam boyu yabancı dil öğrenme bilinci oluşturmaya çalışılmaktadır. Ne var ki, bu durum Avrupa Birliğine aday ülkeler arasında yer alan ülkemiz için geçerli değildir. Oysa, Avrupa Birliğine tam üyelik sürecinde değişen koşullarına uygun olarak yabancı dil eğitim politikamızın yeniden gözden geçirilmesi ve “Avrupa Konseyi Yabancı Diller Ortak Kriterleri”ne uygun izlencelerin geliştirilmesi kaçınılmaz görünmektedir. Bu bağlamda, ülkemizde yabancı dil olarak tek bir dilin egemenliğine dayalı yabancı dil öğretimi yerine, öğretim programlarında farklı dil seçeneklerine yer verilerek, her yaş grubuna ve toplumun her kesimine uygun programlarla yabancı dil öğretimi yaygınlaştırılmalı ve buna uygun yabancı dil politikaları geliştirilmelidir.
Maschinelles Lernen wird häufig zur effzienten Annotation großer Datenmengen eingesetzt. Die Forschung zu maschinellen Lernverfahren beschränkt sich i.a. darauf unterschiedliche Lernverfahren zu vergelichen oder die optimale größe der Trainingsdaten zu bestimmen. Bisher wurde jedoch nicht untersucht, in wie weit sich linguistisches Wissen bei der Aufgabendefinition positiv auswirken kann. Dies soll hier anhand des Lernens von Base-Nominalphrasen mit drei unterschiedlichen Definitionen untersucht werden. Die Definitionen unterscheiden sich im Grad der linguistisch motivierten Erweiterungen, die zu einer eher praktisch motivierten ersten Definition hinzu kamen. Die Untersuchungen ergaben, dass sich die Anzahl der falsch klasssifizierten Wörter um ein Drittel reduzieren lässt.
Prepositional phrase (PP) attachment is one of the major sources for errors in traditional statistical parsers. The reason for that lies in the type of information necessary for resolving structural ambiguities. For parsing, it is assumed that distributional information of parts-of-speech and phrases is sufficient for disambiguation. For PP attachment, in contrast, lexical information is needed. The problem of PP attachment has sparked much interest ever since Hindle and Rooth (1993) formulated the problem in a way that can be easily handled by machine learning approaches: In their approach, PP attachment is reduced to the decision between noun and verb attachment; and the relevant information is reduced to the two possible attachment sites (the noun and the verb) and the preposition of the PP. Brill and Resnik (1994) extended the feature set to the now standard 4-tupel also containing the noun inside the PP. Among many publications on the problem of PP attachment, Volk (2001; 2002) describes the only system for German. He uses a combination of supervised and unsupervised methods. The supervised method is based on the back-off model by Collins and Brooks (1995), the unsupervised part consists of heuristics such as ”If there is a support verb construction present, choose verb attachment”. Volk trains his back-off model on the Negra treebank (Skut et al., 1998) and extracts frequencies for the heuristics from the ”Computerzeitung”. The latter also serves as test data set. Consequently, it is difficult to compare Volk’s results to other results for German, including the results presented here, since not only he uses a combination of supervised and unsupervised learning, but he also performs domain adaptation. Most of the researchers working on PP attachment seem to be satisfied with a PP attachment system; we have found hardly any work on integrating the results of such approaches into actual parsers. The only exceptions are Mehl et al. (1998) and Foth and Menzel (2006), both working with German data. Mehl et al. report a slight improvement of PP attachment from 475 correct PPs out of 681 PPs for the original parser to 481 PPs. Foth and Menzel report an improvement of overall accuracy from 90.7% to 92.2%. Both integrate statistical attachment preferences into a parser. First, we will investigate whether dependency parsing, which generally uses lexical information, shows the same performance on PP attachment as an independent PP attachment classifier does. Then we will investigate an approach that allows the integration of PP attachment information into the output of a parser without having to modify the parser: The results of an independent PP attachment classifier are integrated into the parse of a dependency parser for German in a postprocessing step.
The work presented here addresses the question of how to determine whether a grammar formalism is powerful enough to describe natural languages. The expressive power of a formalism can be characterized in terms of i) the string languages it generates (weak generative capacity (WGC)) or ii) the tree languages it generates (strong generative capacity (SGC)). The notion of WGC is not enough to determine whether a formalism is adequate for natural languages. We argue that even SGC is problematic since the sets of trees a grammar formalism for natural languages should be able to generate is difficult to determine. The concrete syntactic structures assumed for natural languages depend very much on theoretical stipulations and empirical evidence for syntactic structures is rather hard to obtain. Therefore, for lexicalized formalisms, we propose to consider the ability to generate certain strings together with specific predicate argument dependencies as a criterion for adequacy for natural languages.
The early acquisition of Greek compounds by two monolingual Greek girls aged between 1;8 and 3;0 years is studied in a usage-based theoretical framework. Special importance is attached to the morphological structure of Greek compound types occurring in child speech and child-directed speech. Greek nominal compound formation does not consist in the mere juxtaposition of words or roots, but involves stems as well as a compound marker. Major questions addressed are the transparency of compounds and productive nominal compound formation. Evidence for productivity of nominal compound formation has been found with only one of the two girls. In contrast to other languages, neoclassical nominal compounds by far exceed endocentric subordinative ones tokenwise in Greek child speech and child-directed speech providing evidence of entrenchment rather than productivity.
In a cross-linguistic comparison it is shown that, in spite of the fact that both Standard Modern Greek and German are rich in nominal compounds, their number is much more limited in Greek than in German child speech. An explanation for this apparent paradox is provided by an onomasiological approach to lexical typology based on a sample list of nominal compounds occurring in German child language and their Greek translational equivalents. It has been found that while use of nominal compounds is common in colloquial German including child-centered situations, it is more typical of Greek formal than colloquial registers.
The two papers included in this volume have developed from work with the CHILDES tools and the Media Editor in the two research projects, "Second language acquisition of German by Russian learners", sponsored by the Max Planck Institute for Psycholinguistics, Nijmegen, from 1998 to 1999 (directed by Ursula Stephany, University of Cologne, and Wolfgang Klein, Max Planck Institute for Psycholinguistics, Nijmegen) and "The age factor in the acquisition of German as a second language", sponsored by the German Science Foundation (DFG), Bonn, since 2000 (directed by Ursula Stephany, University of Cologne, and Christine Dimroth, Max Planck Institute for Psycholinguistics, Nijmegen). The CHILDES Project has been developed and is being continuously improved at Carnegie Mellon University, Pittsburgh, under the supervision of Brian MacWhinney. Having used the CHILDES tools for more than ten years for transcribing and analyzing Greek child data there it was no question that I would also use them for research into the acquisition of German as a second language and analyze the big amount of spontaneous speech gathered from two Russian girls with the help of the CLAN programs. When in the spring of 1997, Steven Gillis from the University of Antwerp (in collaboration with Gert Durieux) developed a lexicon-based automatic coding system based on the CLAN program MOR and suitable for coding languages with richer morphologies than English, such as Modern Greek. Coding huge amounts of data then became much quicker and more comfortable so that I decided to adopt this system for German as well. The paper "Working with the CHILDES Tools" is based on two earlier manuscripts which have grown out of my research on Greek child language and the many CHILDES workshops taught in Germany, Greece, Portugal, and Brazil over the years. Its contents have now been adapted to the requirements of research into the acquisition of German as a second language and for use on Windows.
This paper compares two approaches to computational semantics, namely semantic unification in Lexicalized Tree Adjoining Grammars (LTAG) and Lexical Resource Semantics (LRS) in HPSG. There are striking similarities between the frameworks that make them comparable in many respects. We will exemplify the differences and similarities by looking at several phenomena. We will show, first of all, that many intuitions about the mechanisms of semantic computations can be implemented in similar ways in both frameworks. Secondly, we will identify some aspects in which the frameworks intrinsically differ due to more general differences between the approaches to formal grammar adopted by LTAG and HPSG.
Cet article étudie la relation entre les grammaires darbres adjoints à composantes multiples avec tuples darbres (TT-MCTAG), un formalisme utilisé en linguistique informatique, et les grammaires à concaténation dintervalles (RCG). Les RCGs sont connues pour décrire exactement la classe PTIME, il a en outre été démontré que les RCGs « simples » sont même équivalentes aux systèmes de réécriture hors-contextes linéaires (LCFRS), en dautres termes, elles sont légèrement sensibles au contexte. TT-MCTAG a été proposé pour modéliser les langages à ordre des mots libre. En général ces langages sont NP-complets. Dans cet article, nous définissons une contrainte additionnelle sur les dérivations autorisées par le formalisme TT-MCTAG. Nous montrons ensuite comment cette forme restreinte de TT-MCTAG peut être convertie en une RCG simple équivalente. Le résultat est intéressant pour des raisons théoriques (puisqu’il montre que la forme restreinte de TT-MCTAG est légèrement sensible au contexte), mais également pour des raisons pratiques (la transformation proposée ici a été utilisée pour implanter un analyseur pour TT-MCTAG).
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
The aim of this paper is the exploration of an optimality theoretic architecture for syntax that is guided by the concept of "correspondence": syntax is understood as the mechanism of "translating" underlying representations into a surface form. In minimalism, this surface form is called "Phonological Form" (PF). Both semantic and abstract syntactic information are reflected by the surface form. The empirical domain where this architecture is tested are minimal link effects, especially in the case of "wh"-movement. The OT constraints require the surface form to reflect the underlying semantic and syntactic representations as maximally as possible. The means by which underlying relations and properties are encoded are precedence, adjacency, surface morphology and prosodic structure. Information that is not encoded in one of these ways remains unexpressed, and gets lost unless it is recoverable via the context. Different kinds of information are often expressed by the same means. The resulting conflicts are resolved by the relative ranking of the relevant correspondence constraints.
In this paper we show an approach to the customization of GermaNet to the German HPSG grammar lexicon developed in the Verbmobil project. GermaNet has a broad coverage of the German base vocabulary and fine-grained semantic classification; while the HPSG grammar lexicon is comparatively small und has a coarse-grained semantic classification. In our approach, we have developed a mapping algorithm to relate the synsets in GermaNet with the semantic sorts in HPSG. The evaluation result shows that this approach is useful for the lexical extension of our deep grammar development to cope with real-world text understanding.
In terms of their functions and issues, the use of selection posters is possible in language teaching. Therefore, the present study aims to investigate the didactic potential of selection posters in German language teaching. Because of this reason, with this study, it is tried to show that the selection posters can be dealt with as materials in the courses in German Language teaching, which can be used parallel to the needs and interests. Accordingly, the alternative ways or approaches are tried to be made concrete throughout the courses. Consequently, the selection posters constitutes a wide range in German language teaching in terms of local culture, vocabulary knowledge, the processes of linguistic studies, visualization, authenticity, actuality, and spoken and written studies.
Das hethitische Phonem /xw/
(2014)
In the Hittite phonological system there was a labialized velar fricative /xw/ beside the plain velar fricative /x/ parallel to the opposition between the velar stops /kw/ and /k/. The frequent syllable /xwa/ was spelled either hu-(u) or hu-wa. Evidence from the frequency of words with initial hu in the lexicon, from spelling variations and from ablaut alternations is presented to demonstrate the existence of /xw/. It is suggested that Hittite /xw/ regularly corresponds to the reflexes of *w in the non-Anatolian Indo-European languages.
Distributional approximations to lexical semantics are very useful not only in helping the creation of lexical semantic resources (Kilgariff et al., 2004; Snow et al., 2006), but also when directly applied in tasks that can benefit from large-coverage semantic knowledge such as coreference resolution (Poesio et al., 1998; Gasperin and Vieira, 2004; Versley, 2007), word sense disambiguation (Mc- Carthy et al., 2004) or semantical role labeling (Gordon and Swanson, 2007). We present a model that is built from Webbased corpora using both shallow patterns for grammatical and semantic relations and a window-based approach, using singular value decomposition to decorrelate the feature space which is otherwise too heavily influenced by the skewed topic distribution of Web corpora.
Eins der signifikanten Probleme in der maschinellen Übersetzung japanische in deutsche Sprache ist die fehlende Information und Definitheit im japanischen Analyse-Output. Eine effiziente Lösung dieses Problems ist es, die Suche nach der relevanten Information in den Transfer zu integrieren. Transferregeln werden mit Präferenzregeln und Default-Regeln kombiniert. Dadurch wird Information über lexikalische Restriktionen der Zielsprache, über die Domäne und über den Diskurs zugänglich.
Das Problem des Transfers in der maschinellen Übersetzung von Japanisch nach Englisch ist fehlende Information über Numerus und Definitheit im Japanischen, die für die Wahl der englischen Artikel und die Nomenmarkierung gebraucht wird. Obwohl dieses Problem signifikant ist, beschäftigt sich die Forschungsliteratur kaum damit. [...] Wir bsaieren unsere Untersuchungen auf experimentell erhobenen Daten aus einem Experiment über deutsch-japanische gedolmetschte Terminaushandlungsdialoge [...]. Auf diese Weise können Phänomene bestimmt werden, die für die Domäne von VERBMOBIL relevant sind. Wir sehen unser Vorgehen in Übereinstimmung mit dem 'Sublanguage'-Ansatz [...].
The argument that I tried to elaborate on in this paper is that the conceptual problem behind the traditional competence/performance distinction does not go away, even if we abandon its original Chomskyan formulation. It returns as the question about the relation between the model of the grammar and the results of empirical investigations – the question of empirical verification The theoretical concept of markedness is argued to be an ideal correlate of gradience. Optimality Theory, being based on markedness, is a promising framework for the task of bridging the gap between model and empirical world. However, this task not only requires a model of grammar, but also a theory of the methods that are chosen in empirical investigations and how their results are interpreted, and a theory of how to derive predictions for these particular empirical investigations from the model. Stochastic Optimality Theory is one possible formulation of a proposal that derives empirical predictions from an OT model. However, I hope to have shown that it is not enough to take frequency distributions and relative acceptabilities at face value, and simply construe some Stochastic OT model that fits the facts. These facts first of all need to be interpreted, and those factors that the grammar has to account for must be sorted out from those about which grammar should have nothing to say. This task, to my mind, is more complicated than the picture that a simplistic application of (not only) Stochastic OT might draw.
U radu se analizira uloga deiktičkih obilježivača (markera) u generičkom strukturiranju diskursa. Najprije se podsjeća da u postojećim tipologijama žanrova diskursa prisutnost deiktičkih obilježivača i drugih tragova subjektivnosti predstavlja važan kriterij za razgraničenje žanrova koji koegzistiraju u određenom društveno-povijesnom okviru unutar određenog tipa diskursa i za deskripciju uvjeta njihove diversifikacije. Zatim se, na primjeru diskursa medijske informacije na čije generičko strukturiranje utječu različite strategije objektivizacije, nastoji pokazati da primjena tog kriterija dobiva svoj puni smisao tek u kombinaciji s kriterijima koji se odnose na tekstualna i situacijska obilježja relevantna za generičko strukturiranje diskursa, a to su, s jedne strane, komunikacijski ciljevi sudionika u interakciji i specifične diskurzivne aktivnosti koje oblikuju relacijski profil tekstualnih struktura i, s druge strane, složenost interakcijskog okvira i stupanj heterogenosti deiktičkih i polifonijskih struktura.
Deklinacija brojeva dva, oba, tri i četiri u kajkavskim pravnim tekstovima od 16. do 18. Stoljeća
(2007)
Autori se u članku bave deklinacijom brojeva dva, oba, tri i četiri u kajkavskim tekstovima pravne regulative od 16. do 18. stoljeća. Kao korpus za jezičnu analizu uzimaju 23 teksta iz 16. st., 40 tekstova iz 17. st. i 19 tekstova iz 18. st. U jezičnoj se analizi posebna pažnja posvećuje usporedbi između oblika dvojine i množine u deklinaciji brojeva dva i oba, kao i razvoju množinskih oblika u deklinaciji brojeva tri i četiri. Autori navode sve zabilježene oblike brojeva dva, oba, tri i četiri, uspoređuju njihovu pojavnost u različitom vremenskom presjeku i na temelju rezultata jezične analize nude deklinacijski tip navedenih brojeva. Deklinacija brojeva u kosim padežima promatra se s obzirom na to jesu li navedeni brojevi dijelom prijedložnih ili neprijedložnih izraza, a posebno je pitanje učestalosti indeklinabilnih oblika.
In seinen Schriften zur Typologie des Relativsatzes behandelt Lehmann auch das Baskische […] Die Diskussion um den baskischen Relativsatz geht jedoch schon auf De Rijk (1972) zurück und wird von Oyharqabal (1985) fortgesetzt. In diesen Werken geht es um allgemeine Themen der Typologie des Relativsatzes (vor allem um das Problem der Zugänglichkeit), wobei allerdings wichtige Fragen unberücksichtigt bleiben: Warum gibt es im Baskischen mehrere unterschiedliche Relativsatzkonstruktionen? Worin unterscheiden sie sich? Wie lassen sie sich voneinander und gegen andere Verfahren der Nominalisierung abgrenzen, mit anderen Worten: welche Konstruktion gehört noch zu den Relativsatzbildungen, welche nicht mehr? Ich will hier die verschiedenen Verfahren der Relativsatzbildung (Relativierung) vorstellen und versuchen, mit Hilfe von Lehmanns (1984) Kontinuum der Nominalisierung Ordnung in die Phänomene , zu bringen, um schließlich Erklärungsansätze zu finden.
Die Familiennamen sind als einziger Bereich der europäischen Sprachen in ihrer ausgeprägten räumlichen Vielfalt noch höchst unzureichend erfasst. Noch sind die geschichtlich gewachsenen Namenlandschaften in erstaunlicher Stabilität erhalten. Sie werden im Bereich der Bundesrepublik Deutschland durch den seit 2005 in Kooperation der Universitäten Freiburg und Mainz in Angriff genommenen und durch die DFG geförderten 'Deutschen Familiennamenatlas' (OFA) auf der Basis von Telefonanschlüssen (Stand 2005) dokumentiert. Im vorliegenden Beitrag werden Vorarbeiten, Ziele, Gesamtanlage des Projekts, Systematik und Repräsentativität der Themenauswahl in den beiden Hauptteilen (grammatischer und lexikalischer Teil) sowie Kriterien und Methoden der inhaltlichen Konzipierung und formalen Gestaltung der Karten und Kommentare vorgestellt und begründet. Aus den genannten Vorarbeiten werden auch schon Perspektiven künftiger Auswertung der in den Datenbanken archivierten Materialien und der im Atlas exemplarisch dokumentierten Strukturen der Namenlandschaften ersichtlich.
Mit der Möglichkeit, anhand digitaler Telefonanschlüsse Familiennamen nach Bestand, Trägerzahl und räumlicher Verbreitung mit großer Genauigkeit zu erfassen, hat eine neue Epoche der Anthroponomastik begonnen. Der Schatz von 850661 verschiedenen Familiennamen, die im Jahre 2005 in 28205713 privaten Festnetzanschlüssen registriert waren, ist immens, und die Fragestellungen zu seiner Erforschung sind in ihrer Ausrichtung und in ihrer Anzahl unerschöpflich. In dieser Situation ergaben sich vordringlich zwei Aufgaben: Erstens musste angesichts der von Jahr zu Jahr wachsenden Bevölkerungsmobilität, angesichts der Auswirkung neuerer Namengesetzgebung und angesichts der schnell zunehmenden Ablösung lokalisierter Festnetzanschlüsse durch Mobiltelefone der Namenbestand spätestens jetzt aufgrund der zuverlässigsten Quelle und in legitim nutzbarer Weise gesichert und archiviert werden. Die geschichtlich gewachsenen Namenlandschaften sind gerade noch, und zwar in erstaunlicher Stabilität, erhalten. Die Daten wurden nach Klärung der Datenschutzfragen von der Deutschen Telekom auf Stand Juni 2005 dem Deutschen Familiennamenatlas zur Verfügung gestellt und ihre Nutzung zur namenkundlichen Forschung mit Vertrag vom 28.06.2005 geregelt.
Fußball ist ohne Zweifel das weltweit populärste Mannschaftsspiel. Nicht zu Unrecht wird es daher seit Jahrzehnten als „König“ metaphorisiert. Nach allem, was heute bekannt ist, wurde eine Urform in China schon vor 5000 Jahren gespielt. In Europa soll seit dem 12. Jahrhundert vor allem im nördlichen Frankreich und in England ein fußballähnliches Spiel betrieben worden sein, und in Florenz und anderen norditalienischen Städten war seit dem 15. Jahrhundert das noch recht urwüchsige calcio sehr beliebt, bei dem je 27 Spieler darum kämpften, den Ball mit Faust oder Fuß über die Begrenzung der gegnerischen Schmalseite des Spielfeldes zu schlagen und so ein „Mal“ zu erzielen.
Der irokesische Sprachtyp
(1988)
Im ersten Teil wird zunächst die wenige Forschungsliteratur zum Thema Deskriptivität selbst und eng verwandten Themen vorgestellt und besprochen. Daraus soll sich im Anschluss auch eine Definition des Begriffes ergeben, die weit genug gefasst ist, um die übliche Verwendungsweise des Begriffs bei Autoren, die ihn zwar benutzen, aber nicht theoretisch behandeln, zu erfassen, die sich aber andererseits dennoch in klar definierten und nachvollziehbaren Grenzen bewegt. Dabei soll weiterhin deutlich werden, dass es sich bei Deskriptivität um ein prinzipiell in allen Sprachen anzutreffendes Phänomen handelt, dass sich aber die Frequenz deskriptiver Ausdrücke von Sprache zu Sprache stark unterscheiden kann. Dabei werde ich Daten aus ausgewählten Sprachen einbeziehen und eine quantitative Analyse des Ausmaßes, mit dem verschiedene Sprachen von deskriptiven Bildungen Gebrauch machen vorstellen. Der zweite Hauptteil der Arbeit beschäftigt sich mit folgender Frage: Wenn jede Sprache zu einem gewissen Grad von deskriptiven Benennungen Gebrauch macht, welche Mechanismen des Sprachwandels gibt es, die die Position einer Sprache auf dieser Skala in die eine oder die andere Richtung verändern können?
Die zielsprachliche Verwendung des Artikels als grammatikalisiertem Mittel der NP-Determination im Deutschen stellt im Zweitspracherwerb besonders für Deutschlernende mit einer artikellosen Muttersprache eine große Schwierigkeit dar. Die vorliegende Arbeit untersucht die NP-Determination auf der Basis eines Spontansprachkorpus, welches Erwerbsdaten einer achtjährigen russischen Deutschlernenden in einer frühen und einer späten Erwerbsphase liefert. Das Ziel der Untersuchung ist, Erkenntnisse über Entwicklungsverlauf, Transferphänomene und insbesondere referenzsemantische und phonologische Determinanten der Artikelwahl zu gewinnen.
Deutsch im Kreis Schanfigg
(2012)
In dieser Arbeit wird unter Schanfigg nach Kessler "Schanfigg im weitern Sinne" verstanden, d.h. die Dörfer des politischen Kreises Schanfigg [...]. Da Dialekte im Gegensatz zu Hochsprachen nicht-normierte Sprachvarietäten darstellen, zeichnen sich die Ortsgrammatiken durch eine jeweils enorme Formenvielfalt in lautlicher und in morphologischer Hinsicht aus. Dies war denn auch eines der Ziele der Untersuchung: Mit Hilfe der Prager Phonologie und der auf ihr beruhenden Morphologie sollte aufgezeigt werden, wie groß die allophonische und allomorphische Bandbreite ist, derer sich die Sprecher im Gespräch unbewußt bedienen. Sehr schön läßt sich dies anhand der Verbalmorphologie bei den unregelmäßigen Verben (Kurzverben) aufzeigen. Ein weiteres Ziel der Untersuchung war es, die Stellung der Ortsdialekte des Schanfiggs und ihres Gesamts, also das Schanfigger Diasystem, innerhalb der dem Schanfigg benachbarten Mundarten darzustellen. Idealerweise hätten das Prättigau, das Churwaldner Tal und die Churer bzw. Churerrheintaler Mundarten herangezogen werden müssen. Da aber leider keine Untersuchungen zu den Verhältnissen im Prättigau und im Churwaldner Tal vorhanden sind, wurden die Schanfigger Verhältnisse mit denjenigen der Stadt Chur (vgl. Eckhardt 1991) und des Deutschen im Bezirk Imboden (vgl. Toth und Ebneter 1996) verglichen.
In der deutschen Gegenwartssprache sind die Funktionsverbgefüge (FVG) die über lange Zeit vor allem nur unter stilistischen Gesichtpunkten betrachtet und meist als schlechter Stil abgewertet wurden, mit dem Aufsatz Peter von Polenz (1963) in zunehmendem Maße in das Blickfeld der linguistischen Untersuchungen getreten. In den folgenden Jahren erschienen mehrere Arbeiten zu den FVG, in denen vor allem ihre semantischen, syntaktischen und kommunikativen Leistungen untersucht worden. Die als FVG in der Fachliteratur erfassten Konstruktionen bestehen bekanntlich aus einem Funktionsverb(FV) und einem deverbativen Substantiv, auch manchmal nomen actionis genannt. Funktionsverb und Verbalsubstantiv bilden zusammen sowohl strukturell als auch semantisch eine lexikalische Einheit, z. B. Kritik üben; in Verbindung treten. Kennzeichnend für diese Einheiten ist, dass die eigentliche Bedeutung der FVG im Substantiv liegt, während das Verb der ganzen Einheit nur eine grammatisch-syntaktische Funktion ausübt. Auch im Türkischen sind derartige aus Verben und Verbalsubstantiven bestehende Fügungen vorhanden. Sie stimmen im Hinblick auf ihre Konstruktionen mit den FVG im Deutschen überein […]. Die vorliegende Arbeit verfolgt das Ziel, die Fragen zu erörtern, wie die FVG und VF gebildet werden und welche syntaktischen Konstruktionen dieser FVG und VF ermöglicht werden. Das Hauptaugenmerk gilt den semantischen und syntaktischen Funktionen dieser sprachlichen Phänomene. Dabei geht es weniger darum, die Formen und Funktionen der FVG und VF bis ins kleinste Detail darzustellen. Hier werden vielmehr ihre Formen und Funktionen behandelt, die für eine kontrastive Betrachtung interessant. Die Arbeit hat vor allem theoretischen Charakter und sie ist nicht an einem Korpus orientiert. Die Beschreibung basiert auf der eigene Sprachkompetenz.
Deutschsprachige und bilinguale Studiengänge : eine Chance für Deutsch als Fremdsprache in Russland
(2008)
Der Bericht der Ständigen Arbeitsgruppe Deutsch als Fremdsprache (2006) für das Jahr 2005 zeigt, dass Russland, trotz eines Rückgangs der Lernerzahlen, immer noch das Land mit den meisten Deutschlernern (mehr als 3,3 Millionen) und mit dem größten Deutschlernangebot an den Schulen und den Universitäten (ca. 1000 Hochschulen) ist. Bei einer Umfrage unter 1025 Personen in den Städten Jakutsk, Kaliningrad, Moskau, Saratov und St. Petersburg waren 100 % der Befragten der Meinung, dass Englisch für die beruflichen Aussichten die wichtigste Sprache sei, aber 89 % schätzten die Kenntnis des Deutschen für ebenso wichtig ein und 95 % waren sogar der Meinung, dass durch ein sehr gutes Erlernen der deutschen Sprache im bilingualen Unterricht an Schulen sich die Berufschancen der Lerner erheblich verbessern (vgl. Baur 2005).
Developing linguistic resources, in particular grammars, is known to be a complex task in itself, because of (amongst others) redundancy and consistency issues. Furthermore some languages can reveal themselves hard to describe because of specific characteristics, e.g. the free word order in German. In this context, we present (i) a framework allowing to describe tree-based grammars, and (ii) an actual fragment of a core multicomponent tree-adjoining grammar with tree tuples (TT-MCTAG) for German developed using this framework. This framework combines a metagrammar compiler and a parser based on range concatenation grammar (RCG) to respectively check the consistency and the correction of the grammar. The German grammar being developed within this framework already deals with a wide range of scrambling and extraction phenomena.
Dialogue acts in Verbmobil 2
(1998)
This report describes the dialogue phases and the second edition dialogue acts which are used in the VERBMOBIL 2 project [...]. While in the first project phase the scenario was restricted to appointment scheduling dialogues, it has been extended to travel planning in the second phase with appointment scheduling being only a part of the new scenario.
In unserem Beitrag möchten wir die Besonderheiten des systemhaften Aufbaus der funktional-semantischen Kategorien der Modalität und Aspektualität zeigen, und zwar anhand der Konstruktion können + Infinitiv im Deutschen und deren Äquivalente im Englischen. Unser Hauptanliegen ist es, die modalen Konstruktionen zu untersuchen, Unterschiede und Ähnlichkeiten in den beiden germanischen Sprachen zu systematisieren und Sprachmittel verschiedener Ebenen zu diskutieren, um festzustellen, wie diese Mittel bei der Formierung des Plans der Begrenztheit und Unbegrenztheit der Handlung und deren aktionalen Schattierungen funktionieren.
„Football“, „soccer“ in British terms, is the most famous sport of the world. The history of the football goes back to the ancient times. In this article, the football terms used in Germany and Turkey are handled together with the historical development of football. Various differences and similarities between these terms and their features are also demonstrated.
Die Domäne in VERBMOBIL sind Terminaushandlungsdialoge. Für die Syntax bedeutet das zunächst, daß die Sytnax sich an gesprochener Sprache orientieren muß. Das beinhaltet Nullanaphern, Phrasen, die auf die Kommunikationssituation bezogen sind und Phrasen, die für geschriebene Sprache als nicht wohlgeformt bezeichnet werden. Weitergehend gibt es einige domänenspezifische syntaktische besonderheiten, wie zum Biepsiel die Realisierung von Zeitangaben.
Wenn man eine Schweizer Bäckerei besucht, erwirbt man nicht nur Spezialitäten kulinarischer, sondern auch sprachlicher Art. Auf der Papiertüte, die man dort bekommt, befindet sich eine Aufforderung, die zwei typisch schweizerdeutsche Erscheinungen enthält: "Chum doch cho schnuppere!" steht auf der Verpackung unten rechts. Wörtlich übersetzt: "Komm doch kommen schnuppern!". Zum einen taucht hier das Verb choo ,kommen' doppelt auf, einmal im Imperativ (chum) und einmal in einem kurzen Infinitiv (cho) vor dem Vollverb schnuppere. Zum anderen gehört choo einer besonderen Verbgruppe an, den sog. Kurzverben. Diese Kurzverben kennt das Nhd. nicht (mehr), wohl aber die geographisch und sprachlich entfernteren nordgermanischen Sprachen. In der folgenden Liste der Kurzverben werden zum Vergleich die entsprechenden schwedischen Kurzverben danebengesetzt, ohne daß hier ausführlicher auf sie eingegangen werden kann.
Der Wortschatz der germanischen Sprachen ist des öfteren verdächtigt worden, weitgehend nicht auf indogermanische Wurzeln rückführbar zu sein, wobei dieser Anteil so groß sei, daß er dazu berechtige, in ihm das Relikt eines voridg. Substrates zu sehen. Seit FEIST (1913:32) kursieren Listen germanischer Wörter nichtindogermanischer Herkunft, die – was entscheidend für das Postulat einer vorgermanischen, nichtindogermanischen Bevölkerung in den späteren germanischen Stammesgebieten an Nord- und Ostsee ist – bestimmten Sachbereichen angehören, von denen die Bereiche Schiffahrt, Fischfang, See – Meer – Küste, Tier- und Pflanzenbezeichnungen, Steingewinnung und Steinverarbeitung, Hausbautermini u.a. besonders oft genannt werden. [...] Eine solche Liste soll nun auch hier nicht untersucht werden, wohl aber soll der alt- und mittelhochdeutsche Wortschatz eines bestimmten Sachbereichs daraufhin überprüft werden, inwieweit ererbtes und entlehntes Wortgut in ihm feststellbar ist. Ferner soll bei den im Germanischen erfolgten Wortbildungen eine Rekonstruktion einer ursprünglichen – etymologischen – Bedeutung versucht und – wenn möglich – in eine Systematik gebracht werden. Das in diesem Glossar vorgelegte Verzeichnis der ahd. und mhd. Synonyme für das "Wasserfahrzeug" erhebt keinen Anspruch auf Vollständigkeit, vor allem da entsprechende Nachschlagewerke bzw. vollständige Synonymenlexika fehlen; es sind also nur die Schiffsbezeichnungen enthalten, auf die ich im Laufe der Untersuchung stieß.
Surrounding globalism , due to digital connections, is felt in all the fields of our life. Globalism causes changes in local conditions. However, there are also local realities and peope live with local conditions. As a result of this, according to R. Robertsson emerge “globalocalisation”. How is a language influenced from this “globalocalisation” process? This study trys to research with samples the changes in language as a consequence of globalocal interactions.
Sieht man neuere Grammatiken des Deutschen daraufhin durch, wie die Masse der Verben bezüglich ihres semantischen Gehalts klassifiziert wird, stellt sich bald heraus, daß hier kein Konsens besteht. Die DUDEN-Grammatik beispielsweise unterscheidet Bedeutungsgruppen: Tätigkeitsverben (mit der Untergruppe Handlungsverben), Vorgangsverben und Zustandsverben, BRINKMANN fügt diesen drei Klassen die Geschehensverben und die Witterungsverben hinzu; RENICKE gliedert die Verben in 2 Klassen Punktuelle Verben und Ausdehnungsverben. FLÄMIG schlägt semantische Subklassifizierungen unter drei verschiedenen Gesichtspunkten vor: hinsichtlich des Anteils der Verben "an der komplexen Geschehens-/Seinsbezeichnung", hinsichtlich "der Verlaufsweise eines Geschehens" und hinsichtlich "der Charakteristik eines Geschehens/Seins in bezug auf entsprechende Sachverhalte", die letztere Klassifikation unterscheidet Handlungsverben, Tätigkeitsverben, Vorgangsverben, Ereignisverben und Zustandsverben. [...] Eine semantische Analyse der Fortbewegungsverben des Althochdeutschen liegt meines wissens nicht vor, stellt also eine reizvolle Aufgabe dar, zu deren Lösung hier erste Schritte unternommen werden sollen.
Dijalekti u Gorskom kotaru
(2010)
U Gorskome kotaru govori se svim našim narječjima, kajkavskim, štokavskim i čakavskim, ali rijetki su dijalektolozi koji ih istražuju. U radu se iznosi pregled osnovnih fonoloških i morfoloških karakteristika zabilježenih u dosadašnjim istraživanjima na tom području. Uz zabilježene potvrde promatranih osobina, radu je priložen fonološki zapis jednoga goranskoga idioma.
Using a qualitative analysis of disagreements from a referentially annotated newspaper corpus, we show that, in coreference annotation, vague referents are prone to greater disagreement. We show how potentially problematic cases can be dealt with in a way that is practical even for larger-scale annotation, considering a real-world example from newspaper text.
Govorni se činovi najlakše prepoznaju i razgraničuju u dijalogu pa su dramski tekstovi vrlo pogodni za analizu i propitivanje teorije govornih činova. Krležinoj drami U agoniji možemo pristupiti kao korpusu za oprimjerenje konstativnoga i performativnoga shvaćanja jezika. U toj se drami sukob doista gradi na oprečnome shvaćanju jezika, a to se i verbalno eksplicira, pa se drama odvija na svojevrsnoj metajezičnoj razini gdje se glavni karakteri “svađaju” zato što govore različitim jezicima. Govorni činovi u drami, posebice komplimenti, analizirani su i s aspekta feminističke lingvistike.
We present a broad coverage Japanese grammar written in the HPSG formalism with MRS semantics. The grammar is created for use in real world applications, such that robustness and performance issues play an important role. It is connected to a POS tagging and word segmentation tool. This grammar is being developed in a multilingual context, requiring MRS structures that are easily comparable across languages.
This article attempts a brief introduction on the topic of cognitive sciences. By emphasizing cognitive linguistics, which separates in two positions will be part of the cognitive Sciences expressed with their linguistic function and is the heart matter, stands for a criticism about their lack of diagnostics. These positions of cognitive linguistics, whose paper are the neuro-linguistics and the cognitive linguistics, are presented in detail and both cognitively linguistic point of views are questioned for their scientific validity. Cognitive Linguistics is a field of cognitive science understood. Cognitive science tries with their research on Imitate human brain, which has arisen from this area, and also Artificial Intelligent researches in which the brain researchers with their colleagues from the field of computer technology try to develop artificialintelligence as an objective. The contribution of the linguistic component directs the Cognitive Linguistics in their research.