Linguistik
Refine
Year of publication
- 2007 (60) (remove)
Document Type
- Article (42)
- Preprint (7)
- Working Paper (5)
- Part of a Book (3)
- Conference Proceeding (2)
- Report (1)
Has Fulltext
- yes (60)
Is part of the Bibliography
- no (60)
Keywords
- Kroatisch (35)
- Rezensionen (17)
- Kajkavisch (5)
- Familienname (3)
- Lexikographie (3)
- Personennamenkunde (3)
- Geschlechterforschung (2)
- Numerale (2)
- Phraseologie (2)
- Präposition (2)
Institute
- Extern (60) (remove)
U radu se daje pregled problema povezanih s normativnim statusom čestičnih/vezničkih skupina da li, je li i čestice/veznika li. Pokazuje se da postoji nekoliko pogrješaka povezanih s tumačenjem normativnog statusa i raspodjele tih skupina i te čestice te se provjerava normativno pravilo prema kojemu skupinu da li treba u standardnome jeziku zamijeniti česticom li (o tome se posve pogrješno često piše kao o zamjeni da li s je li, a skupina je li, s iznimkom skupine je li da koja ima funkciju dopunskoga pitanja, u standardnome jeziku ne postoji kao čestična/veznička skupina jer je njezin prvi član uvijek 3. lice prezenta glagola biti). Određuje se normativni status skupine je li, tj. pokazuje se da je ona u hrvatskome jeziku ili zastarjela ili da pripada razgovornomu stilu. Također se provjeravaju pravila u skladu s kojima se normativni status skupine da li u izravnome pitanju razlikuje od njezina statusa u neizravnome pitanju i prema kojima se skupina da li i u standardnome jeziku pojavljuje pri izricanju potvrdnosti te u alternativnim pitanjima. Donose se uvjeti zamjenjivosti skupina da li česticom/veznikom li, tj. izdvajaju se sintaktički konteksti u kojima ta zamjena nije potrebna ili nije moguća.
Multicomponent Tree Adjoining Grammars (MCTAG) is a formalism that has been shown to be useful for many natural language applications. The definition of MCTAG however is problematic since it refers to the process of the derivation itself: a simultaneity constraint must be respected concerning the way the members of the elementary tree sets are added. This way of characterizing MCTAG does not allow to abstract away from the concrete order of derivation. In this paper, we propose an alternative definition of MCTAG that characterizes the trees in the tree language of an MCTAG via the properties of the derivation trees (in the underlying TAG) the MCTAG licences. This definition gives a better understanding of the formalism, it allows a more systematic comparison of different types of MCTAG, and, furthermore, it can be exploited for parsing.
We investigate methods to improve the recall in coreference resolution by also trying to resolve those definite descriptions where no earlier mention of the referent shares the same lexical head (coreferent bridging). The problem, which is notably harder than identifying coreference relations among mentions which have the same lexical head, has been tackled with several rather different approaches, and we attempt to provide a meaningful classification along with a quantitative comparison. Based on the different merits of the methods, we discuss possibilities to improve them and show how they can be effectively combined.
Prepositional phrase (PP) attachment is one of the major sources for errors in traditional statistical parsers. The reason for that lies in the type of information necessary for resolving structural ambiguities. For parsing, it is assumed that distributional information of parts-of-speech and phrases is sufficient for disambiguation. For PP attachment, in contrast, lexical information is needed. The problem of PP attachment has sparked much interest ever since Hindle and Rooth (1993) formulated the problem in a way that can be easily handled by machine learning approaches: In their approach, PP attachment is reduced to the decision between noun and verb attachment; and the relevant information is reduced to the two possible attachment sites (the noun and the verb) and the preposition of the PP. Brill and Resnik (1994) extended the feature set to the now standard 4-tupel also containing the noun inside the PP. Among many publications on the problem of PP attachment, Volk (2001; 2002) describes the only system for German. He uses a combination of supervised and unsupervised methods. The supervised method is based on the back-off model by Collins and Brooks (1995), the unsupervised part consists of heuristics such as ”If there is a support verb construction present, choose verb attachment”. Volk trains his back-off model on the Negra treebank (Skut et al., 1998) and extracts frequencies for the heuristics from the ”Computerzeitung”. The latter also serves as test data set. Consequently, it is difficult to compare Volk’s results to other results for German, including the results presented here, since not only he uses a combination of supervised and unsupervised learning, but he also performs domain adaptation. Most of the researchers working on PP attachment seem to be satisfied with a PP attachment system; we have found hardly any work on integrating the results of such approaches into actual parsers. The only exceptions are Mehl et al. (1998) and Foth and Menzel (2006), both working with German data. Mehl et al. report a slight improvement of PP attachment from 475 correct PPs out of 681 PPs for the original parser to 481 PPs. Foth and Menzel report an improvement of overall accuracy from 90.7% to 92.2%. Both integrate statistical attachment preferences into a parser. First, we will investigate whether dependency parsing, which generally uses lexical information, shows the same performance on PP attachment as an independent PP attachment classifier does. Then we will investigate an approach that allows the integration of PP attachment information into the output of a parser without having to modify the parser: The results of an independent PP attachment classifier are integrated into the parse of a dependency parser for German in a postprocessing step.
Deklinacija brojeva dva, oba, tri i četiri u kajkavskim pravnim tekstovima od 16. do 18. Stoljeća
(2007)
Autori se u članku bave deklinacijom brojeva dva, oba, tri i četiri u kajkavskim tekstovima pravne regulative od 16. do 18. stoljeća. Kao korpus za jezičnu analizu uzimaju 23 teksta iz 16. st., 40 tekstova iz 17. st. i 19 tekstova iz 18. st. U jezičnoj se analizi posebna pažnja posvećuje usporedbi između oblika dvojine i množine u deklinaciji brojeva dva i oba, kao i razvoju množinskih oblika u deklinaciji brojeva tri i četiri. Autori navode sve zabilježene oblike brojeva dva, oba, tri i četiri, uspoređuju njihovu pojavnost u različitom vremenskom presjeku i na temelju rezultata jezične analize nude deklinacijski tip navedenih brojeva. Deklinacija brojeva u kosim padežima promatra se s obzirom na to jesu li navedeni brojevi dijelom prijedložnih ili neprijedložnih izraza, a posebno je pitanje učestalosti indeklinabilnih oblika.
Die Familiennamen sind als einziger Bereich der europäischen Sprachen in ihrer ausgeprägten räumlichen Vielfalt noch höchst unzureichend erfasst. Noch sind die geschichtlich gewachsenen Namenlandschaften in erstaunlicher Stabilität erhalten. Sie werden im Bereich der Bundesrepublik Deutschland durch den seit 2005 in Kooperation der Universitäten Freiburg und Mainz in Angriff genommenen und durch die DFG geförderten 'Deutschen Familiennamenatlas' (OFA) auf der Basis von Telefonanschlüssen (Stand 2005) dokumentiert. Im vorliegenden Beitrag werden Vorarbeiten, Ziele, Gesamtanlage des Projekts, Systematik und Repräsentativität der Themenauswahl in den beiden Hauptteilen (grammatischer und lexikalischer Teil) sowie Kriterien und Methoden der inhaltlichen Konzipierung und formalen Gestaltung der Karten und Kommentare vorgestellt und begründet. Aus den genannten Vorarbeiten werden auch schon Perspektiven künftiger Auswertung der in den Datenbanken archivierten Materialien und der im Atlas exemplarisch dokumentierten Strukturen der Namenlandschaften ersichtlich.
Im ersten Teil wird zunächst die wenige Forschungsliteratur zum Thema Deskriptivität selbst und eng verwandten Themen vorgestellt und besprochen. Daraus soll sich im Anschluss auch eine Definition des Begriffes ergeben, die weit genug gefasst ist, um die übliche Verwendungsweise des Begriffs bei Autoren, die ihn zwar benutzen, aber nicht theoretisch behandeln, zu erfassen, die sich aber andererseits dennoch in klar definierten und nachvollziehbaren Grenzen bewegt. Dabei soll weiterhin deutlich werden, dass es sich bei Deskriptivität um ein prinzipiell in allen Sprachen anzutreffendes Phänomen handelt, dass sich aber die Frequenz deskriptiver Ausdrücke von Sprache zu Sprache stark unterscheiden kann. Dabei werde ich Daten aus ausgewählten Sprachen einbeziehen und eine quantitative Analyse des Ausmaßes, mit dem verschiedene Sprachen von deskriptiven Bildungen Gebrauch machen vorstellen. Der zweite Hauptteil der Arbeit beschäftigt sich mit folgender Frage: Wenn jede Sprache zu einem gewissen Grad von deskriptiven Benennungen Gebrauch macht, welche Mechanismen des Sprachwandels gibt es, die die Position einer Sprache auf dieser Skala in die eine oder die andere Richtung verändern können?
Die zielsprachliche Verwendung des Artikels als grammatikalisiertem Mittel der NP-Determination im Deutschen stellt im Zweitspracherwerb besonders für Deutschlernende mit einer artikellosen Muttersprache eine große Schwierigkeit dar. Die vorliegende Arbeit untersucht die NP-Determination auf der Basis eines Spontansprachkorpus, welches Erwerbsdaten einer achtjährigen russischen Deutschlernenden in einer frühen und einer späten Erwerbsphase liefert. Das Ziel der Untersuchung ist, Erkenntnisse über Entwicklungsverlauf, Transferphänomene und insbesondere referenzsemantische und phonologische Determinanten der Artikelwahl zu gewinnen.
Govorni se činovi najlakše prepoznaju i razgraničuju u dijalogu pa su dramski tekstovi vrlo pogodni za analizu i propitivanje teorije govornih činova. Krležinoj drami U agoniji možemo pristupiti kao korpusu za oprimjerenje konstativnoga i performativnoga shvaćanja jezika. U toj se drami sukob doista gradi na oprečnome shvaćanju jezika, a to se i verbalno eksplicira, pa se drama odvija na svojevrsnoj metajezičnoj razini gdje se glavni karakteri “svađaju” zato što govore različitim jezicima. Govorni činovi u drami, posebice komplimenti, analizirani su i s aspekta feminističke lingvistike.
Predmet ovog rada su kajkavizmi u Tkonskom zborniku – glagoljskom rukopisu koji je početkom 16. stoljeća pisan na frankopanskim posjedima. Utvrđeno je da su u tom rukopisu prisutni kajkavizmi na svim razinama: fonološkoj, morfološkoj, leksičkoj i sintaktičkoj. Najviše je kajkavizama na leksičkoj razini, a oni se mogu podijeliti u dvije skupine: 1. zajednički čakavsko- kajkavski sloj, npr. betegь, gdo, nigdar, hiniti, hud, kaštigati, lotar itd.; 2. kajkavski sloj, npr. fajtati, gorup, nekoteri, pokrivača, škoda, špotati, tanac itd. Prva je kategorija leksema interpolirana u gotovo svim dijelovima CTk, a druga je najčešća u Cvetu od kreposti i Muci. Tkonski zbornik čuva jedno ogromno leksičko bogatstvo, a pri usporedbi pojedinih leksema s onima u hrvatskoglagoljskim misalima i brevijarima, zaključeno je da su neki od njih potvrđeni i ranije, npr. betegь, kaštigati, praviti, gorup, tanac itd. To je potvrda o kontinuitetu hrvatskoglagoljske književnosti. Interpolacija kajkavizama nije ujednačena u svim dijelovima zbornika, kajkavske su intervencije najčešće u Cvetu od kreposti (f. 67 – 85) i u Muci Spasitelja našega (f. 109 – 161). Na temelju provedenog istraživanja može se zaključiti da je Tkonski zbornik rukopis sastavljen iz različitih dijelova, koji nisu nastali u istom razdoblju, ni na istom mjestu. Budući da kajkavizme u pojedinim dijelovima nalazimo na svim razinama (Cvet od kreposti i Muka), može se pretpostaviti da su oni nastali u sjevernom području, tj. bliže kajkavskom.
Književnojezična norma franjevačkih pisaca 18. St. : sastavnica jezičnostandardizacijskih procesa
(2007)
Važnom sastavnicom hrvatskoga predstandardnoga jezika smatra se koine franjevačke književnosti 18. st. Izrasla iz pisane prakse bosanskih franjevaca 17. st., obogaćena u jeziku hrvatskih franjevaca izraznim sredstvima pučkeknjiževnosti, već je u 18. st. pokazivala obilježja standardiziranosti: polifunkcinonalnost, preskriptivnost i neovisnost o organskim idiomima. Koine je opisana u franjevačkim gramatikama, što je naznaka normativnih tendencija.
Die vorliegende Arbeit ist eine kritische Auseinandersetzung mit dem Hofstedeschen Ansatz. Dabei soll in erster Linie das Werk von Hofstede selbst einer wissenschaftstheoretisch-methodologischen Prüfung unterzogen werden. Bei sehr populären Standardansätzen, die sowohl in der Praxis einen großen Anklang finden als auch in der wissenschaftlichen Gemeinschaft ständig rezipiert und weiterentwickelt werden, bleibt es natürlich nicht aus, dass durch Vereinfachungen oder Uminterpretationen in der Literatur Inkonsistenzen entstehen, die so im Originalwerk nicht enthalten sind. In dieser Arbeit soll es im Wesentlichen nicht um solche Probleme der Hofstedeschen Rezeption gehen. Vielmehr werde ich die Argumentation von Hofstede selbst in seinen eigenen Schriften […] einer detaillierten kritischen Analyse zu unterziehen, um auf diese Weise zu prüfen, ob bestimmte gravierende Probleme schon im Originalwerk angelegt sind.
U ovome radu analizira se dio korpusa hrvatskih i ruskih frazema s kulinarskim elementima kao komponentаma i onih koji u svom semantičkom talogu imaju sliku povezanu s jelom. Cilj rada je prikazati simbolički, metaforički i konotativni potencijal hrane kao frazeološke komponente putem analize načina izgradnje frazeološkog značenja, te istaknuti najočitije sličnosti i najzanimljivije razlike između ovakvog tipa frazeologije u hrvatskom i ruskom jeziku.
U radu se prikazuje i analizira leksikografski status brojevnih riječi u Rječniku hrvatskoga kajkavskoga književnog jezika. Prilaže se popis brojevnih riječi obrađenih u rječniku, utvrđuje se u kojoj su mjeri u rječničkome članku zastupljeni elementi gramatičkoga opisa i navode li se oni dosljedno. Analiziraju se elementi definicije brojevnih riječi i njezina koherentnost.
The special issue of The Linguistic Review on "The Role of Linguistics in Cognitive Science" presents a variety of viewpoints that complement or contrast with the perspective offered in Foundations of Language (Jackendoff 2002a). The present article is a response to the special issue. It discusses what it would mean to integrate linguistics into cognitive science, then shows how the parallel architecture proposed in Foundations seeks to accomplish this goal by altering certain fundamental assumptions of generative grammar. It defends this approach against criticisms both from mainstream generative grammar and from a variety of broader attacks on the generative enterprise, and it reflects on the nature of Universal Grammar. It then shows how the parallel architecture applies directly to processing and defends this construal against various critiques. Finally, it contrasts views in the special issue with that of Foundations with respect to what is unique about language among cognitive capacities, and it conjectures about the course of the evolution of the language faculty.
U članku se opisuje morfonologija glagolske osnove u prezentskoj paradigmi na građi hrvatsko-crkvenoslavenskih (dalje: HCS) glagola s temeljnom osnovom na -i- u kojih tom završnom -i- prethodi zubni sonant: r, l, n (tj. tipa tvori-ti, moli-ti, brani-ti). U obzir su uzeti svi glagolski leksemi tog tipa iz kartoteke Rječnika crkvenoslavenskoga jezika hrvatske redakcije: 110 li-glagola, 127 ni-glagola i 83 ri-glagola i njihovi prezentski oblici. Metoda opisa je usporedba dotičnog fragmenta HCS gramatike sa staroslavenskim stanjem kao i sa stanjem u starohrvatskim (čakavskim) govorima. U staroslavenskom jeziku u prezentskoj je paradigmi tihglagola osnova okrnjena (tj. okrnjen je sufiks -i-) i pojavljuje se u dvije varijante: palatalnoj (u 1. licu jednine), i tvrdoj (u svim ostalim oblicima). Tako u prezentu nalazimo u osnovi alternacije r ~ ŕ, l ~ ĺ i n ~ ń. U HCS tekstovima morfonološki su najinovativniji ri-glagoli. Kako je u hrvatskom depalataliziran fonem ŕ, kod ri-glagola nije sačuvan staroslavenski morfonološki model. HCS građa ne pokazuje staroslavensku alternaciju r ~ ŕ, tj. kod ri-glagola nema variranja osnove u prezentu (okrnjena osnova u svim oblicima završava nepalatalnim suglasnikom). Kod li-glagola i ni-glagola staroslavenski je morfonološki model očuvan. Međutim, u tekstovima su ipak potvrđene rijetke devijacije od tog modela. Naime, usprkos postojanju grafijskoga sredstva za označavanje palatalnosti fonema ĺ i ń ispred gramatičkog morfema 1. lica jednine -u (tj. uporaba slova ű iza l, n), neki su pisari u rijetkim slučajevima izostavljali označavanje palatalnosti, tj. pisali grafem u (molu, branu). Autorica predlaže različita moguća objašnjenja te pogreške i utvrđuje u kojoj je mjeri ta pojava ograničena na određene HCS tekstove.
U radu se analizira drugi cjeloviti objavljeni prijevod Svetoga pisma na hrvatski jezik, Škarićevo Sveto pismo Staroga i Novoga uvita (Beč, 1858. – 1861.); opisuju se njegove jezične osobine, utvrđuje se njegovo mjesto u dugoj hrvatskoj svetopisamskoj prevodilačkoj tradiciji te njegov utjecaj na proces standardizacije hrvatskoga jezika.
U radu se obrađuju načini tvorbe pridjeva, priloga, prijedloga, zamjenica i veznika na primjerima iz Tadijanovićeva djela „Svašta po malo“. Posebno se upozorava na tipove tvorba koji su neobični zbog značenja koje ima tvorenica, na tvorbu neuobičajenih tvorenica prema već postojećim modelima, na različite pristupe i tumačenja u određivanju tvorbenih načina te na odnos motiviranih i nemotiviranih riječi sa stajališta povijesne i suvremene tvorbe. Analizirani se primjeri uspoređuju s potvrdama iz „Rječnika hrvatskoga ili srpskoga jezika JAZU“.
Parni prijedlozi
(2007)
In this paper, we will argue for a novel analysis of the auxiliary alternation in Early English, its development and subsequent loss which has broader consequences for the way that auxiliary selection is looked at cross-linguistically. We will present evidence that the choice of auxiliaries accompanying past participles in Early English differed in several significant respects from that in the familiar modern European languages. Specifically, while the construction with have became a full-fledged perfect by some time in the ME period, that with be was actually a stative resultative, which it remained until it was lost. We will show that this accounts for some otherwise surprising restrictions on the distribution of BE in Early English and allows a better understanding of the spread of HAVE through late ME and EModE. Perhaps more importantly, the Early English facts also provide insight into the genesis of the kind of auxiliary selection found in German, Dutch and Italian. Our analysis of them furthermore suggests a promising strategy for explaining cross-linguistic variation in auxiliary selection in terms of variation in the syntactico-semantic structure of the perfect. In this introductory section, we will first provide some background on the historical situation we will be discussing, then we will lay out the main claims for which we will be arguing in the paper.
Pokazatelji brojivosti
(2007)
Du fait de la traite négrière qui a vu des millions d’Africains être déportés aux Amériques, les langues européennes (anglais, espagnol, français, néerlandais, portugais) des colons qui y étaient déjà installés et qui avaient un fort besoin en main-d’oeuvre africaine, ont eu à intégrer à des degrés divers de nombreux mots africains. Les chercheurs qui travaillent sur ces africanismes sont d’accord pour dire que ces mots ont deux grandes origines africaines : bantoue et non-bantoue.
Autorica donosi osnovne informacije o knjizi Kinch oſzebuini i njegovu autoru, osvrće se na onimiju, antroponimiju i osobna imena osoba koje se u djelu spominju. Središnji dio rada posvećen je prezimenima zasvjedočenim u Kinchu oſzebuinome – prikazuju se tipovi identifikacijskih formula dio kojih su prezimena, ilustrira posredan način imenovanja pojedinca te promatra pojavnost prezimena iz Kincha oſzebuinog u Leksiku prezimena.
U ovome se radu pokušava dati pregled mnogobrojnih i raznolikih odraza svetačkog imena Juraj u hrvatskome antroponimijskom sustavu s osobitim naglaskom na područje Zažablja (prostora između rječice Misline, istočno od Metkovića, i zapadnih granica nekadašnje Dubrovačke Republike, a danas općine Dubrovačko primorje, te prostora od Hrasna na sjeveru do Neuma na jugu) i Popova (jugozapadne Hercegovine). Na temelju odabrane literature i autorova terenskog istraživanja nastoje se iznijeti i neke izvanjezične (poglavito povijesne i sociolingvističke) činjenice koje su uzrok takvu stanju.
U radu se raspravlja o leksikografskom postupku koji se primjenjuje u izradbi Rječnika hrvatskoga kajkavskoga književnog jezika pri uspostavljanju nadnatuknice i kanonskih likova za dvadesetak potvrđenih leksičkih varijanata za ‘rajnski forint’, novčanu jedinicu koja označuje kovani novac u uporabi u Hrvatskoj od 16. do 19. stoljeća. Nakon navođenja svih kontekstualnih potvrda, utvrđuje se vrijednost novčane jedinice i podrijetlo naziva, provodi se morfološka analiza leksema, određuju se kanonski likovi i njihove gramatičke odrednice te se lik rajniški uspostavlja kao najreprezentativniji gdje se donose etimologija i definicija. Dvadesetak leksičkih varijanata za naziv ‘rajnski forint’ posljedica su različitih jezičnih procesa u prihvaćanju, upotrebi i adaptaciji toga naziva u kajkavskom književnom jeziku.
U članku se prikazuje razvoj miljevačkoga prezimenskoga sustava od prvih prezimena zabilježenih u matičnim knjigama potkraj 17. stoljeća do prezimena koja se javljaju tek potkraj 19. stoljeća. Utvrđuje se koja su prezimena u međuvremenu ugašena, tj. koja su nestala zbog izumiranja loze ili zamjene novim prezimenom, najčešće dotadašnjim obiteljskim nadimkom. Analiziraju se motivacijsko-strukturna svojstva današnjih miljevačkih prezimena i njihovo jezično podrijetlo.
This paper presents an LTAG analysis of reflexives like himself and reciprocals like each other. These items need to find a c-commanding antecedent from which they retrieve (part of) their own denotation and with which they syntactically agree. The relation between anaphoric item and antecendent must satisfy the following important locality conditions (Chomsky (1981)).
U radu se predstavlja rukopisni rječnik Vocabolario italiano-illirico, dvojezični hrvatsko-talijanski rječnik, djelo Dubrovčanina fra Lovre Cekinića. Rukopis je nastao 40-ih godina 18. stoljeća, a danas se čuva u biblioteci Samostana Male braće u Dubrovniku. Analizira se autorova leksikografska metoda te se naznačuje leksičko bogatstvo desne, hrvatske strane.
U radu se iznose tzv. lažni parovi (prijatelji), leksemi u hrvatskom i rumunjskom jeziku koji zbog svoje izrazne podudarnosti navode na pogrešno prevođenje. Navode se značajke koje su dovele do takvih pojava. S obzirom na podrijetlo, najčešće je riječ o leksemima naslijeđenima iz latinskoga jezika ili kasnijim romanizmima te dakako slavenskima, kojih je u rumunjskome nezanemariv broj. Izdvojeni se leksemi razvrstavaju u tablicu koja omogućuje njihovu prozirniju usporedbu i lakše prepoznavanje.
U radu se analizira sintaktička funkcija participa u hrvatskome jeziku 15./16. st. jer su se otprilike u to vrijeme u sintaktičkom ustrojstvu (staro)hrvatskoga jezika događale vrlo krupne jezične promjene, koje su posljedica “departicipijalizacije” participa, tj. preobrazbe naslijeđenih participnih oblika u glagolske priloge.
Recent approaches to Word Sense Disambiguation (WSD) generally fall into two classes: (1) information-intensive approaches and (2) information-poor approaches. Our hypothesis is that for memory-based learning (MBL), a reduced amount of data is more beneficial than the full range of features used in the past. Our experiments show that MBL combined with a restricted set of features and a feature selection method that minimizes the feature set leads to competitive results, outperforming all systems that participated in the SENSEVAL-3 competition on the Romanian data. Thus, with this specific method, a tightly controlled feature set improves the accuracy of the classifier, reaching 74.0% in the fine-grained and 78.7% in the coarse-grained evaluation.
Im Laufe der letzten Jahrzehnte haben in die Aspektologie und die ihr gewidmeten wissenschaftlichen Debatten zunehmend Versuche Einzug gehalten, die mit dem Ziel unternommen wurden und darauf ausgerichtet waren, die Lexik der Verben in den Mittelpunkt des Interesses zu rücken und in der Hoffnung darauf zu durchforsten, darin Hinweise aufzuspüren, die es gestatten, entsprechende verlässliche Rückschlüsse auf das von ihnen gezeitigte Aspektverhalten, d.h. die in dem jeweiligen Fall zutage tretende Art der der Imperfektiv-Perfektiv-Opposition zugrunde liegenden Bedeutung zu ziehen. In dem Bemühen, eine aspektuell relevante Verbklassifikation, d.h. eine solche, die sowohl über die Frage der aspektuellen Paarigkeit von Verben als auch über die semantischen Eigenschaften von Perfektivum und Imperfektivum innerhalb eines Aspektpaares Aufschluss erteilt, zu erstellen, musste man sich zunächst auf die Aufgabe zurückbesinnen, die die Sprache dem Aspekt zubedacht hat und die durch den morphologisch geschiedenen Gegensatz von Imperfektiva und Perfektiva wahrgenommen wird: die - von mir eindeutig ausschließlich in diesem Sinne so genannte - Aspektualität.
Children […] growing up with highly inflected languages such as Modern Greek will frequently hear different grammatical forms of a given lexeme used in different grammatical and semantic-pragmatic contexts. In spite of the fact that the Greek noun is not as highly inflected as the verb, acquisition of nominal inflection of this inflecting-fusional language is quite complex, comprising the three categories of case, number, and gender. As is usual in this type of language, the formation of case-number forms obeys different patterns that apply to largely arbitrary classes of nominal lexemes partially based on gender. Further, frequency of the occurrence of the three gender classes and case-number forms of nouns greatly differs in spoken Greek, regarding both the types and tokens. […] [A] child learning an inflecting-fusional language like Greek must construct different inflectional patterns depending not only on parts of speech but also on subclasses within a given part of speech, such as gender classes of nouns and inflectional classes within or (exceptionally) across genders. It is therefore to be expected that the early development of case and number distinctions will apply to specific nouns and subclasses of nouns rather than the totality of Greek nouns. The two main theoretical approaches of morphological development that will be discussed in the present paper are the usage-based approach and the pre- and protomorphology approach.
The Conference on Computational Natural Language Learning features a shared task, in which participants train and test their learning systems on the same data sets. In 2007, as in 2006, the shared task has been devoted to dependency parsing, this year with both a multilingual track and a domain adaptation track. In this paper, we define the tasks of the different tracks and describe how the data sets were created from existing treebanks for ten languages. In addition, we characterize the different approaches of the participating systems, report the test results, and provide a first analysis of these results.
In the area of the Modern Greek verb, phenomena which consistently appear are headmarking, many potential slots before and/or after the verb root, noun and adverb incorporation, addition of adverbial elements by means of affixes, a large inventory of bound morphemes, verbal words as minimal sentences, etc. These features relate Modern Greek to polysynthesis. The main bulk of this paper is dedicated to the comparison of affixal and incorporation patterns between Modern Greek and the polysynthetic languages Abkhaz, Cayuga, Chukchi, Mohawk, and Nahuatl. Ultimately, a typological outlook for Modern Greek is proposed.
U radu se analizira uloga jednog tipa referencijalnih izraza – anaforičkih izraza – u diskurzivnom oblikovanju odabranog medijsko-znanstvenog događaja (“uskrsnuće” bakterije Deinococcus radiodurans). Predlaže se transverzalna analiza anaforičkih izraza utemeljena na modularnom pristupu kompleksnosti organizacije diskursa i na dinamičnoj koncepciji anaforičke referencije, shvaćene kao segment šireg procesa konceptualnog strukturiranja svijeta diskursa i usuglašavanja mentalnih predodžbi sudionika u interakciji.
We adopt Markert and Nissim (2005)’s approach of using the World Wide Web to resolve cases of coreferent bridging for German and discuss the strength and weaknesses of this approach. As the general approach of using surface patterns to get information on ontological relations between lexical items has only been tried on English, it is also interesting to see whether the approach works for German as well as it does for English and what differences between these languages need to be accounted for. We also present a novel approach for combining several patterns that yields an ensemble that outperforms the best-performing single patterns in terms of both precision and recall.
In this paper, we introduce an extension of the XMG system (eXtensibleMeta-Grammar) in order to allow for the description of Multi-Component Tree Adjoining Grammars. In particular, we introduce the XMG formalism and its implementation, and show how the latter makes it possible to extend the system relatively easily to different target formalisms, thus opening the way towards multi-formalism.