Linguistik
Refine
Year of publication
- 2008 (77) (remove)
Document Type
- Article (43)
- Part of a Book (14)
- Preprint (11)
- Conference Proceeding (4)
- Review (4)
- Book (1)
Language
- Croatian (42)
- German (17)
- English (16)
- French (1)
- Portuguese (1)
Has Fulltext
- yes (77)
Is part of the Bibliography
- no (77)
Keywords
- Linguistik (18)
- Rezension (18)
- Germanistik (12)
- Russland (12)
- Kroatisch (7)
- Deutsch (6)
- Grammatik (4)
- Multicomponent Tree Adjoining Grammar (4)
- Range Concatenation Grammar (4)
- Syntaktische Analyse (4)
- Cakavisch (3)
- Morphologie (3)
- Syntax (3)
- Aspekt <Linguistik> (2)
- Dialektologie (2)
- German (2)
- Kajkavisch (2)
- Kiezdeutsch (2)
- Lexikographie (2)
- Literatursprache (2)
- Morphologie <Linguistik> (2)
- Phonologie (2)
- Soziolinguistik (2)
- Sprachpurismus (2)
- (Morpho)syntactic focus strategy (1)
- Ableitung <Linguistik> (1)
- Acquisition (1)
- Adverb (1)
- Akkusativ (1)
- Akzent (1)
- Altkirchenslawisch (1)
- Antezedenz <Linguistik> (1)
- Antonym (1)
- Arabisch (1)
- Automatentheorie (1)
- Broad focus (1)
- Computerlinguistik (1)
- Deixis (1)
- Della Bella, Ardelio (1)
- Determinativ (1)
- Diachronie (1)
- Diskursanalyse (1)
- Djuro Ferić (1)
- Ekavisch (1)
- Elite (1)
- Fachsprache (1)
- Focus ambiguity (1)
- Focus marker (1)
- Formale Sprache (1)
- Fremdenfeindlichkeit (1)
- Genitiv (1)
- Grammaires d’arbres adjoints à composantes multiples (1)
- Grammatiktheorie (1)
- Gundulić, Ivan (1)
- Gur (1)
- Ikavisch (1)
- Infinitkonstruktion (1)
- Informationsstruktur (1)
- Jagi´c (1)
- Jugendsprache (1)
- Kollokation (1)
- Kompositum (1)
- Kongress (1)
- Konjunktion (1)
- Konsekutivsatz (1)
- Kontrastive Grammatik (1)
- Latium / Mundart (1)
- Lehnwort (1)
- Lexikalisch funktionale Grammatik (1)
- Machine Learning (1)
- Mareti´c (1)
- Mosambik (1)
- Motion <Linguistik> (1)
- Mozambique (1)
- Moçambique (1)
- Multicomponent Tree Adjoining Grammars (1)
- Ngoni (1)
- Ngoni-Sprache (1)
- Nomen (1)
- Numerale (1)
- Objektivierung (1)
- Online-Publikation (1)
- Ortsname (1)
- Palatal (1)
- Passionsdarstellung (1)
- Phonetik (1)
- Phraseologie (1)
- Poetizität (1)
- Possessivität (1)
- Proklise (1)
- Ragusa (1)
- Range Concatenation Grammars (1)
- Rechtschreibung (1)
- Reflexives Verb (1)
- Reformismus (1)
- Relativsatz (1)
- Retroflex (1)
- Russisch (1)
- Schrift (1)
- Schweiz (1)
- Sibenik (1)
- Slavonic Languages (1)
- Sprachwandel (1)
- Stadtname (1)
- Standardisierung (1)
- Subjektivität (1)
- Synonym (1)
- Tagging (1)
- Tarragona <2008> (1)
- Tempus (1)
- Textlinguistik (1)
- Tomislav (1)
- Tone language (1)
- Tree Tuple (1)
- Tree-Adjoining Grammar (1)
- Tschetschenisch (1)
- Valenz <Linguistik> (1)
- Vatroslav (1)
- Wortschatz (1)
- Wörterbuch (1)
- Zadar (1)
- antecedent (1)
- compounds (1)
- consequential sentence constructions (1)
- educational proposals (1)
- genitive case (1)
- grammaires à concaténation d’intervalles (1)
- grammar (1)
- infinitive consequential constructions (1)
- language change (1)
- linking elements (1)
- légère sensibilité au contexte (1)
- migrants’ language (1)
- mild context-sensitivity (1)
- multi-ethnolect (1)
- possessive adjective (1)
- relative clause (1)
- syntactic models (1)
Institute
- Extern (77) (remove)
The problem of vocalization, or diacritization, is essential to many tasks in Arabic NLP. Arabic is generally written without the short vowels, which leads to one written form having several pronunciations with each pronunciation carrying its own meaning(s). In the experiments reported here, we define vocalization as a classification problem in which we decide for each character in the unvocalized word whether it is followed by a short vowel. We investigate the importance of different types of context. Our results show that the combination of using memory-based learning with only a word internal context leads to a word error rate of 6.64%. If a lexical context is added, the results deteriorate slowly.
Rad je nastao iz potrebe da se opiše dubrovački pučki govor 17. i 18. st. Pri morfološkoj je analizi važno uzeti u obzir da se opisuje jezično razdoblje i područje podudarno s početkom formiranja današnjega standardnog jezika. Analiza postaje svrhovitom usporedi li se s rezultatima jezičnih studija razdobljā koja su joj prethodila i slijedila, do današnjega vremena.
Die deutschen Präteritoprasentia sind, indem alte Perfektformen das heutige Präsens stellen, aus mehreren Griinden als hochgradig irregular zu betrachten; hinzu kommt ein bisher nicht geklärter Umlaut bei vier (von heute sieben) dieser Verben: müssen, dürfen, können und mögen. Bisherige Erklärungsversuche werden diesem Problem nicht gerecht: Zwar versuchen sie durchaus, den Umlaut im Präsens zu motivieren, doch vermögen sie es nicht, sein ausschließliches Vorkommen im Plural des Präsens zu erklären. Hier wird für die These argumentiert, dass es sich um einen (verbalen) Pluralumlaut handelt, der insbesondere auch im Nominalbereich gang und gäbe ist und dort zur gleichen Zeit einen massiven Ausbau (Morphologisierung) erfährt. Damit handelt es sich um einen sog. transkategorialen Marker.
Neobjavljeni autografi basna Đure Ferića (1739-1820) u odnosu prema dubrovačkoj pisanoj tradiciji
(2008)
U radu se prikazuju rezultati istraživanja neobjavljenih hrvatskih rukopisa dubrovačkoga latinista Đure Ferića, odnosno otkrića dvaju dosad nepoznatih autografa njegovih basna. Interpretacija rukopisa kao dijela dubrovačke literarne i jezičnopovijesne tradicije temeljni je cilj istraživanja, a polazište je usporedba grafijskih, pravopisnih i jezičnih osobitosti spomenutih autografa s leksikografskim i jezikoslovnim izvorima 17. i 18. stoljeća te jezikom kanonskoga pisca starije hrvatske književnosti Ivana Gundulića.
Ključne riječi: Đuro Ferić; autografi; dubrovačka pisana tradicija
Za svojega kratkoga boravka u Petrogradu 1912. I. Milcetic; opisao je bogatu Bercicevu zbirku glagoljickih rukopisa i tiskanih knjiga iz Ruske nacionalne knjižnice, ali nije stigao podrobno prouciti svaki sastavni dio Berciceve grade. U Milceticevu opisu kodeksa br. 1 (Klimantovicev zbornik, 1514.) spominje se prolog Muke, ali se ne upozorava da se u nastavku toga prologa nalazi ulomak iz srednjovjekovnoga prikazanja sa scenom Judine izdaje Isusa. Ta je scena u srednjem vijeku ponajviše uznemiravala puk jer se tada od svega najviše mrzila laž, izdaja i prijetvornost. U radu se opisuju i prvi put objavljuju ulomci nepoznate redakcije Muke Isuhrstove iz petrogradske Berciceve zbirke (sign. Bc 1), koji predstavljaju za sada najstariji zapisani prolog i scenu hrvatskoga srednjovjekovnoga prikazanja pasionske tematike. Stihovi ulomaka usporeduju se s mladom ciklickom Mukom Spasitelja našega iz glagoljickoga Zbornika prikazanja (1556.), s kojom se u korpusu hrvatskoga srednjovjekovnoga pjesništva ti ulomci najviše podudaraju.
Broj njemackih posudenica u hrvatskome jeziku je manji nego što bi se moglo ocekivati, s obzirom na to da je višestoljetna politicka i kulturna povezanost Hrvatske s habsburškom državom uvjetovala izravni dodir njemackoga i hrvatskoga jezika. Razlog je tome jezicna politika koja se svjesno odupirala snažnom utjecaju njemackoga jezika na hrvatski, dajuci u standardnome jeziku prednost hrvatskim rijecima. U supstandardnom jeziku se, medutim, održao veci broj njemackih posudenica, iako za te rijeci postoje hrvatski ekvivalenti. U ovome ce se radu preispitati odnos njemacke posudenice i njezine domace zamjene, tj. u kojoj mjeri je hrvatski ekvivalent uspješna zamjena njemackoj posudenici kao i to o cemu sve ovisi ta uspješnost.
This paper investigates the relation between TT-MCTAG, a formalism used in computational linguistics, and RCG. RCGs are known to describe exactly the class PTIME; simple RCG even have been shown to be equivalent to linear context-free rewriting systems, i.e., to be mildly context-sensitive. TT-MCTAG has been proposed to model free word order languages. In general, it is NP-complete. In this paper, we will put an additional limitation on the derivations licensed in TT-MCTAG. We show that TT-MCTAG with this additional limitation can be transformed into equivalent simple RCGs. This result is interesting for theoretical reasons (since it shows that TT-MCTAG in this limited form is mildly context-sensitive) and, furthermore, even for practical reasons: We use the proposed transformation from TT-MCTAG to RCG in an actual parser that we have implemented.
German linking elements are sometimes classified as inflectional affixes, sometimes as derivational affixes, and in any case as morphological units with at least seven realisations (e.g. -s-, -es-, -(e)n-, -e-). This article seeks to show that linking elements are hybrid elements situated between morphology and phonology. On the one hand, they have a clear morphological status since they occur only within compounds (and before a very small set of suffixes) and support the listener in decoding them. On the other hand, they also have to be analysed on the phonological level, as will be shown in this article. Thus, they are marginal morphological units on the pathway to phonology (including prosodics). Although some alloforms can sometimes be considered former inflectional endings and in some cases even continue to demonstrate some inflectional behaviour (such as relatedness to gender and inflection class), they are on their way to becoming markers of ill-formed phonological words. In fact, linking elements, above all the linking -s-, which is extremely productive, help the listener decode compounds containing a bad phonological word as their first constituent, such as Geburt+s+tag ‘birthday’ or Religion+s+unterricht ‘religious education’. By marking the end of a first constituent that differs from an unmarked monopedal phonological word, the linking element aids the listener in correctly decoding and analysing the compound. German compounds are known for their length and complexity, both of which have increased over time—along with the occurrence of linking elements, especially -s-. Thus, a profound instance of language change can be observed in contemporary German, one indicating its typological shift from syllable language to word language.
U članku se analizira opis glagolskoga vida u gramatikama hrvatskoga kajkavskoga književnog jezika, nastalim od druge polovice 18. do prve polovice 19. stoljeća (Vitkovićeva, Szentmartonyjeva, Kornigova i Matijevićeva te gramatike J. Đurkovečkoga i I. Kristijanovića). Analizom gramatičkoga diskursa u navedenim se gramatikama razlučuju temeljne glagolskovidske sastavnice u različitim pristupima gramatičkome opisu: glagolski vid i definicija kategorije te definicije članova vidske oprjeke, (im)perfektivizacija, zatim odnos glagolskoga vida i glagolskih oblika, te sastava glagola.
Bilježenje palatalnih konsonanata najviše je problema izazivalo u slavenskih naroda koji su nastojali prilagoditi osnovnu latinicu fonemima svojih jezika. U ovom se radu promatraju bilježenja palatala u pisaca zadarsko-šibenskoga kruga, i to u vremenu od 14. do 17. stoljeća. U toj su regiji nastali prvi hrvatski tekstovi pisani latinicom. Cilj rada jest ustvrditi kako su pojedini autori latinicom zapisali sporne foneme hrvatskoga (čakavskoga) jezika, koje su razlike i istosti njihovih grafijskih rješenja i koje se tendencije ogledaju u višestoljetnoj uporabi latinice na ovom području.
U radu se prikazuju rezultati terenskoga istraživanja o pomicanju naglasaka u imenskih riječi na prednaglasnicu, odnosno o praslavenskom prijenosu siline unutar naglasne cjeline u čakavskome govoru Crikvenice. Pomicanje se naglasaka na prednaglasnicu provodi dosljedno u svima razmatranim kategorijama (osim u brojeva) u kojima su zadovoljeni ovi uvjeti: prvotni silazni naglasak na prvome (ili jedinome) slogu osnove one riječi koja čini naglasnu cjelinu s prijedlogom ispred sebe. U akuzativu su imenica muškoga i ženskoga roda zabilježene alternacije. Pomicanje naglasaka na prednaglasnicu u nekim primjerima srednjega roda u L jd. zahvaća i drugotne silazne naglaske koji su se na prvome slogu osnove našli naknadno, zbog naglasnoga ujednačavanja paradigme ili naglasnoga tipa.
Part-of-Speech tagging is generally performed by Markov models, based on bigram or trigram models. While Markov models have a strong concentration on the left context of a word, many languages require the inclusion of right context for correct disambiguation. We show for German that the best results are reached by a combination of left and right context. If only left context is available, then changing the direction of analysis and going from right to left improves the results. In a version of MBT (Daelemans et al., 1996) with default parameter settings, the inclusion of the right context improved POS tagging accuracy from 94.00% to 96.08%, thus corroborating our hypothesis. The version with optimized parameters reaches 96.73%.
U radu se analiziraju pravi tvorbeni mocijski parnjaci u kajkavskome književnom jeziku. Utvrđuju se sufiksi produktivni u mocijskoj tvorbi u književnoj kajkavštini, njihova učestalost i korelativni parnjaci u kojima se javljaju. Rezultati se uspoređuju s osobitostima mocijske tvorbe u hrvatskome standardnom jeziku.