Linguistik
Refine
Year of publication
Document Type
- Article (1213)
- Part of a Book (784)
- Working Paper (254)
- Review (181)
- Conference Proceeding (166)
- Preprint (122)
- Book (108)
- Part of Periodical (64)
- Report (58)
- Doctoral Thesis (23)
Language
Has Fulltext
- yes (2991) (remove)
Keywords
- Deutsch (436)
- Syntax (151)
- Linguistik (126)
- Englisch (123)
- Semantik (112)
- Spracherwerb (96)
- Phonologie (85)
- Rezension (77)
- Kroatisch (68)
- Fremdsprachenlernen (67)
Institute
- Extern (438)
- Institut für Deutsche Sprache (IDS) Mannheim (113)
- Neuere Philologien (43)
- Sprachwissenschaften (43)
- Universitätsbibliothek (4)
- Sprach- und Kulturwissenschaften (3)
- Gesellschaftswissenschaften (2)
- Medizin (2)
- Präsidium (2)
- SFB 268 (2)
In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.
This demo abstract describes the SmartWeb Ontology-based Information Extraction System (SOBIE). A key feature of SOBIE is that all information is extracted and stored with respect to the SmartWeb ontology. In this way, other components of the systems, which use the same ontology, can access this information in a straightforward way. We will show how information extracted by SOBIE is visualized within its original context, thus enhancing the browsing experience of the end user.
Dialogue acts in Verbmobil 2
(1998)
This report describes the dialogue phases and the second edition dialogue acts which are used in the VERBMOBIL 2 project [...]. While in the first project phase the scenario was restricted to appointment scheduling dialogues, it has been extended to travel planning in the second phase with appointment scheduling being only a part of the new scenario.
The Deep Linguistic Processing with HPSG Initiative (DELH-IN) provides the infrastructure needed to produce open-source semantic transfer-based machine translation systems. We have made available a prototype Japanese-English machine translation system built from existing resources include parsers, generators, bidirectional grammars and a transfer engine.
While the sortal constraints associated with Japanese numeral classifiers are well-studied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broad-coverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
While the sortal constraints associated with Japanese numeral classifiers are wellstudied, less attention has been paid to the details of their syntax. We describe an analysis implemented within a broadcoverage HPSG that handles an intricate set of numeral classifier construction types and compositionally relates each to an appropriate semantic representation, using Minimal Recursion Semantics.
Standardisierung ist der bedeutendste Ansatz zu Qualitätssteigerung und Kostensenkung in der Technischen Dokumentation. Es gibt eine Reihe von Standardisierungsansätzen: Modularisierung, Informationsstrukturen, Terminologie, Sprachstrukturen. Dennoch werden diese Ebenen meist getrennt voneinander beschrieben. Wir untersuchen, wie Standardisierungen im Informationsmodell, in der Terminologie und in den sprachlichen Strukturen verknüpft werden und miteinander interagieren.
Der Übersetzungsprozess der Technischen Dokumentation wird zunehmend mit Maschineller Übersetzung (MÜ) unterstützt. Wir blicken zunächst auf die Ausgangstexte und erstellen automatisch prüfbare Regeln, mit denen diese Texte so editiert werden können, dass sie optimale Ergebnisse in der MÜ liefern. Diese Regeln basieren auf Forschungsergebnissen zur Übersetzbarkeit, auf Forschungsergebnissen zu Translation Mismatches in der MÜ und auf Experimenten.
We present an effort for the development of multilingual named entity grammars in a unification-based finite-state formalism (SProUT). Following an extended version of the MUC7 standard, we have developed Named Entity Recognition grammars for German, Chinese, Japanese, French, Spanish, English, and Czech. The grammars recognize person names, organizations, geographical locations, currency, time and date expressions. Subgrammars and gazetteers are shared as much as possible for the grammars of the different languages. Multilingual corpora from the business domain are used for grammar development and evaluation. The annotation format (named entity and other linguistic information) is described. We present an evaluation tool which provides detailed statistics and diagnostics, allows for partial matching of annotations, and supports user-defined mappings between different annotation and grammar output formats.
Pokazatelji brojivosti
(2007)
U radu se analizira drugi cjeloviti objavljeni prijevod Svetoga pisma na hrvatski jezik, Škarićevo Sveto pismo Staroga i Novoga uvita (Beč, 1858. – 1861.); opisuju se njegove jezične osobine, utvrđuje se njegovo mjesto u dugoj hrvatskoj svetopisamskoj prevodilačkoj tradiciji te njegov utjecaj na proces standardizacije hrvatskoga jezika.
U ovome se radu pokušava dati pregled mnogobrojnih i raznolikih odraza svetačkog imena Juraj u hrvatskome antroponimijskom sustavu s osobitim naglaskom na područje Zažablja (prostora između rječice Misline, istočno od Metkovića, i zapadnih granica nekadašnje Dubrovačke Republike, a danas općine Dubrovačko primorje, te prostora od Hrasna na sjeveru do Neuma na jugu) i Popova (jugozapadne Hercegovine). Na temelju odabrane literature i autorova terenskog istraživanja nastoje se iznijeti i neke izvanjezične (poglavito povijesne i sociolingvističke) činjenice koje su uzrok takvu stanju.
U radu se analizira sintaktička funkcija participa u hrvatskome jeziku 15./16. st. jer su se otprilike u to vrijeme u sintaktičkom ustrojstvu (staro)hrvatskoga jezika događale vrlo krupne jezične promjene, koje su posljedica “departicipijalizacije” participa, tj. preobrazbe naslijeđenih participnih oblika u glagolske priloge.
U radu se analizira uloga jednog tipa referencijalnih izraza – anaforičkih izraza – u diskurzivnom oblikovanju odabranog medijsko-znanstvenog događaja (“uskrsnuće” bakterije Deinococcus radiodurans). Predlaže se transverzalna analiza anaforičkih izraza utemeljena na modularnom pristupu kompleksnosti organizacije diskursa i na dinamičnoj koncepciji anaforičke referencije, shvaćene kao segment šireg procesa konceptualnog strukturiranja svijeta diskursa i usuglašavanja mentalnih predodžbi sudionika u interakciji.
Predmet ovog rada su kajkavizmi u Tkonskom zborniku – glagoljskom rukopisu koji je početkom 16. stoljeća pisan na frankopanskim posjedima. Utvrđeno je da su u tom rukopisu prisutni kajkavizmi na svim razinama: fonološkoj, morfološkoj, leksičkoj i sintaktičkoj. Najviše je kajkavizama na leksičkoj razini, a oni se mogu podijeliti u dvije skupine: 1. zajednički čakavsko- kajkavski sloj, npr. betegь, gdo, nigdar, hiniti, hud, kaštigati, lotar itd.; 2. kajkavski sloj, npr. fajtati, gorup, nekoteri, pokrivača, škoda, špotati, tanac itd. Prva je kategorija leksema interpolirana u gotovo svim dijelovima CTk, a druga je najčešća u Cvetu od kreposti i Muci. Tkonski zbornik čuva jedno ogromno leksičko bogatstvo, a pri usporedbi pojedinih leksema s onima u hrvatskoglagoljskim misalima i brevijarima, zaključeno je da su neki od njih potvrđeni i ranije, npr. betegь, kaštigati, praviti, gorup, tanac itd. To je potvrda o kontinuitetu hrvatskoglagoljske književnosti. Interpolacija kajkavizama nije ujednačena u svim dijelovima zbornika, kajkavske su intervencije najčešće u Cvetu od kreposti (f. 67 – 85) i u Muci Spasitelja našega (f. 109 – 161). Na temelju provedenog istraživanja može se zaključiti da je Tkonski zbornik rukopis sastavljen iz različitih dijelova, koji nisu nastali u istom razdoblju, ni na istom mjestu. Budući da kajkavizme u pojedinim dijelovima nalazimo na svim razinama (Cvet od kreposti i Muka), može se pretpostaviti da su oni nastali u sjevernom području, tj. bliže kajkavskom.
U radu se iznose tzv. lažni parovi (prijatelji), leksemi u hrvatskom i rumunjskom jeziku koji zbog svoje izrazne podudarnosti navode na pogrešno prevođenje. Navode se značajke koje su dovele do takvih pojava. S obzirom na podrijetlo, najčešće je riječ o leksemima naslijeđenima iz latinskoga jezika ili kasnijim romanizmima te dakako slavenskima, kojih je u rumunjskome nezanemariv broj. Izdvojeni se leksemi razvrstavaju u tablicu koja omogućuje njihovu prozirniju usporedbu i lakše prepoznavanje.