Ontology-based Information Extraction with SOBA
- In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.
Verfasserangaben: | Paul BuitelaarGND, Philipp Cimiano, Stefania Racioppa, Melanie SiegelORCiDGND |
---|---|
URN: | urn:nbn:de:hebis:30:3-236537 |
URL: | http://www.melaniesiegel.de/publications/lrec2006.SmartWeb.final.pdf |
URL: | http://www.lrec-conf.org/proceedings/lrec2006/ |
Titel des übergeordneten Werkes (Englisch): | Proceedings of LREC 2006 |
Verlag: | European Language Resources Association |
Verlagsort: | Paris |
Dokumentart: | Konferenzveröffentlichung |
Sprache: | Englisch |
Datum der Veröffentlichung (online): | 20.12.2011 |
Jahr der Erstveröffentlichung: | 2006 |
Veröffentlichende Institution: | Universitätsbibliothek Johann Christian Senckenberg |
Datum der Freischaltung: | 20.12.2011 |
GND-Schlagwort: | Computerlinguistik; Suchmaschine; Ontologie <Wissensverarbeitung> |
Seitenzahl: | 4 |
Erste Seite: | 2321 |
Letzte Seite: | 2324 |
HeBIS-PPN: | 416404138 |
Institute: | Extern |
DDC-Klassifikation: | 4 Sprache / 41 Linguistik / 410 Linguistik |
4 Sprache / 41 Linguistik / 418 Standardsprache; Angewandte Linguistik | |
Sammlungen: | Linguistik |
Linguistik-Klassifikation: | Linguistik-Klassifikation: Computerlinguistik / Computational linguistics |
Lizenz (Deutsch): | Deutsches Urheberrecht |