Extraktion und Visualisierung von semantischen Informationen aus Wikis

  • Diese Diplomarbeit hatte das Ziel ein Konzept zu erstellen, welches es ermöglicht, interessante und weniger interessante Artikel innerhalb eines Wikis zu erkennen und diese Informationen in verständlicher Form zur Recherche visuell bereitzustellen. Dabei sollte das Konzept möglichst offen sein, so dass theoretisch jedes Wiki an die Visualisierung hätte angebunden werden können. Hier lag bereits das erste Problem, zum Zeitpunkt der Arbeit existieren bereits mehr als 100 unterschiedliche Wikis mit unterschiedlichen Architekturen. Wegen der Unterschiede der jeweiligen Wikisysteme entschloss man sich daher zwei Konzepte zu erarbeiten, ein allgemeines, welches wie in der gestellten Zielsetzung, das Einbinden jedes Wikis ermöglicht und ein Spezialfall, der die Vorteile einer API nutzt. Der Spezialfall wurde in ähnlicher Form in einer Implementierung umgesetzt. Zu Beginn der Diplomarbeit mussten die unterschiedlichen Möglichkeiten der Extraktion von Informationen aus einem Wiki untersucht werden. Es hatte sich ziemlich früh herausgestellt das Links, Backlinks sowie Kategorien wichtige Indikatoren zur Bewertung eines Artikels darstellen. Damit die Bewertung der Informationen nicht nur alleine auf der Struktur eines Wikis beruht, wurde ein Thesaurus zur unterstützenden Bewertung miteinbezogen. Dieser lieferte durchgehend gute Ergebnisse, wobei - wie erwartet - der Thesaurus sehr schnell an seine Grenzen gekommen war, insbesondere wenn man die Anzahl der Artikel eines großen Wikis mit der Anzahl der Wörter die im Thesaurus gespeichert sind vergleicht. Die extrahierten und gewichteten Informationen wurden im zweiten Schritt visualisiert, dabei hatte sich der Radial-Graph als eine gute Lösung zur Darstellung der Informationen herausgestellt. Neben einem Graphen mit gewichteten Knoten wurden in der Visualisierung unterschiedliche Ansichten der extrahierten Daten bereitgestellt: eine Autorenansicht, die zum gesuchten Artikel die Autoren darstellt, eine semantische Ansicht, die Wortbeziehungen veranschaulicht sowie eine Artikelansicht, die den Nutzer neben den gewichteten Artikeln auch wie gewohnt in einer Wiki lesen lässt.

Volltext Dateien herunterladen

  • ausarbeitung-9.pdf
    deu

Metadaten exportieren

Weitere Dienste

Teilen auf Twitter Suche bei Google Scholar
Metadaten
Verfasserangaben:Arkadius E. Grycko
URN:urn:nbn:de:hebis:30:3-421859
URL:http://www.gdv.informatik.uni-frankfurt.de/abschlussarbeiten/download/2008-19/ausarbeitung.pdf
Gutachter*in:Detlef KrömkerGND
Betreuer:Jörg Demmer, Sarah Voß
Dokumentart:Diplomarbeit
Sprache:Deutsch
Datum der Veröffentlichung (online):23.11.2016
Jahr der Erstveröffentlichung:2009
Veröffentlichende Institution:Universitätsbibliothek Johann Christian Senckenberg
Titel verleihende Institution:Johann Wolfgang Goethe-Universität
Datum der Freischaltung:23.11.2016
Seitenzahl:188
Bemerkung:
Diese Arbeit dürfen wir leider (aus urheberrechtlichen Gründen) nicht außerhalb der UB anbieten, benutzen Sie ersatzweise die o.g. URL.
HeBIS-PPN:396794629
Institute:Informatik und Mathematik / Informatik
DDC-Klassifikation:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Sammlungen:Universitätspublikationen
Lizenz (Deutsch):License LogoArchivex. zur Lesesaalplatznutzung § 52b UrhG