Geotagging und Ontologie-basierte Visualisierung für das TextImaging

Alves Zipf, Pedro

Zielsetzung dieser Arbeit ist es Nutzern, ohne Programmierkenntnisse oder Fachwissen im Bereich der Informatik, Zugang zu der automatischen Verarbeitung von Texten zu gewährleisten. Speziell soll es um Geotagging, also das Referenzieren verschiedener Objekte auf einer Karte, gehen. Als Basis soll ein ontologisches Modell dienen, mit Hilfe dessen Struktur die Objekte in Klassen eingeteilt werden. Zur Verarbeitung des Textes werden NaturalLanguage Processing Werkzeuge verwendet. Natural Language Processing beschreibt Methoden zur maschinellen Verarbeitung natürlicher Sprache. Sie ermöglichen es, die in Texten enthaltenen unstrukturierten Informationen in eine strukturierte Form zu bringen. Die so erhaltenen Informationen können für weitere maschinelle Verarbeitungsschritte verwendet oder einem Nutzer direkt bereitgestellt werden. Sollten sie direkt bereitgestellt werden, ist es ausschlaggebend, sie in einer Form zu präsentieren, die auch ohne Fachkenntnisse oder Vorwissen verständlich ist. Im Bereich der Geographie wird oft der Ansatz befolgt, die erhaltenen Informationen auf Basis verschiedener Karten, also visuell zu verarbeiten. Visualisierungen dienen hierbei der Veranschaulichung von Informationen. Durch sie werden die relevanten Aspekte dem Nutzer verdeutlicht und so die Komplexität der Informationen reduziert. Es bietet sich also an, die durch das Natural Language Processing gesammelten Informationen in Form einer Visualisierung für den Nutzer zugänglich zu machen. Im Rahmen dieser Arbeit über Geotagging und Ontologie-basierte Visualisierung für das TextImaging wird ein Tool entwickelt, das diese Brücke schlägt. Die Texte werden auf einer Karte visualisiert und bieten so eine Möglichkeit, beschriebene geographische Zusammenhänge auf einen Blick zu erfassen. Durch die Kombination der Visualisierung auf einer Karte und der Markierung der entsprechenden Entitäten im Text kann eine zuverlässige und nutzerfreundliche Visualisierung erzeugt werden. Bei einer abschließenden Evaluation hat sich gezeigt das mit dem Tool der Zeitaufwand und die Anzahl der fehlerhaften Annotationen reduziert werden konnte.Die von dem Tool gebotenen Funktionen machen dieses auch für weiterführende Arbeiten interessant. Eine Möglichkeit ist die entwickelten Annotatoren zu verwenden um ein ontology matching auf Basis bestimmter Texte auszuführen. Im Bereich der Visualisierung bieten sich Projekte wie die Visualisierung historischer Texte auf Basis automatisch ermittelter, zeitgerechter Karten an.

Verfasserangaben:	Pedro Alves Zipf
URN:	urn:nbn:de:hebis:30:3-549404
Verlagsort:	Frankfurt am Main
Gutachter*in:	Alexander Mehler ORCiD GND, Hendrik Drachsler ORCiD GND
Betreuer:	Alexander Mehler, Giuseppe Abrami
Dokumentart:	Bachelorarbeit
Sprache:	Deutsch
Datum der Veröffentlichung (online):	06.08.2020
Jahr der Erstveröffentlichung:	2019
Veröffentlichende Institution:	Universitätsbibliothek Johann Christian Senckenberg
Titel verleihende Institution:	Johann Wolfgang Goethe-Universität
Datum der Abschlussprüfung:	16.09.2019
Datum der Freischaltung:	15.06.2020
Freies Schlagwort / Tag:	TTLab; TextAnnotator; TextImager
Seitenzahl:	45
HeBIS-PPN:	46552849X
Institute:	Informatik und Mathematik
DDC-Klassifikation:	0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Sammlungen:	Universitätspublikationen
Lizenz (Deutsch):	Deutsches Urheberrecht

Open Access

Geotagging und Ontologie-basierte Visualisierung für das TextImaging

Volltext Dateien herunterladen

Metadaten exportieren

Weitere Dienste