Automatische Disambiguation für das Englische
- Begriffe sind häufig nicht eindeutig. Eine „Bank“ kann ein Finanzinstitut oder eine Sitzgelegenheit sein und die Stadt Frankfurt existiert mehr als einmal. Dennoch können sie in vielen Fällen problemlos von Menschen unterschieden werden. Computer sind noch nicht in der Lage, diese Leistung mit vergleichbarer Genauigkeit zu erfüllen. Der in dieser Arbeit vorgestellte Ansatz baut auf dem für das Deutsche bereits gute Ergebnisse erzielenden fastSense auf und verwendet ein neuronales Netz, um Namen und Begriffe in englischen Texten mit Hilfe der Wikipedia zu disambiguieren. Dabei konnte eine Genauigkeit von bis zu 89,5% auf Testdaten erreicht werden. Mit dem entwickelten Python-Modul kann das trainierte Modell in bestehende Anwendungen eingebunden werden. Die im Modul enthaltenen Programme ermöglichen es, neue Modelle zu trainieren und zu testen.
Author: | Clemens Schulz |
---|---|
URN: | urn:nbn:de:hebis:30:3-589182 |
Place of publication: | Frankfurt am Main |
Referee: | Alexander MehlerORCiDGND, Tolga UsluGND |
Document Type: | Bachelor Thesis |
Language: | German |
Date of Publication (online): | 2021/02/19 |
Year of first Publication: | 2018 |
Publishing Institution: | Universitätsbibliothek Johann Christian Senckenberg |
Granting Institution: | Johann Wolfgang Goethe-Universität |
Date of final exam: | 2018/04/19 |
Release Date: | 2021/03/18 |
Page Number: | 59 |
HeBIS-PPN: | 477785751 |
Institutes: | Informatik und Mathematik |
Dewey Decimal Classification: | 0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik |
4 Sprache / 42 Englisch, Altenglisch / 420 Englisch, Altenglisch | |
Sammlungen: | Universitätspublikationen |
Licence (German): | Deutsches Urheberrecht |