Universitätspublikationen
Refine
Year of publication
- 2021 (11) (remove)
Document Type
- Bachelor Thesis (11) (remove)
Has Fulltext
- yes (11) (remove)
Is part of the Bibliography
- no (11)
Keywords
- Annotation (1)
- BIM (1)
- Bitcoin (1)
- Charge change (1)
- Cognitive Maps (1)
- Cognitive Spatial Distortions (1)
- Gabor Lens (1)
- Informationelle Ungewissheit (1)
- IsoSpace (1)
- LDPC Codes (1)
Institute
- Informatik und Mathematik (4)
- Physik (3)
- Informatik (2)
- Mathematik (1)
- Wirtschaftswissenschaften (1)
The aim of this bachelor thesis is to compare and empirically test the use of classification to improve the topic models Latent Dirichlet Allocation (LDA) and Author Topic Modeling
(ATM) in the context of the social media platform Twitter. For this purpose, a corpus was classified with the Dewey Decimal Classification (DDC) and then used to train the topic models. A second dataset, the unclassified corpus, was used for comparison. The assumption that the use of classification could improve the topic models did not prove true for the LDA topic model. Here, a sufficiently good improvement of the models could not be achieved. The ATM model, on the other hand, could be improved by using the classification. In general, the ATM model performed significantly better than the LDA model. In the context of the social media platform Twitter, it can thus be seen that the ATM model is superior to the LDA model and can additionally be improved by classifying the data.
Diese Arbeit beschäftigt sich mit der Wasserkühlung einer normalleitenden CH-Kavität. Insbesondere stellt sich die Frage, ob die im CST Thermal Steady State Solver simulierten Temperaturen mit Messungen während High Power Tests übereinstimmen. Zusätzlich interessiert, inwiefern die Temperatur über die dissipierte Leistung aus dem CST Eigenmode Solver und dem gemessenen Volumenstrom im Kanal abgeschätzt werden kann. In dem Kontext wird auch geklärt, ob die Reihenschaltung der Mantelkanäle den Kühlanforderungen genügt.
Neben Volumenstrom- und Druckmessungen an den in Reihe und parallelgeschalteten Kanälen werden die Leistungs- und Temperaturwerte der Konditionierung in sämtlichen Simulationen aufgegriffen. Indem die Kavität in einzelne Sektionen unterteilt wird und in diesen die dissipierte Leistung mit dem Eigenmode Solver simuliert wird, die ein Kühlkanal abführt, werden die Temperaturerhöhungen direkt berechnet und verglichen.
Zusammengefasst hat sich der Durchfluss in kritischen Bauteilen wie den Stützen durch die Reihenschaltung der Mantelkanäle erhöht und wird damit empfohlen. Es werden die simulierten Temperaturverteilungen gezeigt. Die Näherung über den Eigenmode Solver liefert erneut für die thermisch belasteten Bauteile wie die Stützen präzise Vorhersagen.
Abschließend werden Erfahrungen aus dem Institut in dieser Arbeit zusammengetragen und die Verwendung des Steady State Solver freigegeben.
Ein aktuelles Forschungsthema ist die automatische Generierung von 3D-Szenen ausgehend von Beschreibungen in natürlicher Sprache. S.g. Text2Scene-Anwendungen sollen Objekte und räumliche Relationen in einer Texteingabe identifizieren und mit 3D-Modellen eine visuelle Repräsentation der Beschreibung konstruieren. Bisherige Ansätze kombinieren eine
stichwortbasierte Erkennung von explizit gemachten Angaben mit vorher gelerntem Allgemeinwissen über die sinnvolle Anordnung von Objekten. Den Anwendungen fehlt jedoch ein tiefergehendes Verständnis von räumlicher Sprache.
Mit dem Annotationsschema ISOSpace können Texte mit detaillierten räumlichen Informationen angereichert und so für NLP-Anwendungen verständlicher gemacht werden. Bereits in einer früheren Arbeit wurde der SemAF-Annotator zum Erstellen von ISOSpaceAnnotationen als Modul für den TextAnnotator entwickelt. In dieser Arbeit wurde der SemAF-Annotator zusätzlich um eine Funktionalität zur Szenenerstellung erweitert: Benutzer können einzelnen Wörtern in der Weboberfläche des TextAnnotators Objekte aus dem ShapeNet Datensatz zuordnen und diese in einer zweidimensionalen Darstellung einer Szene räumlich anordnen. Trotz einiger Einschränkungen durch die fehlende dritte Dimension lassen sich in vielen Fällen gute Ergebnisse erzielen. Die auf diese Weise erzeugten Szenen sollen später in Kombination mit den ISOSpace-Annotionen verwendet werden, um Text2SceneAnwendungen zu entwickeln, die ein umfassenderes räumliches Verständnis aufweisen.
Kleinere Nebenaufgaben dieser Arbeit waren die Erweiterung des SemAF-Annotators um zusätzliche Annotationstypen sowie diverse Nachbesserungen der bereits bestehenden Funktionalität zur ISOSpace Annotation.
Principles of cognitive maps
(2021)
This thesis analyses the concept of a cognitive map in the research fields of geography. Cognitive mapping research is essential as it investigates the relations between cognitive maps and external representations of space that people regularly use by acquiring spatial knowledge, such as maps in geographic information systems. Moreover, cognitive maps, when expanded on semantic maps, explain the relations between people and things in a non-physically environment, where the considered space is not spanned by distance but with other non-spatially variables. Nevertheless, cognitive maps are often distorted. Although a good formation of a cognitive map is vital in navigation processes, cognitive distortions are barely investigated in the field of geography. By analyzing the relevant work, especially Tobler’s first law of geography, a new lexical variant of Tobler’s first law could be stated that could presumably describe a specific distortion in the processing of landmarks in cognitive maps.
When we browse via WiFi on our laptop or mobile phone, we receive data over a noisy channel. The received message may differ from the one that was sent originally. Luckily it is often possible to reconstruct the original message but it may take a lot of time. That’s because decoding the received message is a complex problem, NP-hard to be exact. As we continue browsing, new information is sent to us in a high frequency. So if lags are to be avoided and as memory is finite, there is not much time left for decoding. Coding theory tackles this problem by creating models of the channels we use to communicate and tailor codes based on the channel properties. A well known family of codes are Low-Density Parity-Check codes (LDPC codes), they are widely used in standards like WiFi and DVB-T2. In practical settings the complexity of decoding a received message can be heavily reduced by using LDPC codes and approximative decoding algorithms. This thesis lays out the basic construction of LDPC codes and a proper decoding using the sum-product algorithm. On this basis a neural network to improve decoding is introduced. Therefore the sum-product algorithm is transformed into a neural network decoder. This approach was first presented by Nachmani et al. and treated in detail by Navneet Agrawal in 2017. To find out how machine learning can improve the codes, the bit error rates of the trained neural network decoder are compared with the bit error rates of the classic sum-product algorithm approach. Experiments with static and dynamic training datasets of diverse sizes, various signal-to-noise ratios, a feed forward as well as a recurrent architecture show how to tune the neural network decoder even further. Results of the experiments are used to verify statements made in Agrawal’s work. In addition, corrections and improvements in the area of metrics are presented. An implementation of the neural network to facilitate access for others will be made available to the public.
In dieser Bachelorarbeit werden verschiedene Methoden zur Bestimmung der Betriebsfrequenz von CH-Kavitäten untersucht. Aufgrund der geometrisch komplexen Form der Beschleunigungsstruktur, können die Eigenfrequenzen nicht mithilfe von analytischen Methoden bestimmt werden. Üblicherweise werden die Eigenfrequenzen, ihre Ladungsund Stromdichten, sowie die elektromagnetischen Felder über numerische Methoden der Computational Electromagnetics (CEM) ermittelt. Die CEM ist eine junge Disziplin, deren Performanz und Anwendungsgebiete in den letzten 20 Jahren rapide gewachsen sind. Hauptverantwortlich hierfür ist zum einen das exponentielle Wachstum der Rechenleitung bei gleichbleibenden Kosten, zum anderen die Entwicklung und Verbesserung der Algorithmen. Bis zum Ende des letzten Jahrhunderts wurden elektronische Komponenten hauptsächlich dadurch entwickelt, indem Prototypen angefertigt und analysiert wurden. Diese zeitaufwendige und kostspielige Herangehensweise ist heutzutage nahezu vollständig durch CEM-Simulationen ersetzt worden. Die Hauptmethoden der CEM sind die Finite-Differenzen-Methode (FDM), die Momenten-Methode (MoM) und die Finite-Elemente-Methode (FEM). Für die Bestimmung der Eigenwerte und Eigenvektoren der Beschleunigungsstrukturen eignet sich aufgrund der Stabilität von diesen Dreien am besten die Methode der finiten Elemente. Da die FEM ein rechen- und speicherintensives Verfahren ist, wurde in dieser Arbeit nach einer schnelleren Methode gesucht, um die Betriebsfrequenz von CH-Kavitäten zu bestimmen. Hierfür wurden 84 CH-Kavitäten mithilfe von CST Studio Suite erstellt und simuliert. Es handelt sich hierbei um vier Grundtypen, drei wurden bei einer fixierten Sollfrequenz von 300 MHz konstruiert; die Sollfrequenz des vierten Grundtyps betrug 175 MHz. Die Teilchengeschwindigkeit wurde jeweils in 0,01er-Schrtitten von 0,05 c bis 0,25 c variiert. Aus den Untersuchungen der EM-Felder wurde anschließend ein semi-analytisches Modell entwickelt, das aufgrund der Geometrie der CH-Kavität die Betriebsfrequenz liefern soll.
In dieser Arbeit werden 4,6 Millionen englische Tweets, welche das Keyword „Bitcoin“ enthalten, analysiert und der Zusammenhang zwischen dem Sentiment der Tweets und den Renditen des Bitcoin untersucht. Zur Bestimmung der Sentiment-Klassen werden Text-Klassifizierer mit verschiedenen Ansätzen, darunter auch auf Convolutional Neural Networks und Transformern basierende Modelle, in diesem Kontext evaluiert und optimiert. Es wird außerdem ein Meta-Modell konstruiert, welches beim Problem der Sentiment-Klassifikation von Tweets in drei Klassen {Positiv, Negativ, Neutral} in der betrachteten Domäne besser abschneidet, als die anderen begutachteten Modelle. Bezüglich des Zusammenhangs wird im Speziellen auch der Einfluss von Merkmalen der Tweets und ihrer Verfassern anhand der Distanzkorrelation untersucht.
Szenen automatisch aus Texten generieren zu können ist eine interessante Aufgabe der Informatik. Für diese Aufgabe wurde VANNOTATOR (Mehler und Abrami 2019, Abrami, Spiekermann und Mehler 2019, Spiekermann, Abrami und Mehler 2018) entwickelt, ein Framework, das die Beschreibung bzw. Beschriftung von VR-Szenen ermöglicht. Damit für diese Szenen die benötigten 3D-Objekte bereitgestellt werden können, sind entsprechende Datenbanken vonnöten. Diese Datenbanken müssen umfangreich annotiert sein, damit diese Aufgabe bewältigt werden kann. Deshalb wurde im Falle des VANNOTATORs auf die ShapeNetSem Datenbank zurückgegriffen (Abrami, Henlein, Kett u. a. 2020).
Je detailreicher eine Szene dargestellt wird, desto detailreicher kann diese auch durch einen Text beschrieben werden. Aus diesem Grund wird die Datenbank um einen Teilbereich von PartNet (Mo u. a. 2019) erweitert. Dieser erlaubt die Option, Objekte zu segmentieren, und erweitert hierdurch das annotierbare Vokabular. Manche der bereits vorhandenen ShapeNetSem-Objekte verfügen über die Eigenschaft, dass sie auch PartNet-Objekte sind. Diese Arbeit befasst sich mit der Umsetzung, wie ShapeNetSem-Objekte mit hinterlegten PartNetObjekten durch diese ersetzt werden können. Um das zu bewerkstelligen, wurde ein Panel entworfen, in welchem ein PartNet-Objekt mit samt seinen einzelnen Segmenten aufgeführt wird. Diese Segmente können nun wie ShapeNetSem-Objekte ausgewählt und in einer Szene platziert werden. Dadurch werden 1.881 Objekte mit wiederum 34.016 Unterobjekten VANNOTATOR zur Verfügung gestellt. Dieses vergrößerte Vokabular hilft Natural Language Processing noch effektiver und präziser voranzutreiben.
In der Arbeit wird das Certainty-Tool, eine Erweiterung für den Unity-basierten Teil des Stolperwege Projektes, vorgestellt. Dieses verfolgt die Idee des VAnnotatoR weiter und erlaubt die Visualisierung von informationeller Ungewissheit der im Stolperwege-Praktikum digital rekonstruierten Gebäude. Dabei inkorporiert das Tool das Konzept hinter BIM (Building Information Modelling), eine neuartige Methode der Planung in der AEC-Branche, welches ein Selbstbewusstsein von Informationen für Teile eines Gebäudes ermöglicht. Dabei werden im Certainty-Tool Stufen der informationellen Ungewissheit entwickelt und diese auf Teile des Gebäudes zugewiesen. Das Tool wird anhand einer digitalen Rekonstruktion des zerstörten Rothschild-Palais vorgestellt. Des Weiteren wurde eine Evaluation basierend auf der Usability Metric for User Experience durchgeführt und weiterführende Entwicklungen und Verbesserungen des Tools diskutiert.
Over the course of the last financial crises, retail investors have been identified to bear a major share of the invoked financial losses. As a consequence, financial market regulators put major effort on retail investor protection, especially following the Great Financial Crisis of 2007-2009. The major legislative initiatives, such as in the Dodd-Frank Act in the United States, seemingly manifest retail investors’ overly fragile role among the variety of professional investors in the financial market by establishing additional protection requirements for retail investors. A vast majority of related international academic literature is supporting those steps. However, considering the most recent developments that occurred in the US financial markets, the dogma of the lamb-like retail investor seems to be crumbling: In 2021, under the synonym “WallStreetBets” retail investors systematically colluded in investment bets which eventually disrupted not only financial markets by distorting stock price formation of single firms but also systematically squeezed sizeable positions of institutional investors. The key question arises, how retail investors have changed, such that they not only became a source of price distortions and market turmoil but also endanger professional institutional investors. In this thesis, I study this changing role and investment behavior of retail investors, taking into account the retail investor’s wellestablished and researched behavioral characteristics to the changing environmental aspects such as regulation and the adaption and usage of technology for information gathering and collaboration. Based on the combination of those different research streams, I am able to deduct the sequential consequences of these developments for financial markets.