TY - THES A1 - Adler, Alexander T1 - Anan — a debugger for compute clusters N2 - Das Projekt anan ist ein Werkzeug zur Fehlersuche in verteilten Hochleistungsrechnern. Die Neuheit des Beitrags besteht darin, dass die bekannten Methoden, die bereits erfolgreich zum Debuggen von Soft- und Hardware eingesetzt werden, auf Hochleistungs-Rechnen übertragen worden sind. Im Rahmen der vorliegenden Arbeit wurde ein Werkzeug namens anan implementiert, das bei der Fehlersuche hilft. Außerdem kann es als dynamischeres Monitoring eingesetzt werden. Beide Einsatzzwecke sind getestet worden. Das Werkzeug besteht aus zwei Teilen: 1. aus einem Teil namens anan, der interaktiv vom Nutzer bedient wird 2. und aus einem Teil namens anand, der automatisiert die verlangten Messwerte erhebt und nötigenfalls Befehle ausführt. Der Teil anan führt Sensoren aus — kleine mustergesteuerte Algorithmen —, deren Ergebnisse per anan zusammengeführt werden. In erster Näherung lässt anan sich als Monitoring beschreiben, welches (1) schnell umkonfiguriert werden (2) komplexere Werte messen kann, die über Korrelationen einfacher Zeitreihen hinausgehen. KW - debugging KW - high performance computing KW - cluster computing Y1 - 2022 UR - http://publikationen.ub.uni-frankfurt.de/frontdoor/index/index/docId/69736 UR - https://nbn-resolving.org/urn:nbn:de:hebis:30:3-697361 ER -