Bioinformatische Analyse von multidimensionalen Mikrobiom- und Gesundheitsdaten unter Anwendung von Deep Learning-Verfahren
- Die Bedeutung und der Einfluss des Darmmikrobiomes für den menschlichen Körper rückt in den letzten Jahren immer mehr in den Fokus der Forschung. Studien zeigen Zusammenhänge zwischen Veränderungen im Mikrobiom und dem Lebensstil oder dem Vorhandensein von Krankheiten auf. Mikrobiomanalysen ermöglichen das Identifizieren von charakteristischen Profilen oder Markern. Diese können die Früherkennung unterstützen oder Ansätze für Therapien liefern. Diabetes mellitus Typ 2 ist eine der weltweit häufigsten Erkrankungen. Diese führt zu einer Vielzahl von Folgeerkrankungen, wie Schlaganfälle oder Nierenversagen. Die Volkskrankheit stellt somit eine große Herausforderung für das Gesundheitssystem dar. Zusätzlich wird Diabetes mellitus Typ 2 meist sehr spät diagnostiziert. Die Untersuchung der Zusammenhänge zwischen dem Darmmikrobiom und Diabetes mellitus Typ 2 führen zu einem besseren Verständnis der molekularen Wechselwirkungen und Mechanismen. Dies unterstützt eine erfolgreiche Behandlung und Entwicklung von Medikamenten, auch über Diabetes mellitus Typ 2 hinaus. Neben der Betrachtung von einzelnen Bakterien oder ganzen taxonomischen Ebenen ist die Einbeziehung der bakteriellen Pathways wichtig. Diese verknüpfen anhand ihrer biologischen Funktion einzelne Bakterien miteinander. Ziel der vorliegenden Arbeit war statistisch signifikante Korrelationen zwischen der Zusammensetzung des Darmmikrobioms im Menschen und der Ausbildung von Diabetes mellitus Typ 2 mittels statistischer Methoden und Methoden des maschinellen Lernens zu finden und zu charakterisieren. Der erste Schritt bestand in der Detektion der vorhandenen Bakterien und der dazugehörige Pathways aus Stuhlproben durch Next Generation Sequencing von 16S rDNA. Diese wurden anschließend durch eine Analyse-Pipeline zu einem Mikrobiomprofil zusammengefasst. Die Zuordnung der beteiligten Pathways erfolgte anhand der identifizierten Genfamilien. Statistische Methoden, wie der Student t-Test oder Clusteranalysen, dienten der Ermittlung von signifikanten Unterschieden. Berücksichtigt wurden dabei nicht nur einzelne Bakterien, sondern auch das funktionelle Mikrobiom. Somit konnte ein umfassendes Profil erstellt werden. Die Hauptkomponentenanalyse wurde verwendet, um die Variabilität in den mikrobiellen Daten zu reduzieren und wichtige Muster oder Gruppierungen zu identifizieren. Das k-means-Clustering ermöglichte die Identifikation von Clusterstrukturen innerhalb der Mikrobiomdaten, während t-distributed Stochastic Neighbor Embedding und Uniform Manifold Approximation and Projection die Visualisierung der multidimensionalen Daten in einem zweidimensionalen Raum ermöglichten. Zur Bestimmung der Diversität im Darmmikrobiom wurden verschiedene Metriken, wie der Shannon-Entropy und die inverse Simpson-Korrelation, verwendet. Diese erlaubten es, die Artenvielfalt und die gleichmäßige Verteilung der Mikroorganismen zu bewerten. Darüber hinaus wurden auch fortgeschrittene Methoden des maschinellen Lernens eingesetzt. Diese Methoden ermöglichten eine prädiktive Modellierung sowie die Identifikation von wichtigen Merkmalen im Zusammenhang mit dem Darmmikrobiom bei Diabetes mellitus Typ 2, aus komplexen, heterogenen Daten. Ein entwickeltes künstliches neuronales Netz bildete die Grundlage für weitergehende Untersuchungen. Die Identifikation von relevanten bakteriellen Pathways für die Klassifikation ermöglichte die Ermittlung von biologisch funktionalen Zusammenhängen. Dazu wurde eine Analyse zur Merkmalsbedeutung über einen spieltheoretischen Ansatz (SHapley Additive exPlanations) angewendet. Die zusätzliche Analyse von assoziierten Gesundheitsdaten unterstützten die Erkennung von Wechselwirkungen und Einflüssen. Dazu fanden ebenfalls sowohl klassische statistische Methoden als auch maschinelles Lernen Anwendung. Mittels des Chi-Square-Tests und kategorischer Boostingverfahren konnten wichtige Merkmale detektiert werden. Die Methoden wurden wegen ihrer Eignung, Zusammenhänge in kategorischen Merkmalen zu detektieren, ausgewählt. Die Wahl der Methoden erfolgte aufgrund ihrer Eignung zur Analyse von komplexen mikrobiellen Datensätzen und ihrer Fähigkeit, Muster und Zusammenhänge in den Daten zu identifizieren. Die Kombination aus klassischen statistischen Methoden und Methoden des maschinellen Lernens ermöglichte eine umfassende Untersuchung des Darmmikrobioms im Zusammenhang mit Diabetes mellitus Typ 2.
Author: | Julienne SiptrothORCiDGND |
---|---|
URN: | urn:nbn:de:hebis:30:3-881911 |
DOI: | https://doi.org/10.21248/gups.88191 |
Place of publication: | Frankfurt am Main |
Referee: | Ina KochORCiD, Heike PospisilORCiD |
Document Type: | Doctoral Thesis |
Language: | German |
Date of Publication (online): | 2025/01/09 |
Year of first Publication: | 2024 |
Publishing Institution: | Universitätsbibliothek Johann Christian Senckenberg |
Granting Institution: | Johann Wolfgang Goethe-Universität |
Date of final exam: | 2024/07/10 |
Release Date: | 2025/01/09 |
Page Number: | 143 |
HeBIS-PPN: | 525162097 |
Institutes: | Informatik und Mathematik |
Dewey Decimal Classification: | 0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik |
5 Naturwissenschaften und Mathematik / 51 Mathematik / 510 Mathematik | |
Sammlungen: | Universitätspublikationen |
Licence (German): | Deutsches Urheberrecht |