Refine
Year of publication
Document Type
- Doctoral Thesis (27)
Has Fulltext
- yes (27)
Is part of the Bibliography
- no (27)
Keywords
- Computational chemistry (5)
- Arzneimitteldesign (3)
- Bioinformatik (3)
- Screening (3)
- Virtual Screening (3)
- Docking (2)
- Drug design (2)
- In silico-Methode (2)
- Molekulare Bioinformatik (2)
- Neuronales Netz (2)
Institute
- Biowissenschaften (14)
- Biochemie und Chemie (6)
- Pharmazie (6)
- Medizin (1)
In silico Methoden spielen in der Wirkstoffentwicklung eine immer größere Bedeutung. Sie können eine Größe Hilfe in der Analyse des Targets oder beim Screening von neuen Liganden sein. Ihre Stärken liegen vorallem in der Zeit- und Kostenreduzierung während einer
Wirkstoffentwicklung.
Ziel der Arbeit war die Entwicklung neuer COX-2 Liganden mit Hilfe von in silico Methoden. Weil von der mCOX-2 keine Kristallstruktur in der PDB publiziert war, begann die Arbeit mit der Modellierung der mCOX-2. Dafür wurde aus der Sequenz der hCOX-2 aus UniProt mit der ID P35354 mit Hilfe der Kristallstruktur 3LN1 ein Homologie Modell entwickelt und im Anschluss über eine Validierungsmethode, den Ramachandran Plot, analysiert. Der Ramachandran Plot zeigte, dass 93.7% der Aminosäuren in favorisierten Regionen, 6.1% in
erlaubten Regionen, 0.2% in geduldeten Regionen und 0.0% in unerlaubten Regionen lagen. Mit diesem Modell wurde eine MD-Simulation durchgeführt, um die Energie des Modells zu
minimieren.
Die neuen Verbindungen wurden über drei verschiedene Ansätze designt. Im ersten Ansatz wurde die Software DOGS verwendet. Dabei handelt es sich um ein de novo Design Programm, welches nicht nur neue Verbindungen entwickelt, sondern auch deren Syntheseweg vorschlägt. Die vorgeschlagenen Verbindungen wurden über eine Docking-Studie analysiert, wobei die Verbindungen aus Abbildung 15 identifiziert werden konnten. Verbindung 22 wurde ohne weitere Variationen synthetisiert. Die Verbindungen 71 und 86 wurden aus der modellierten Verbindung 87, welche von DOGS vorgeschlagen wurde, weiterentwickelt. Dabei wurde Verbindung 71 als ein Fragment von Verbindung 85 entwickelt. Verbindung 86 wurde direkt aus Verbindung 87 entwickelt, wobei einige Variationen durchgenommen wurde. Hierbei sollte vorallem die Form von Verbindung 87 beibehalten werden.
Literatur verwendet, um ausgehend von den Verbindungen APHS und ASS neue COX-2 Inhibitoren zu entwickeln (siehe Abb. 16). Dabei wurden mehrere Verbindungen designt, wovon Verbindung 3 als ein leichter Inhibitor identifiziert werden konnte. 3 enthält keine für COX-Inhibitoren typische polare Gruppe, besitzt dafür aber eine Acetylgruppe, die gemäß in silico Untersuchungen in der Lage sein könnte, Ser530 in COX-2 zu acetylieren.
In der letzten Studie wurden mit Hilfe eines Fragment-basierten Designs neue Verbindungen entwickelt, wobei das Benzensulfonamid von Celecoxib aus der Kristallstruktur 1PTH extrahiert und mit kleinen Fragmente verknüpft wurde, welche zuvor über eine Docking-Studie analysiert wurden. Hieraus entwickelte sich Verbindung 35, die in einer kleinen SAR-Studie zu 70 optimiert werden konnte. Dabei konnte das Sulfonamid, welches typisch für Coxibe ist, gegen eine Carbonsäure ausgetauscht werden (69). Erst durch eine Vergrößerung der Verbindung um einen Benzyl-Rest am sekundären Amin von 69 führte zur potenten Verbindung 70.
Zusammenfassend konnten in dieser Arbeit fünf neue COX-2 Inhibitoren als Leitstrukturen entwickelt werden. Dabei kamen fortschrittliche in silico Methoden wie die De-Novo Design Software DOGS aber auch rationale Designmethoden zum Einsatz. Beide Methoden boten Vor- und Nachteile und haben jeweils zu guten Ergebnissen geführt. Bei der Entwicklung der vielversprechendsten Leitstrukturen 70 und 71 wurden die Vorteile beider Ansätze kombiniert.
Die Identifikation neuer Hits und Leitstrukturen sind die ersten Schritte bei der Entwicklung neuer Arzneistoffe. Dieser Herausforderung wird derzeit primär mittels High-Throughput-Screening oder der gezielten Modifikationen bekannter Liganden begegnet. Eine weitere Option ist das computerbasierte virtuelle Screening, das es kostengünstig ermöglicht, in kurzer Zeit sehr viele Moleküle auf ihre potentielle biologische Aktivität hin zu untersuchen. Der in dieser Arbeit verwendete Ansatz zur Identifikation neuer Inhibitoren der 5-Lipoxygenase und der Cyclooxygenase-2 beruht auf dem Verfahren des ligandenbasierten virtuellen Screenings. Unter der Voraussetzung der Kenntnis mindestens eines Referenzliganden können so mittels einer Ähnlichkeitsanalyse potentielle neue strukturelle Grundgerüste identifiziert werden. Zu diesem Zweck wurde ein auf atomaren Partialladungen und der dreidimensionalen Struktur der Moleküle basierender Deskriptor (Charge3D/TripleCharge3D) entwickelt. In retrospektiven Studien mit Cyclooxygenase-2 Inhibitoren wurde die Effektivität der neuen Deskriptoren überprüft und mittel eines evolutionären Algorithmus optimiert. Der Charge3D Deskriptor erreicht Anreicherungsfaktoren bis zu 16,1 im ersten Perzentil der durchsuchten Datenbank, wohingegen der TripleCharge3D Deskriptor mit seiner detailierteren Ladungsauftrennung Werte von bis zu 24,8 erreichte. Ein ebensolches retrospektives Screening wurde für 5-Lipoxygenase Inhibitoren durchgeführt. Den maximalen Anreicherungsfaktor von 6,1 im ersten Prozent der Datenbank erreichte hier der Charge3D Deskriptor, der TripleCharge3D Deskriptor erreichte 5,3. Diese wesentlich geringeren Werte sind auf die Diversität der 5-LO Inhibitoren (54 Inhibitoren mit 39 verschiedenen Grundgerüsten) und deren unterschiedliche Inhibitortypen (Redox, nicht Redox und Eisen-bindende Inhibitoren) mit ihren jeweiligen Bindemodi zurückzuführen. In Screenings nach 5-LO Inhibitoren in der Naturstoffdatenbank der Firma AnalytiCon Discovery und COX-25-LO Dualinhibitoren in Datenbanken der Firma Asinex konnten unter Verwendung der beiden Deskriptoren Inhibitoren, mit für diese Targets bislang unbekannten Scaffolds identifiziert werden. Unter Verwendung des 2D Pharmakophor Deskriptors CATS wurden zuerst zwei neue Scaffolds für Inhibitoren der 5-LO identifiziert. Struktur 1 ist den in vitro Assaydaten zufolge ein direkter Inhibitor der 5-LO. Struktur 2 hingegen erreicht seine Wirkung nicht nur über die direkte Interaktion mit der 5-LO. Eine Erklärung dafür wäre die Wechselwirkung mit dem 5-LO aktivierenden Protein FLAP, der Hemmung der Translokation der 5-LO zur Kernmembran, oder die Inhibition 5-LO aktivierender bzw. inaktivierender Kinasen. In nachfolgenden Screenings mit den Strukturen 1 und 2 als Referenzstrukturen konnten mittels der Charge Deskriptoren Substanzderivate (17 Moleküle) mit 5-LO inhibitorischer Wirkung (5 Moleküle mit IC50 Werte ≤ 1 μM an partiell aufgereinigter 5-LO), identifiziert werden. Für das Screening nach COX-2/5-LO Dualinhibitoren wurden 11 Strukturen mit 7 unterschiedlichen Scaffolds unter Verwendung der Charge Deskriptoren aus gewählt. Drei Moleküle zeigten keine 5-LO Aktivität, und jeweils eines nur in intakten PMNLs bzw. im S100 Zellüberstand. Die restlichen 6 Moleküle waren in beiden 5-LO Assays aktiv (intakte PMNLs IC50 zwischen 2 und 15 μM, S100 Zellüberstand 5-LO zwischen 0.5 μM und 25 μM). Somit zeigten 7 Moleküle im S100 Assay Aktivität und konnten als direkte Inhibitoren der 5-LO identifiziert werden. Im Cyclooxygenase-2 Aktivitätsassay mit intakten MonoMac6 Zellen zeigte eine der 11 Strukturen zudem eine geringe (IC50 = 70 μM) inhibierende Aktivität. Modifikationen zur Verbesserung der COX-2 Hemmung könnten in einem potenten COX-2/5-LO Dualinhibitor resultieren, der beispielsweise in der Schmerzbehandlung eingesetzt werden könnte. Ein weiteres Projekt war die Erstellung eines Homologiemodells der 5-LO basierend auf der 15-Lipoxygenase Struktur des Kaninchens (PDB-Struktur: 1LOX). Die Sequenzidentität der beiden Strukturen (1LOX / humane 5-LO) lag bei 37 %. Das Modell wurde zum einen zur Vorhersage von zugänglichen Caspase-6 Schnittstellen an der 5-LO angewandt, und zum anderen wurden Dockingexperimente in Aktiven Zentrum und in Bereichen der C2-like Domäne der 5-LO durchgeführt. Hyperforin, ein bekannter Inhibitor d er 5-Lipoxygenase, wurde an verschiedenen Stellen des Modells für Dockingexperiment eingebracht. Die im Aktiven Zentrum erreichten Scorewerte (Chemscore = -9±1) deuteten hier auf eine unfavorisierte Bindungsstelle hin. BWA4C (ein bekannter Eisenbinder) und ZM230487 (ein nicht-redox Inhibitor) erhielten im Aktiven Zentrum Scorewerte von 27±0,1 und 22±2,5, wodurch eine Bindung als wahrscheinlich angenommen werden kann. Weitere Dockingexperimente an der C2-like Domäne, und speziell am Interface zwischen der C2-like und der katalytischen Domäne, ergaben ähnlich hohe Chemscorewerte für Hyperforin, BWA4C und ZM230487. Aus diesen Resultaten ließ sich kein eindeutiger Bindemodus für Hyperforin ableiten. Eine Positionierung im Aktiven Zentrum ist nach diesen Experimenten unwahrscheinlich, so dass die Existenz einer weiteren, experimentell noch nicht identifizierten Bindestelle vermutet werden kann. Eine solche Interaktionsfläche könnte als Ansatzpunkt für die Entwicklung weiterer 5-Lipoxygenaseinhibitoren eine zentrale Rolle einnehmen.
This study focuses on structural features of a particular GPCR type, the family C GPCRs. Structure- and ligand-based approaches were adopted for prediction of novel mGluR5 binding ligand and their binding modes. The objectives of this study were: 1. An analysis of function and structural implication of amino acids in the TM region of family C GPCRs. 2. The prediction of the TM domain structure of mGluR5. 3. The discovery of novel selective allosteric modulators of mGluR5 by virtual screening. 4. The prediction of a ligand binding mode for the allosteric binding site in mGluR5. GPCRs are a super-family of structurally related proteins although their primary amino acid sequence can be diverse. Using sequence information a conservation analysis of family C GPCRs should be applied to reveal characteristic differences and similarities with respect function, folding and ligand binding. Using experimental data and conservation analysis the allosteric binding site of mGluR5 should be characterized regarding NAM and PAM and selective ligand binding. For further evaluation experimental knowledge about family A GPCRs as well as conservation between vertebrate rhodopsins was planned to be compared to results obtained for family C GPCRs (Section 4.1 Conservation analysis of family C GPCRs). Since no receptor structure is available for any family C GPCR, discussion of conserved sequence positions between family A and C GPCRs requires the prediction of a receptor structure for mGluR5 using a family A receptor as template. In order to predict the mGluR5 structure a sequence alignment to a GPCR template protein will have to be proposed and GPCR specific features considered in structure calculation (Section 4.1.4 Structure prediction of mGluR5). The obtained structure was intended to be involved in ligand binding mode prediction of newly discovered active molecules. For discovery of novel selective mGluR modulators several ligand-based virtual screening protocols were adapted and evaluated. Prediction models were derived for selection of possibly active molecules using a diverse collection of known mGluR binding ligands. For that purpose a data collection of known mGluR binding ligands should be established and this reference collection analyzed with respect to different ligand activity classes, NAM or PAM and selective modulators. The prediction of novel NAMs and PAMs using several combinations of 2D-, 3D-, pharmacophore or molecule shape encoding methods with machine learning techniques and similarity determining methods should be tested in a prospective manner (Section 4.2 Virtual screening for novel mGluR modulators). In collaboration with Merz Pharmaceuticals (Merz GmbH & Co. KGaA, Frankfurt am Main, Germany) the modulating effect of a few hundred molecules should be approved in a functional cell-based assay. With the objective to predict a binding mode of the discovered active molecules, molecule docking should be applied using the allosteric binding site of the modeled mGluR5 structure (Section 4.2.4 Modeling of binding modes). Predicted ligand binding modes are to be correlated to conservation profiles that had resulted from the sequence-based entropy analysis and information from mutation experiments, and shall be compared to known ligand binding poses from crystal structures of family A GPCRs.
The aim of the thesis was to identify structure activity relationships (SAR) in the primary screening data of high-throughput screening (HTS) assays. The strategy was to perform a hierarchical clustering of the molecules, assign the primary screening data to the created clusters and derive models from the clusters. The models should serve to identify singletons, clusters enriched with actives, not confirmed hits and false-negatives. Two hierarchical clustering algorithms, NIPALSTREE and hierarchical k-means have been developed and adapted for this purpose, respectively. A graphical user interface (GUI) has been implemented to extract SAR from the clustering results. Retrospective and prospective applications of the clustering approach were performed. SAR models were created by combining the clustering results with different chemoinformatic methods. NIPALSTREE projects a data set onto one dimension using principle component analysis. The data set is sorted according to the scoring vector and split at the median position into two subsets. The algorithm is applied recursively onto the subsets. The hierarchical k-means recursively separates a data set into two clusters using the k-means algorithm. Both algorithms are capable of clustering large data sets with more than a million data points. They were validated and compared to each other on the basis of different structural classes. NIPALSTREE provided with the loading vectors first insights into SAR whereas the hierarchical k-means yielded superior results. A GUI was developed allowing the display of and the navigation in the clustering results. Functionalities were integrated to analyse the clusters in the dendrogram, molecules in a cluster, and physicochemical properties of a molecule. Measures were developed to identify clusters enriched with actives, to characterize singletons and to analyse selectivity and specificity. Different protease inhibitors of the COBRA database were examined using the hierarchical k-means algorithm. Supported by similarity searches and nearest neighbour analyses thrombin inhibitor singletons were quickly isolated and displayed in the dendrogram. By scaling enrichment factors to the logarithm of the dendrogram level, clusters enriched with different structural classes of factor Xa inhibitors were simultaneously identified. The observed co-clustering of other protease inhibitors provided a deeper insight into selectivity and specificity and shows the utility of the approach for constructing focussed screening libraries. Specificity was analyzed by extracting and clustering relative frequencies of the protease inhibitors from the clusters of dendrogram level 7. A unique ligand based point of view on the pocketome of the protease enzymes was obtained. To identify not confirmed hits and false-negatives in the primary screening data of HTS assays, three assays were retrospectively analysed with the hierarchical k-means algorithm. A rule catalogue was developed judging hits in terminal clusters based on the cluster size, the percent control values of the entries in a cluster, the overall hit rate, the hit rate in the cluster and the environment of a cluster in the dendrogram. It resulted in the identification of a high proportion of not confirmed hits and provided for each hit a rating in context of related non-hits. This allows prioritizing compounds for follow-up studies. Non-hits and hits were retrieved from terminal clusters containing hits. Molecules bearing false-negative scaffolds were co-extracted and enriched. To minimize the number of false-positives in the extracted lists, Bayesian regularized artificial neutral network classification models were trained with the data. Applying the models marked improvement of enrichment factors for the false-negatives was obtained. It proofs the scaffold-hopping potential of the approach. NIPALSTREE, the hierarchical k-means algorithm and self-organising maps were prospectively applied to identify novel lead candidates for dopamine D3 receptors. Compounds with novel scaffolds and low nanomolar binding affinity (65 nM, compound 42) were identified. To provide a deeper insight into the SAR of these molecules, different alternative computational methods were employed. Support vector-based regression and partial least squares were examined. Predictive models for dopamine D2 and D3 receptor binding affinity values were obtained. Important features explaining SAR were extracted from the models. The prospective application of the models to the diverse and novel virtual screening data was of limited success only. Docking studies were performed using a homology model of the dopamine D3 receptor. The visual inspection of the binding modes resulted in the hypothesis of two alternative binding pockets for the aryl moiety of dopamine D3 receptor antagonists. A pharmacophore model was created simultaneously requiring both aryl moieties. Virtual screening with the model identified a nanomolar hit (65 nM, compound 59) corroborating the hypothesis of the two binding pockets and providing a new lead structure for dopamine D3 receptors. The presented data shows that the combined approach of hierarchically clustering a data set in combination with the subsequent usage of the clusters for model generation is suited to extract SAR from screening data. The models are successful in identifying singletons, clusters enriched with actives, not confirmed hits and false-negative scaffolds.
Virtual screening of potential bioactive substances using the support vector machine approach
(2005)
Die vorliegende Dissertation stellt eine kumulative Arbeit dar, die in insgesamt acht wissenschaftlichen Publikationen (fünf publiziert, zwei eingerichtet und eine in Vorbereitung) dargelegt ist. In diesem Forschungsprojekt wurden Anwendungen von maschinellem Lernen für das virtuelle Screening von Moleküldatenbanken durchgeführt. Das Ziel war primär die Einführung und Überprüfung des Support-Vector-Machine (SVM) Ansatzes für das virtuelle Screening nach potentiellen Wirkstoffkandidaten. In der Einleitung der Arbeit ist die Rolle des virtuellen Screenings im Wirkstoffdesign beschrieben. Methoden des virtuellen Screenings können fast in jedem Bereich der gesamten pharmazeutischen Forschung angewendet werden. Maschinelles Lernen kann einen Einsatz finden von der Auswahl der ersten Moleküle, der Optimierung der Leitstrukturen bis hin zur Vorhersage von ADMET (Absorption, Distribution, Metabolism, Toxicity) Eigenschaften. In Abschnitt 4.2 werden möglichen Verfahren dargestellt, die zur Beschreibung von chemischen Strukturen eingesetzt werden können, um diese Strukturen in ein Format zu bringen (Deskriptoren), das man als Eingabe für maschinelle Lernverfahren wie Neuronale Netze oder SVM nutzen kann. Der Fokus ist dabei auf diejenigen Verfahren gerichtet, die in der vorliegenden Arbeit verwendet wurden. Die meisten Methoden berechnen Deskriptoren, die nur auf der zweidimensionalen (2D) Struktur basieren. Standard-Beispiele hierfür sind physikochemische Eigenschaften, Atom- und Bindungsanzahl etc. (Abschnitt 4.2.1). CATS Deskriptoren, ein topologisches Pharmakophorkonzept, sind ebenfalls 2D-basiert (Abschnitt 4.2.2). Ein anderer Typ von Deskriptoren beschreibt Eigenschaften, die aus einem dreidimensionalen (3D) Molekülmodell abgeleitet werden. Der Erfolg dieser Beschreibung hangt sehr stark davon ab, wie repräsentativ die 3D-Konformation ist, die für die Berechnung des Deskriptors angewendet wurde. Eine weitere Beschreibung, die wir in unserer Arbeit eingesetzt haben, waren Fingerprints. In unserem Fall waren die verwendeten Fingerprints ungeeignet zum Trainieren von Neuronale Netzen, da der Fingerprintvektor zu viele Dimensionen (~ 10 hoch 5) hatte. Im Gegensatz dazu hat das Training von SVM mit Fingerprints funktioniert. SVM hat den Vorteil im Vergleich zu anderen Methoden, dass sie in sehr hochdimensionalen Räumen gut klassifizieren kann. Dieser Zusammenhang zwischen SVM und Fingerprints war eine Neuheit, und wurde von uns erstmalig in die Chemieinformatik eingeführt. In Abschnitt 4.3 fokussiere ich mich auf die SVM-Methode. Für fast alle Klassifikationsaufgaben in dieser Arbeit wurde der SVM-Ansatz verwendet. Ein Schwerpunkt der Dissertation lag auf der SVM-Methode. Wegen Platzbeschränkungen wurde in den beigefügten Veröffentlichungen auf eine detaillierte Beschreibung der SVM verzichtet. Aus diesem Grund wird in Abschnitt 4.3 eine vollständige Einführung in SVM gegeben. Darin enthalten ist eine vollständige Diskussion der SVM Theorie: optimale Hyperfläche, Soft-Margin-Hyperfläche, quadratische Programmierung als Technik, um diese optimale Hyperfläche zu finden. Abschnitt 4.3 enthält auch eine Diskussion von Kernel-Funktionen, welche die genaue Form der optimalen Hyperfläche bestimmen. In Abschnitt 4.4 ist eine Einleitung in verschiede Methoden gegeben, die wir für die Auswahl von Deskriptoren genutzt haben. In diesem Abschnitt wird der Unterschied zwischen einer „Filter“- und der „Wrapper“-basierten Auswahl von Deskriptoren herausgearbeitet. In Veröffentlichung 3 (Abschnitt 7.3) haben wir die Vorteile und Nachteile von Filter- und Wrapper-basierten Methoden im virtuellen Screening vergleichend dargestellt. Abschnitt 7 besteht aus den Publikationen, die unsere Forschungsergebnisse enthalten. Unsere erste Publikation (Veröffentlichung 1) war ein Übersichtsartikel (Abschnitt 7.1). In diesem Artikel haben wir einen Gesamtüberblick der Anwendungen von SVM in der Bio- und Chemieinformatik gegeben. Wir diskutieren Anwendungen von SVM für die Gen-Chip-Analyse, die DNASequenzanalyse und die Vorhersage von Proteinstrukturen und Proteininteraktionen. Wir haben auch Beispiele beschrieben, wo SVM für die Vorhersage der Lokalisation von Proteinen in der Zelle genutzt wurden. Es wird dabei deutlich, dass SVM im Bereich des virtuellen Screenings noch nicht verbreitet war. Um den Einsatz von SVM als Hauptmethode unserer Forschung zu begründen, haben wir in unserer nächsten Publikation (Veröffentlichung 2) (Abschnitt 7.2) einen detaillierten Vergleich zwischen SVM und verschiedenen neuronalen Netzen, die sich als eine Standardmethode im virtuellen Screening etabliert haben, durchgeführt. Verglichen wurde die Trennung von wirstoffartigen und nicht-wirkstoffartigen Molekülen („Druglikeness“-Vorhersage). Die SVM konnte 82% aller Moleküle richtig klassifizieren. Die Klassifizierung war zudem robuster als mit dreilagigen feedforward-ANN bei der Verwendung verschiedener Anzahlen an Hidden-Neuronen. In diesem Projekt haben wir verschiedene Deskriptoren zur Beschreibung der Moleküle berechnet: Ghose-Crippen Fragmentdeskriptoren [86], physikochemische Eigenschaften [9] und topologische Pharmacophore (CATS) [10]. Die Entwicklung von weiteren Verfahren, die auf dem SVM-Konzept aufbauen, haben wir in den Publikationen in den Abschnitten 7.3 und 7.8 beschrieben. Veröffentlichung 3 stellt die Entwicklung einer neuen SVM-basierten Methode zur Auswahl von relevanten Deskriptoren für eine bestimmte Aktivität dar. Eingesetzt wurden die gleichen Deskriptoren wie in dem oben beschriebenen Projekt. Als charakteristische Molekülgruppen haben wir verschiedene Untermengen der COBRA Datenbank ausgewählt: 195 Thrombin Inhibitoren, 226 Kinase Inhibitoren und 227 Faktor Xa Inhibitoren. Es ist uns gelungen, die Anzahl der Deskriptoren von ursprünglich 407 auf ungefähr 50 zu verringern ohne signifikant an Klassifizierungsgenauigkeit zu verlieren. Unsere Methode haben wir mit einer Standardmethode für diese Anwendung verglichen, der Kolmogorov-Smirnov Statistik. Die SVM-basierte Methode erwies sich hierbei in jedem betrachteten Fall als besser als die Vergleichsmethoden hinsichtlich der Vorhersagegenauigkeit bei der gleichen Anzahl an Deskriptoren. Eine ausführliche Beschreibung ist in Abschnitt 4.4 gegeben. Dort sind auch verschiedene „Wrapper“ für die Deskriptoren-Auswahl beschrieben. Veröffentlichung 8 beschreibt die Anwendung von aktivem Lernen mit SVM. Die Idee des aktiven Lernens liegt in der Auswahl von Molekülen für das Lernverfahren aus dem Bereich an der Grenze der verschiedenen zu unterscheidenden Molekülklassen. Auf diese Weise kann die lokale Klassifikation verbessert werden. Die folgenden Gruppen von Moleküle wurden genutzt: ACE (Angiotensin converting enzyme), COX2 (Cyclooxygenase 2), CRF (Corticotropin releasing factor) Antagonisten, DPP (Dipeptidylpeptidase) IV, HIV (Human immunodeficiency virus) protease, Nuclear Receptors, NK (Neurokinin receptors), PPAR (peroxisome proliferator-activated receptor), Thrombin, GPCR und Matrix Metalloproteinasen. Aktives Lernen konnte die Leistungsfähigkeit des virtuellen Screenings verbessern, wie sich in dieser retrospektiven Studie zeigte. Es bleibt abzuwarten, ob sich das Verfahren durchsetzen wird, denn trotzt des Gewinns an Vorhersagegenauigkeit ist es aufgrund des mehrfachen SVMTrainings aufwändig. Die Publikationen aus den Abschnitten 7.5, 7.6 und 7.7 (Veröffentlichungen 5-7) zeigen praktische Anwendungen unserer SVM-Methoden im Wirkstoffdesign in Kombination mit anderen Verfahren, wie der Ähnlichkeitssuche und neuronalen Netzen zur Eigenschaftsvorhersage. In zwei Fällen haben wir mit dem Verfahren neuartige Liganden für COX-2 (cyclooxygenase 2) und dopamine D3/D2 Rezeptoren gefunden. Wir konnten somit klar zeigen, dass SVM-Methoden für das virtuelle Screening von Substanzdatensammlungen sinnvoll eingesetzt werden können. Es wurde im Rahmen der Arbeit auch ein schnelles Verfahren zur Erzeugung großer kombinatorischer Molekülbibliotheken entwickelt, welches auf der SMILES Notation aufbaut. Im frühen Stadium des Wirstoffdesigns ist es wichtig, eine möglichst „diverse“ Gruppe von Molekülen zu testen. Es gibt verschiedene etablierte Methoden, die eine solche Untermenge auswählen können. Wir haben eine neue Methode entwickelt, die genauer als die bekannte MaxMin-Methode sein sollte. Als erster Schritt wurde die „Probability Density Estimation“ (PDE) für die verfügbaren Moleküle berechnet. [78] Dafür haben wir jedes Molekül mit Deskriptoren beschrieben und die PDE im N-dimensionalen Deskriptorraum berechnet. Die Moleküle wurde mit dem Metropolis Algorithmus ausgewählt. [87] Die Idee liegt darin, wenige Moleküle aus den Bereichen mit hoher Dichte auszuwählen und mehr Moleküle aus den Bereichen mit niedriger Dichte. Die erhaltenen Ergebnisse wiesen jedoch auf zwei Nachteile hin. Erstens wurden Moleküle mit unrealistischen Deskriptorwerten ausgewählt und zweitens war unser Algorithmus zu langsam. Dieser Aspekt der Arbeit wurde daher nicht weiter verfolgt. In Veröffentlichung 6 (Abschnitt 7.6) haben wir in Zusammenarbeit mit der Molecular-Modeling Gruppe von Aventis-Pharma Deutschland (Frankfurt) einen SVM-basierten ADME Filter zur Früherkennung von CYP 2C9 Liganden entwickelt. Dieser nichtlineare SVM-Filter erreichte eine signifikant höhere Vorhersagegenauigkeit (q2 = 0.48) als ein auf den gleichen Daten entwickelten PLS-Modell (q2 = 0.34). Es wurden hierbei Dreipunkt-Pharmakophordeskriptoren eingesetzt, die auf einem dreidimensionalen Molekülmodell aufbauen. Eines der wichtigen Probleme im computerbasierten Wirkstoffdesign ist die Auswahl einer geeigneten Konformation für ein Molekül. Wir haben versucht, SVM auf dieses Problem anzuwenden. Der Trainingdatensatz wurde dazu mit jeweils mehreren Konformationen pro Molekül angereichert und ein SVM Modell gerechnet. Es wurden anschließend die Konformationen mit den am schlechtesten vorhergesagten IC50 Wert aussortiert. Die verbliebenen gemäß dem SVM-Modell bevorzugten Konformationen waren jedoch unrealistisch. Dieses Ergebnis zeigt Grenzen des SVM-Ansatzes auf. Wir glauben jedoch, dass weitere Forschung auf diesem Gebiet zu besseren Ergebnissen führen kann.
Eine verzögerte und mitunter unvollständige Immunrekonstitution nach allogener Stammzelltransplantation (SZT) birgt ein erhöhtes Risiko für Infektionen und das Auftreten eines Rezidivs. Adoptive Immuntherapien können dazu beitragen, die Immunrekonstitution zu beschleunigen. Die Indikation hierzu ist jedoch streng geregelt, da eine zusätzliche Immuntherapie mit Risiken, wie z.B. dem Auftreten einer Graft-versus-Host-Disease (GvHD), verbunden ist. Im Mittelpunkt dieser Arbeit steht die Untersuchung der Immunrekonstitution im Hinblick auf das Auftreten von Komplikationen und das Überleben nach SZT. Dazu wurde ein multivariates Normwertmodell entwickelt, das die Beurteilung der Rekonstitution verschiedener Leukozytensubpopulationen ermöglicht. Der Einfluss der Regeneration spezifischer Immunzellen wie Cytomegalievirus-spezifischer T-Zellen (CMV-CTLs) und regulatorischer T-Zellen (Tregs) auf den Verlauf nach SZT wurde insbesondere hinsichtlich CMV-bedingter Komplikationen, GvHD und Rezidiv untersucht.
Reggie-1 (flotillin-2) and reggie-2 (flotillin-1) are membrane microdomain proteins which are associated with the membrane by means of acylation. They influence different cellular signaling processes, such as neuronal, T-cell and insulin signaling. Upon stimulation of the EGF receptor, reggie-1 becomes phosphorylated and undergoes tyrosine 163 dependent translocation from the plasma membrane to endosomal compartments. In addition, reggie-1 was shown to influence actindependent processes. Reggie-2 has been demonstrated to affect caveolin- and clathrin-independent endocytosis. Both proteins form homo- and hetero-oligomers, but the function of these oligomers has remained elusive. Moreover, it has not been clarified if functions of reggie-1 are also influenced by reggie-2 and vice versa. The first aim of the study was to further investigate the interplay and the heterooligomerization of reggie proteins and their functional effects. Both reggie proteins were individually depleted by means of siRNA. In different siRNA systems and various cell lines, reggie-1 depleted cells showed reduced protein amounts of reggie-1 and reggie-2, but reggie-2 knock down cells still expressed reggie-1 protein. The decrease of reggie-2 in reggie-1 depleted cells was only detected at protein but not at mRNA level. Furthermore, reggie-2 expression could be rescued by expression of siRNA resistant wild type reggie-1-EGFP constructs, but not by the soluble myristoylation mutant G2A. This mutant was also not able to associate with endogenous reggie-1 or reggie-2, which demonstrates that membrane association of reggie-1 is necessary for hetero-oligomerization. In addition, fluorescence microscopy studies and membrane fractionations showed that correct localization of overexpressed reggie-2 was dependent on co-overexpressed reggie-1. Thus, hetero-oligomerization is crucial for membrane association of reggie-2 and for its protein stability or protein expression. Moreover, the binding of reggie-2 to reggie-1 required tyrosine 163 of reggie-1 which was previously shown to be important for endosomal translocation of reggie-1. Since reggie-2 was implicated to function in clathrin- and caveolin-independent endocytosis pathways, the effect of reggie-2 depletion on reggie-1 endocytosis was investigated. Indeed, reggie-1 was dependent on reggie-2 for endosomal localization and EGF-induced endocytosis. By FRET-FLIM analysis it could be shown that reggie heterooligomers are dynamic in size or conformation upon EGF stimulation. Thus, it can be concluded that reggie proteins are interdependent in different aspects, such as protein stability or expression, membrane association and subcellular localization. In addition, these results demonstrate that the hetero-oligomers are dynamic and reggie proteins influence each other in terms of function. A further aim was the characterization of reggie-1 and reggie-2 function in actindependent processes, where so far only reggie-1 was known to play a role. Depletion of either of the proteins reduced cell migration, cell spreading and the number of focal adhesions in steady state cells. Thus, also reggie-2 affects actin-dependent processes. Further investigation of the focal adhesions during cell spreading revealed that depletion of reggie-1 displayed different effects as compared to reggie-2 knock down. Reggie-1 depleted cells had elongated cell-matrix-adhesions and showed reduced activation of FAK and ERK2. On the other hand, depletion of reggie-2 resulted in a restricted localization of focal adhesion at the periphery of the cell and decreased ERK2 phosphorylation, but it did not affect FAK autophosphorylation. Hence, reggie proteins influence the regulation of cell-matrix-adhesions differently. A link between reggie proteins and focal adhesions is the actin cross-linking protein -actinin. The interaction of -actinin with reggie-1 could be verified by means of co-immunoprecipitations and FRET-FLIM analysis. Reggie-1 binds -actinin especially in membrane ruffles and in other locations where actin remodeling takes place. Moreover, -actinin showed a different localization pattern during cell spreading in reggie-1 depleted cells, as compared to the control cells. These results provide further insights into the function of both reggie proteins. Their interplay and hetero-oligomerization was shown to be crucial for their role in endocytosis. In addition, both reggie proteins influence actin-dependent processes and differentially affect focal adhesion regulation.