Refine
Year of publication
Document Type
- Doctoral Thesis (28)
Has Fulltext
- yes (28)
Is part of the Bibliography
- no (28)
Keywords
- Computational chemistry (5)
- Arzneimitteldesign (3)
- Bioinformatik (3)
- Screening (3)
- Virtual Screening (3)
- Docking (2)
- Drug design (2)
- In silico-Methode (2)
- Molekulare Bioinformatik (2)
- Neuronales Netz (2)
Institute
- Biowissenschaften (15)
- Biochemie und Chemie (6)
- Pharmazie (6)
- Medizin (1)
Virtual screening of potential bioactive substances using the support vector machine approach
(2005)
Die vorliegende Dissertation stellt eine kumulative Arbeit dar, die in insgesamt acht wissenschaftlichen Publikationen (fünf publiziert, zwei eingerichtet und eine in Vorbereitung) dargelegt ist. In diesem Forschungsprojekt wurden Anwendungen von maschinellem Lernen für das virtuelle Screening von Moleküldatenbanken durchgeführt. Das Ziel war primär die Einführung und Überprüfung des Support-Vector-Machine (SVM) Ansatzes für das virtuelle Screening nach potentiellen Wirkstoffkandidaten. In der Einleitung der Arbeit ist die Rolle des virtuellen Screenings im Wirkstoffdesign beschrieben. Methoden des virtuellen Screenings können fast in jedem Bereich der gesamten pharmazeutischen Forschung angewendet werden. Maschinelles Lernen kann einen Einsatz finden von der Auswahl der ersten Moleküle, der Optimierung der Leitstrukturen bis hin zur Vorhersage von ADMET (Absorption, Distribution, Metabolism, Toxicity) Eigenschaften. In Abschnitt 4.2 werden möglichen Verfahren dargestellt, die zur Beschreibung von chemischen Strukturen eingesetzt werden können, um diese Strukturen in ein Format zu bringen (Deskriptoren), das man als Eingabe für maschinelle Lernverfahren wie Neuronale Netze oder SVM nutzen kann. Der Fokus ist dabei auf diejenigen Verfahren gerichtet, die in der vorliegenden Arbeit verwendet wurden. Die meisten Methoden berechnen Deskriptoren, die nur auf der zweidimensionalen (2D) Struktur basieren. Standard-Beispiele hierfür sind physikochemische Eigenschaften, Atom- und Bindungsanzahl etc. (Abschnitt 4.2.1). CATS Deskriptoren, ein topologisches Pharmakophorkonzept, sind ebenfalls 2D-basiert (Abschnitt 4.2.2). Ein anderer Typ von Deskriptoren beschreibt Eigenschaften, die aus einem dreidimensionalen (3D) Molekülmodell abgeleitet werden. Der Erfolg dieser Beschreibung hangt sehr stark davon ab, wie repräsentativ die 3D-Konformation ist, die für die Berechnung des Deskriptors angewendet wurde. Eine weitere Beschreibung, die wir in unserer Arbeit eingesetzt haben, waren Fingerprints. In unserem Fall waren die verwendeten Fingerprints ungeeignet zum Trainieren von Neuronale Netzen, da der Fingerprintvektor zu viele Dimensionen (~ 10 hoch 5) hatte. Im Gegensatz dazu hat das Training von SVM mit Fingerprints funktioniert. SVM hat den Vorteil im Vergleich zu anderen Methoden, dass sie in sehr hochdimensionalen Räumen gut klassifizieren kann. Dieser Zusammenhang zwischen SVM und Fingerprints war eine Neuheit, und wurde von uns erstmalig in die Chemieinformatik eingeführt. In Abschnitt 4.3 fokussiere ich mich auf die SVM-Methode. Für fast alle Klassifikationsaufgaben in dieser Arbeit wurde der SVM-Ansatz verwendet. Ein Schwerpunkt der Dissertation lag auf der SVM-Methode. Wegen Platzbeschränkungen wurde in den beigefügten Veröffentlichungen auf eine detaillierte Beschreibung der SVM verzichtet. Aus diesem Grund wird in Abschnitt 4.3 eine vollständige Einführung in SVM gegeben. Darin enthalten ist eine vollständige Diskussion der SVM Theorie: optimale Hyperfläche, Soft-Margin-Hyperfläche, quadratische Programmierung als Technik, um diese optimale Hyperfläche zu finden. Abschnitt 4.3 enthält auch eine Diskussion von Kernel-Funktionen, welche die genaue Form der optimalen Hyperfläche bestimmen. In Abschnitt 4.4 ist eine Einleitung in verschiede Methoden gegeben, die wir für die Auswahl von Deskriptoren genutzt haben. In diesem Abschnitt wird der Unterschied zwischen einer „Filter“- und der „Wrapper“-basierten Auswahl von Deskriptoren herausgearbeitet. In Veröffentlichung 3 (Abschnitt 7.3) haben wir die Vorteile und Nachteile von Filter- und Wrapper-basierten Methoden im virtuellen Screening vergleichend dargestellt. Abschnitt 7 besteht aus den Publikationen, die unsere Forschungsergebnisse enthalten. Unsere erste Publikation (Veröffentlichung 1) war ein Übersichtsartikel (Abschnitt 7.1). In diesem Artikel haben wir einen Gesamtüberblick der Anwendungen von SVM in der Bio- und Chemieinformatik gegeben. Wir diskutieren Anwendungen von SVM für die Gen-Chip-Analyse, die DNASequenzanalyse und die Vorhersage von Proteinstrukturen und Proteininteraktionen. Wir haben auch Beispiele beschrieben, wo SVM für die Vorhersage der Lokalisation von Proteinen in der Zelle genutzt wurden. Es wird dabei deutlich, dass SVM im Bereich des virtuellen Screenings noch nicht verbreitet war. Um den Einsatz von SVM als Hauptmethode unserer Forschung zu begründen, haben wir in unserer nächsten Publikation (Veröffentlichung 2) (Abschnitt 7.2) einen detaillierten Vergleich zwischen SVM und verschiedenen neuronalen Netzen, die sich als eine Standardmethode im virtuellen Screening etabliert haben, durchgeführt. Verglichen wurde die Trennung von wirstoffartigen und nicht-wirkstoffartigen Molekülen („Druglikeness“-Vorhersage). Die SVM konnte 82% aller Moleküle richtig klassifizieren. Die Klassifizierung war zudem robuster als mit dreilagigen feedforward-ANN bei der Verwendung verschiedener Anzahlen an Hidden-Neuronen. In diesem Projekt haben wir verschiedene Deskriptoren zur Beschreibung der Moleküle berechnet: Ghose-Crippen Fragmentdeskriptoren [86], physikochemische Eigenschaften [9] und topologische Pharmacophore (CATS) [10]. Die Entwicklung von weiteren Verfahren, die auf dem SVM-Konzept aufbauen, haben wir in den Publikationen in den Abschnitten 7.3 und 7.8 beschrieben. Veröffentlichung 3 stellt die Entwicklung einer neuen SVM-basierten Methode zur Auswahl von relevanten Deskriptoren für eine bestimmte Aktivität dar. Eingesetzt wurden die gleichen Deskriptoren wie in dem oben beschriebenen Projekt. Als charakteristische Molekülgruppen haben wir verschiedene Untermengen der COBRA Datenbank ausgewählt: 195 Thrombin Inhibitoren, 226 Kinase Inhibitoren und 227 Faktor Xa Inhibitoren. Es ist uns gelungen, die Anzahl der Deskriptoren von ursprünglich 407 auf ungefähr 50 zu verringern ohne signifikant an Klassifizierungsgenauigkeit zu verlieren. Unsere Methode haben wir mit einer Standardmethode für diese Anwendung verglichen, der Kolmogorov-Smirnov Statistik. Die SVM-basierte Methode erwies sich hierbei in jedem betrachteten Fall als besser als die Vergleichsmethoden hinsichtlich der Vorhersagegenauigkeit bei der gleichen Anzahl an Deskriptoren. Eine ausführliche Beschreibung ist in Abschnitt 4.4 gegeben. Dort sind auch verschiedene „Wrapper“ für die Deskriptoren-Auswahl beschrieben. Veröffentlichung 8 beschreibt die Anwendung von aktivem Lernen mit SVM. Die Idee des aktiven Lernens liegt in der Auswahl von Molekülen für das Lernverfahren aus dem Bereich an der Grenze der verschiedenen zu unterscheidenden Molekülklassen. Auf diese Weise kann die lokale Klassifikation verbessert werden. Die folgenden Gruppen von Moleküle wurden genutzt: ACE (Angiotensin converting enzyme), COX2 (Cyclooxygenase 2), CRF (Corticotropin releasing factor) Antagonisten, DPP (Dipeptidylpeptidase) IV, HIV (Human immunodeficiency virus) protease, Nuclear Receptors, NK (Neurokinin receptors), PPAR (peroxisome proliferator-activated receptor), Thrombin, GPCR und Matrix Metalloproteinasen. Aktives Lernen konnte die Leistungsfähigkeit des virtuellen Screenings verbessern, wie sich in dieser retrospektiven Studie zeigte. Es bleibt abzuwarten, ob sich das Verfahren durchsetzen wird, denn trotzt des Gewinns an Vorhersagegenauigkeit ist es aufgrund des mehrfachen SVMTrainings aufwändig. Die Publikationen aus den Abschnitten 7.5, 7.6 und 7.7 (Veröffentlichungen 5-7) zeigen praktische Anwendungen unserer SVM-Methoden im Wirkstoffdesign in Kombination mit anderen Verfahren, wie der Ähnlichkeitssuche und neuronalen Netzen zur Eigenschaftsvorhersage. In zwei Fällen haben wir mit dem Verfahren neuartige Liganden für COX-2 (cyclooxygenase 2) und dopamine D3/D2 Rezeptoren gefunden. Wir konnten somit klar zeigen, dass SVM-Methoden für das virtuelle Screening von Substanzdatensammlungen sinnvoll eingesetzt werden können. Es wurde im Rahmen der Arbeit auch ein schnelles Verfahren zur Erzeugung großer kombinatorischer Molekülbibliotheken entwickelt, welches auf der SMILES Notation aufbaut. Im frühen Stadium des Wirstoffdesigns ist es wichtig, eine möglichst „diverse“ Gruppe von Molekülen zu testen. Es gibt verschiedene etablierte Methoden, die eine solche Untermenge auswählen können. Wir haben eine neue Methode entwickelt, die genauer als die bekannte MaxMin-Methode sein sollte. Als erster Schritt wurde die „Probability Density Estimation“ (PDE) für die verfügbaren Moleküle berechnet. [78] Dafür haben wir jedes Molekül mit Deskriptoren beschrieben und die PDE im N-dimensionalen Deskriptorraum berechnet. Die Moleküle wurde mit dem Metropolis Algorithmus ausgewählt. [87] Die Idee liegt darin, wenige Moleküle aus den Bereichen mit hoher Dichte auszuwählen und mehr Moleküle aus den Bereichen mit niedriger Dichte. Die erhaltenen Ergebnisse wiesen jedoch auf zwei Nachteile hin. Erstens wurden Moleküle mit unrealistischen Deskriptorwerten ausgewählt und zweitens war unser Algorithmus zu langsam. Dieser Aspekt der Arbeit wurde daher nicht weiter verfolgt. In Veröffentlichung 6 (Abschnitt 7.6) haben wir in Zusammenarbeit mit der Molecular-Modeling Gruppe von Aventis-Pharma Deutschland (Frankfurt) einen SVM-basierten ADME Filter zur Früherkennung von CYP 2C9 Liganden entwickelt. Dieser nichtlineare SVM-Filter erreichte eine signifikant höhere Vorhersagegenauigkeit (q2 = 0.48) als ein auf den gleichen Daten entwickelten PLS-Modell (q2 = 0.34). Es wurden hierbei Dreipunkt-Pharmakophordeskriptoren eingesetzt, die auf einem dreidimensionalen Molekülmodell aufbauen. Eines der wichtigen Probleme im computerbasierten Wirkstoffdesign ist die Auswahl einer geeigneten Konformation für ein Molekül. Wir haben versucht, SVM auf dieses Problem anzuwenden. Der Trainingdatensatz wurde dazu mit jeweils mehreren Konformationen pro Molekül angereichert und ein SVM Modell gerechnet. Es wurden anschließend die Konformationen mit den am schlechtesten vorhergesagten IC50 Wert aussortiert. Die verbliebenen gemäß dem SVM-Modell bevorzugten Konformationen waren jedoch unrealistisch. Dieses Ergebnis zeigt Grenzen des SVM-Ansatzes auf. Wir glauben jedoch, dass weitere Forschung auf diesem Gebiet zu besseren Ergebnissen führen kann.
Helicobacter pylori (H. pylori) ist ein gram-negatives, mikroaerophiles Bakterium. Es kolonisiert die menschliche Magenschleimhaut, wobei mehr als 50% der Menschheit befallen sind. Als Pathogen begünstigt es die Entstehung von Magengeschwüren und –krebs. Experimentelle Befunde deuten darauf hin, dass H. pylori während der Infektion Kontakt zu Membranproteinen der Wirtszellen aufnimmt, um ein Typ IV Sekretionssystem aufzubauen und den primären Virulenzfaktor CagA (Cytotoxin Associated Antigen A) in die Wirtszelle zu translokieren. Diese Integrine genannten Membranproteine werden bei polaren Epithelzellen allerdings bevorzugt basolateral expremiert. Außerdem können extrazellulär geschnittene E-Cadherinfragmente im Medium mit H. pylori infizierter Zellkulturen nachgewiesen werden. Beide Beobachtungen legen den Schluss nahe, dass eine Protease von H. pylori sekretiert wird und die Zell-Zell-Kontakte degradiert, um H. pylori den Zugang zur basolateralen Seite der Wirtszellen zu ermöglichen. Das vom Gen hp1019 des Stammes H. pylori 26695 codierte Protein HtrA konnte im Rahmen einer Kooperation mit dem Paul-Ehrlich-Institut in Langen im Überstand von H. pylori mit proteolytischer Aktivität nachgewiesen werden. Um den Einfluss dieser extrazellulären Protease auf die Infektion von Kulturzellen mir H. pylori zu untersuchen, sollte ein niedermolekularer Inhibitor für HtrA gefunden werden. Ein Homologiemodell als Grundlage für ein strukturbasiertes virtuelles Screening wurde berechnet, wobei die aktive Konformation der Protease DegP von Escherichia coli als Vorlage diente (PDB Identifikation 3cs0). Für einen neue, im Rahmen dieser Untersuchung entwickelten Methode wurde PocketPicker eingesetzt, um Größe und Form der die Bindetaschen auf der Proteinoberfläche vorherzusagen. Durch die komplementäre Projektion von Proteinatomtypen auf diese definierte Volumen kann so für eine von PocketPicker vorgesagte Bindetasche ein potentielles Pharmakophormodell berechnet und für Datenbanksuchen eingesetzt werden. In retrospektiven Studien konnte die Funktion dieser Berechungen für eine Auswahl an pharmakologisch wichtigen Proteinen aus verschiedenen Strukturklassen validiert werden. Dabei stellte sich vor allem eine Abhängigkeit der Güte der Modelle von der Güte der Vorhersage von PocketPicker heraus, was den Schluss zulässt, dass eine möglichst genaue Definition der Bindetasche für das Gelingen eines strukturbasierten virtuellen Screening unerlässlich ist. Für die Protease HtrA von H. pylori konnten erfolgreich drei strukturabgeleitete Pharmakophormodelle berechnet werden, wobei jeweils verschiedene von PocketPicker vorhergesagte Bindetaschen einbezogen wurden. Die Molekülkataloge der Firmen Asinex und Specs wurden nach Ähnlichkeit zu diesen Modellen sortiert und nach Begutachtung der jeweils ähnlichsten 100 Substanzen wurden 26 Substanzen ausgewählt und bestellt. In einem in vitro Assay mit der rekombinanten Protease HtrA inhibierten 6 Substanzen den Verdau eines rekombinanten Substrats. Die beste Verbindung erreichte in dem Assay eine maximale Inhibition von ca. 77 % bei einer mittleren inhibitorischen Konzentration bei halbmaximaler Inhibition (IC50) von ca. 26 µM.
We investigate the utility of modern kernel-based machine learning methods for ligand-based virtual screening. In particular, we introduce a new graph kernel based on iterative graph similarity and optimal assignments, apply kernel principle component analysis to projection error-based novelty detection, and discover a new selective agonist of the peroxisome proliferator-activated receptor gamma using Gaussian process regression. Virtual screening, the computational ranking of compounds with respect to a predicted property, is a cheminformatics problem relevant to the hit generation phase of drug development. Its ligand-based variant relies on the similarity principle, which states that (structurally) similar compounds tend to have similar properties. We describe the kernel-based machine learning approach to ligand-based virtual screening; in this, we stress the role of molecular representations, including the (dis)similarity measures defined on them, investigate effects in high-dimensional chemical descriptor spaces and their consequences for similarity-based approaches, review literature recommendations on retrospective virtual screening, and present an example workflow. Graph kernels are formal similarity measures that are defined directly on graphs, such as the annotated molecular structure graph, and correspond to inner products. We review graph kernels, in particular those based on random walks, subgraphs, and optimal vertex assignments. Combining the latter with an iterative graph similarity scheme, we develop the iterative similarity optimal assignment graph kernel, give an iterative algorithm for its computation, prove convergence of the algorithm and the uniqueness of the solution, and provide an upper bound on the number of iterations necessary to achieve a desired precision. In a retrospective virtual screening study, our kernel consistently improved performance over chemical descriptors as well as other optimal assignment graph kernels. Chemical data sets often lie on manifolds of lower dimensionality than the embedding chemical descriptor space. Dimensionality reduction methods try to identify these manifolds, effectively providing descriptive models of the data. For spectral methods based on kernel principle component analysis, the projection error is a quantitative measure of how well new samples are described by such models. This can be used for the identification of compounds structurally dissimilar to the training samples, leading to projection error-based novelty detection for virtual screening using only positive samples. We provide proof of principle by using principle component analysis to learn the concept of fatty acids. The peroxisome proliferator-activated receptor (PPAR) is a nuclear transcription factor that regulates lipid and glucose metabolism, playing a crucial role in the development of type 2 diabetes and dyslipidemia. We establish a Gaussian process regression model for PPAR gamma agonists using a combination of chemical descriptors and the iterative similarity optimal assignment kernel via multiple kernel learning. Screening of a vendor library and subsequent testing of 15 selected compounds in a cell-based transactivation assay resulted in 4 active compounds. One compound, a natural product with cyclobutane scaffold, is a full selective PPAR gamma agonist (EC50 = 10 +/- 0.2 muM, inactive on PPAR alpha and PPAR beta/delta at 10 muM). The study delivered a novel PPAR gamma agonist, de-orphanized a natural bioactive product, and, hints at the natural product origins of pharmacophore patterns in synthetic ligands.
Identifizierung und Charakterisierung neuartiger 5-Lipoxygenase-Inhibitoren – in silico und in vitro
(2009)
Ziel dieser Arbeit war die Identifizierung und Charakterisierung neuer potenter 5-LO-Inhibitoren unter Verwendung sowohl computergestützter als auch experimenteller Methoden. Ausgangspunkt war ein ligandenbasiertes virtuelles Screening unter Verwendung der ladungsbasierten Deskriptoren Charge3D und TripleCharge3D. Hierbei konnten zwei neue direkte 5-LO-Inhibitoren identifiziert werden. Jede dieser beiden Substanzen diente als Startpunkt weiterer virtueller Screenings mit dem Ziel, die Potenz der Substanzen zu verbessern bzw. eine SAR der Substanzklasse zu erhalten. Dabei zeigte sich für die Klasse der Thiazolinone, dass eine hohe Toleranz gegenüber unterschiedlichen Substituenten am Grundgerüst bezüglich der Auswirkung auf die Aktivität vorliegt: insbesondere werden relativ große Substituenten toleriert. Des Weiteren scheint der 2-Phenylsubstituent für die 5-LO-inhibitorische Aktivität essentiell zu sein, da Derivate, die einen Heterozyklus an dieser Position aufweisen, inaktiv sind. Eines der aktivsten Derivate dieser Klasse, C06 (Substanz 12), konnte weiter molekular-pharmakologisch charakterisiert werden. Die Substanz zeigt keine offensichtlichen zytotoxischen Effekte, ist unabhängig vom Stimulus der 5-LO-Aktivierung und zeigt nanomolare inhibitorische Aktivität sowohl in intakten PMNL (IC50-Wert 0,65 ;M) als auch in PMNL-Homogenaten (IC50-Wert 0,66 ;M) sowie in zellfreiem PMNL-S100 (IC50-Wert 0,26 ;M) und am gereinigten Enzym (IC50-Wert 0,3 ;M). C06 ist selektiv für die 5-LO, da andere arachidonsäurebindende Proteine (PPARs, cPLA2 und 12- und 15-LO) nicht beeinflusst werden. Auch Nager-5-LO (aus der Ratte und der Maus) wird inhibiert mit IC50-Werten im nanomolaren Bereich. Allerdings zeigte sich die Substanz inaktiv in einem menschlichen Vollblutassay in Gegenwart von Serum. C06 scheint nicht an die für die Interaktion der 5-LO mit der Membran verantwortliche C2-ähnliche Domäne der 5-LO zu binden. Ebenso hat der Membranbestandteil Phosphatidylcholin keinen bzw. nur geringen Einfluss auf das inhibitorische Potential von C06. Aktivitätstests mit steigender Substratkonzentration deuten auf einen allosterischen Bindemodus von C06 hin. Diese experimentellen Daten flossen in die Identifizierung des putativen Bindemodus an der 5-LO ein. Hierzu wurde zunächst ein Homologie-Modell der 5-LO unter Verwendung der kürzlich neu veröffentlichten Daten der Röntgenkristallstruktur der Kaninchen-15-LO (PDB-Code: 2p0m [Choi et al., 2008]) erstellt. Durch eine Bindetaschenvorhersage mit dem Programm PocketPicker und einer pseudorezptorbasierten Auswahl der potentiellen Bindetasche mit anschliessendem Liganden-Docking konnten zwei Bindebereiche postuliert werden, beide an einer Oberflächenbindetasche der 5-LO ausserhalb des aktiven Zentrums. Dies ist im Einklang mit der SAR der Substanzklasse, die zeigt, dass relativ große Substituenten toleriert werden. Erste Mutationsstudien deuten darauf hin, dass die Bindung von C06 in einer Bindetasche um die Aminosäure Y558 erfolgt. In der zweiten postulierten Bindetasche konnten zwei Aminosäuren identifiziert werden, die für die Aktivität der 5-LO essentiell sind: Mutationen von F169 und F177 zu Alanin führten zu einer abgeschwächten Produktivität der 5-LO (12% bzw. 32% der Aktivität der wt-5-LO) sowie zu einem veränderten Produktspektrum. Bei der zweiten Klasse der 5-LO-Inhibitoren, die in der ersten virtuellen Screeningrunde mit den Deskriptoren Charge3D und TripleCharge3D identifiziert werden konnten, handelt es sich um Pyridin-Imidazole. In einem dreistufigen virtuellen Screening konnte die Potenz dieser Substanzklasse von 10 ;M (Substanz 10) in PMNL-S100 auf 0,3 ;M (Substanz 80) verbessert werden. Bei einer der aktivsten Substanzen aus der zweiten Screeningrunde, B02 (Substanz 68), die weiter charakterisiert wurde, handelt es sich um einen direkten 5-LO-Inhibitor mit nanomolarer inhibitorischer Aktivität, der an die C2-ähnliche Domäne bindet. Es wurde ein Bindemodus durch Bindetaschenvorhersage, pseudorezeptorbasierte Bindetaschenlokalisierung und Liganden-Docking postuliert. Ein Problem dieser Substanzklasse ist jedoch ihre Zytotoxizität. Im letzten Teil dieser Arbeit wurde durch ein Protein-Protein-Docking eine mögliche Konformation eines Dimers der 5-LO modelliert. Die postulierten Modelle zeigen bevorzugt eine Konformation, bei der beide Untereinheiten des Dimers eine „head-to-tail“-Orientierung einnehmen. Diese Dimer-Modelle können als Startpunkt genutzt werden, um Modulatoren der Protein-Protein-Interaktion als neuartige Inhibitoren der 5-LO zu entwerfen.
Identifizierung und Charakterisierung neuartiger 5-Lipoxygenase-Inhibitoren – in silico und in vitro
(2009)
Ziel dieser Arbeit war die Identifizierung und Charakterisierung neuer potenter 5-LO-Inhibitoren unter Verwendung sowohl computergestützter als auch experimenteller Methoden. Ausgangspunkt war ein ligandenbasiertes virtuelles Screening unter Verwendung der ladungsbasierten Deskriptoren Charge 3D und TripleCharge3D. Hierbei konnten zwei neue direkte 5-LO-Inhibitoren identifiziert werden. Jede dieser beiden Substanzen diente als Startpunkt weiterer virtueller Screenings mit dem Ziel, die Potenz der Substanzen zu verbessern bzw. eine SAR der Substanzklasse zu erhalten. Dabei zeigte sich für die Klasse der Thiazolinone, dass eine hohe Toleranz gegenüber unterschiedlichen Substituenten am Grundgerüst bezüglich der Auswirkung auf die Aktivität vorliegt: insbesondere werden relativ große Substituenten toleriert. Des Weiteren scheint der 2-Phenylsubstituent für die 5-LO-inhibitorische Aktivität essentiell zu sein, da Derivate, die einen Heterozyklus an dieser Position aufweisen, inaktiv sind. Eines der aktivsten Derivate dieser Klasse, C06 (Substanz 12), konnte weiter molekular-pharmakologisch charakterisiert werden. Die Substanz zeigt keine offensichtlichen zytotoxischen Effekte, ist unabhängig vom Stimulus der 5-LO-Aktivierung und zeigt nanomolare inhibitorische Aktivität sowohl in intakten PMNL (IC50-Wert 0,65 =M) als auch in PMNL-Homogenaten (IC50-Wert 0,66 =M) sowie in zellfreiem PMNL-S100 (IC50-Wert 0,26 =M) und am gereinigten Enzym (IC50-Wert 0,3 =M). C06 ist selektiv für die 5-LO, da andere arachidonsäurebindende Proteine (PPARs, cPLA2 und 12- und 15-LO) nicht beeinflusst werden. Auch Nager-5-LO (aus der Ratte und der Maus) wird inhibiert mit IC50-Werten im nanomolaren Bereich. Allerdings zeigte sich die Substanz inaktiv in einem menschlichen Vollblutassay in Gegenwart von Serum. C06 scheint nicht an die für die Interaktion der 5-LO mit der Membran verantwortliche C2-ähnliche Domäne der 5-LO zu binden. Ebenso hat der Membranbestandteil Phosphatidylcholin keinen bzw. nur geringen Einfluss auf das inhibitorische Potential von C06. Aktivitätstests mit steigender Substratkonzentration deuten auf einen allosterischen Bindemodus von C06 hin. Diese experimentellen Daten flossen in die Identifizierung des putativen putativen Bindemodus an der 5-LO ein. Hierzu wurde zunächst ein Homologie- Modell der 5-LO unter Verwendung der kürzlich neu veröffentlichten Daten der Röntgenkristallstruktur der Kaninchen-15-LO (PDB-Code: 2p0m [Choi et al., 2008]) erstellt. Durch eine Bindetaschenvorhersage mit dem Programm PocketPicker und einer pseudorezptorbasierten Auswahl der potentiellen Bindetasche mit anschliessendem Liganden-Docking konnten zwei Bindebereiche postuliert werden, beide an einer Oberflächenbindetasche der 5-LO ausserhalb des aktiven Zentrums. .....
Das Ziel dieser Arbeit war es, RNA-Strukturen als potentielle Zielstrukturen für die Medikamentenentwicklung zu untersuchen. Hierbei ging es im Speziellen um die Anwendung Virtueller Screening Verfahren für die RNA-Liganden-Vorhersage. Hierzu wurde die als TAR-Motiv (transactivating response element) bekannte RNA-Struktur der mRNAs des HI-Virus ausgewählt. Diese Struktur wurde gewählt, da mit den vier PDB-Einträgen 1ANR, 1ARJ, 1LVJ und 1QD3 bereits experimentell motivierte Strukturmodelle zum Beginn der Untersuchung vorlagen. Ausschlaggebend war hierbei auch das Vorhandensein eines Tat-TAR-FRET-Assays im Rahmen des SFB 579, in welchem diese Arbeit angefertigt wurde. Die Aufmerksamkeit, welche dem HI-Virus im Rahmen der Bekämpfung der Immunschwächekrankheit bereits zukam, führte bei dem gewählten Testmodell ebenfalls zu einem, wenn auch immer noch überschaubaren Datensatz bereits getesteter Substanzen, der als Grundlage für einen Liganden-basierten Ansatz als erste Basis dienen konnte. Basierend auf diesen Voruntersuchungen ergaben sich die weiteren Schritte dieser Arbeit. Die Arbeit lässt sich zusammenfassend in vier zum Teil parallel verlaufende Phasen einteilen: Phase 1:Bestandsaufnahme bekannter Informationen über die Zielstruktur · experimentell bestimmte Zielstrukturen · experimentell bestimmte Liganden/Nichtliganden der Zielstruktur Phase 2: Ableiten eines ligandenbasierten Ansatzes zur Vorhersage von potentiellen Bindern der Zielstruktur aus Substanzbibliotheken, der nicht auf Strukturdaten der Zielstruktur beruht. Phase 3: Analyse der bekannten Konformere der Zielstruktur auf konstante Angriffspunkte für ein spezielles Liganden-Design. Phase 4: Einbinden der bekannten Strukturinformationen der Zielstruktur zur weiteren Verfeinerung der Auswahlverfahren neuer Kandidaten für die weitere experimentelle Bestimmung des Bindeverhaltens. Im Rahmen dieser Arbeit konnten mittels der Anwendung von künstlichen neuronalen Netzen in einem ligandenbasierten Ansatz durch virtuelles Screening der Chemikalien-Datenbanken verschiedener Lieferanten fünf neue potentielle TAR-RNA-Liganden identifiziert werden (drei davon mit einem Methylenaminoguanidyl-Substrukturmotiv), sowie als „Spin-Off“ durch die Anwendung der ursprünglich nur für den Tat-TAR-FRET-Assay vorgesehenen Testsubstanzen in einem Kooperationsprojekt (mittels CFivTT-Assay) zwei neue potentiell antibakterielle Verbindungen identifiziert werden. Die Beschäftigung mit der offensichtlichen Flexibilität der TAR-RNA und damit einer nicht eindeutig zu definierenden Referenz-Zielstruktur für das Liganden-Docking führte zur Erstellung eines Software-Pakets, mit dem flexible Zielstrukturen – basierend auf den Konformer-Datensätzen von MD-Simulationen – auf konstante Angriffspunkte untersucht werden können. Hierbei wurde ausgehend von der Integration eines Taschenvorhersage-Programms (PocketPicker) eine Reihe von Filtern implementiert, die auf den hierzu in einer MySQL-Datenbank abgelegten Strukturinformationen eine Einschränkung des möglichen Taschenraums für das zukünftige Liganden-Design automatisiert vornehmen können. Des Weiteren ermöglicht dieser Ansatz einen einfachen Zugriff auf die einzelnen Konformere und die Möglichkeit Annotationen zu den Konformeren und den daraus abgeleiteten Tascheninformationen hinzuzufügen, so dass diese Informationen für die Erstellung von Liganden-Docking-Versuchen verwendet werden können. Ferner wurden im Rahmen dieser Arbeit ein neuer Deskriptor für die Beschreibung von Taschenoberflächen eingeführt: der auf der „Skalierungs-Index-Methode“ basierende molekulare SIMPrint. Die Beschäftigung mit der Verteilung der potentiellen Bindetaschen auf der Oberfläche der Konformerensemble führte ferner zur Definition der Taschenoberflächenbildungswahrscheinlichkeit (Pocket Surface Generation Probability – PSGP) für einzelne Atome einer Zielstruktur, die tendenziell für die Einschätzung der Ausbildung einer potentiell langlebigen Interaktion eines Liganden mit der Zielstruktur herangezogen werden kann, um beispielsweise Docking-Posen zu bewerten.
Kenntnisse über die dreidimensionale Struktur therapeutisch relevanter Zielproteine bieten wertvolle Informationen für den rationalen Wirkstoffentwurf. Die stetig wachsende Zahl aufgeklärter Kristallstrukturen von Proteinen ermöglicht eine qualitative und quantitative rechnergestützte Untersuchung von spezifischen Protein-Liganden Wechselwirkungen. Im Rahmen dieser Arbeit wurden neue Algorithmen für die Identifikation und den Ähnlichkeitsvergleich von Proteinbindetaschen und ihren Eigenschaften entwickelt und in dem Programm PocketomePicker zusammengefasst. Die Software gliedert sich in die Routinen PocketPicker, PocketShapelets und PocketGraph. Ferner wurde in dieser Arbeit die Methode ReverseLIQUID reimplementiert und im Rahmen einer Kooperation für das strukturbasierte Virtuelle Screening angewendet. Die genannten Methoden und ihre wissenschaftliche Anwendungen sollte hier zusammengefasst werden: Die Methode PocketPicker ermöglicht die Vorhersage potentieller Bindetaschen auf Proteinoberflächen. Diese Technik implementiert einen geometrischen Ansatz auf Basis „künstlicher Gitter“ zur Identifikation zusammenhängender vergrabener Bereiche der Proteinoberfläche als Orte möglicher Ligandenbindestellen. Die Methode erreicht eine korrekte Vorhersage der tatsächlichen Bindetasche für 73 % der Einträge eines repräsentativen Datensatzes von Proteinstrukturen. Für 90 % der Proteinstrukturen wird die tatsächlich Ligandenbindestelle unter den drei wahrscheinlichsten vorhergesagten Taschen gefunden. PocketPicker übertrifft die Vorhersagequalität anderer etablierter Algorithmen und ermöglicht Taschenidentifikationen auf apo-Strukturen ohne signifikante Einbußen des Vorhersageerfolges. Andere Verfahren weisen deutlich eingeschränkte Ergebnisse bei der Anwendung auf apo-Strukturen auf. PocketPicker erlaubt den alignmentfreien Ähnlichkeitsvergleich von Bindetaschenfor-men durch die Kodierung berechneter Bindevolumen als Korrelationsdeskriptoren. Dieser Ansatz wurde erfolgreich für Funktionsvorhersage von Bindetaschen aus Homologiemodellen von APOBEC3C und Glutamat Dehydrogenase des Malariaerregers Plasmodium falciparum angewendet. Diese beiden Projekte wurden in Zusammenarbeit mit Kollaborationspartnern durchgeführt. Zudem wurden PocketPicker Korrelationsdeskriptoren erfolgreich für die automatisierte Konformationsanalyse der enzymatischen Tasche von Aldose Reduktase angewendet. Für detaillierte Analysen der Form und der physikochemischen Eigenschaften von Proteinbindetaschen wurde in dieser Arbeit die Methode PocketShapelets entwickelt. Diese Technik ermöglicht strukturelle Alignments von extrahierten Bindevolumen durch Zerlegungen der Oberfläche von Proteinbindetaschen. Die Überlagerung gelingt durch die Identifikation strukturell ähnlicher Oberflächenkurvaturen zweier Taschen. PocketShapelets wurde erfolgreich zur Analyse funktioneller Ähnlichkeit von Bindetaschen verwendet, die auf Betrachtungen physikochemischer Eigenschaften basiert. Zur Analyse der topologischen Vielfalt von Bindetaschengeometrien wurde in dieser Arbeit die Methode PocketGraph entwickelt. Dieser Ansatz nutzt das Konzept des sog. „Wachsenden Neuronalen Gases“ aus dem Bereich des maschinellen Lernens für eine automatische Extraktion des strukturellen Aufbaus von Bindetaschen. Ferner ermöglicht diese Methode die Zerlegung einer Bindestelle in ihre Subtaschen. Die von PocketPicker charakterisierten Taschenvolumen bilden die Grundlage für die Methode ReverseLIQUID. Dieses Programm wurde in dieser Arbeit weiterentwickelt und im Rahmen einer Kooperation zur Identifikation eines Inhibitors der Serinprotease HtrA des Erregers Helicobacter pylori verwendet. Mit ReverseLIQUID konnte ein strukturbasiertes Pharmakophormodell für das Virtuelle Screening erstellt werden. Dieser Ansatz ermöglichte die Identifikation einer Substanz mit niedrig mikromolarer Affinität gegenüber der Zielstruktur.
Im Rahmen dieser Arbeit wurde die Eignung von Pseudorezeptoren im virtuellen Screening untersucht. Hierzu wurde nach intensiver Auseinandersetzung mit bisher bekannten Konzepten ein neues Computerprogramm zur automatischen Konstruktion von Pseudorezeptormodellen entwickelt. Das Ziel von Pseudorezeptoren ist die Konstruktion eines alternativen, artifiziellen Wirtssystems aus bekannten Liganden eines Zielproteins, dessen dreidimensionale Struktur unbekannt ist. Der generierte Pseudorezeptor ist zu verstehen als die Menge aller Pseudoatome, die um die Ausgangssubstanz(en) projiziert werden. Bei multiplen Referenzliganden wird eine Gewichtung der Pseudoatome durchgeführt. Zudem wird ausschließlich von Distanz- und Winkelparametern Gebrauch gemacht, die aus Untersuchungen von Kokristall-strukturen gewonnenen wurden. Eine abschließende Kodierung generierter Pseudorezeptoren als 90-dimensionalen Korrelationsvektor wurde zum virtuellen Screening eingesetzt. In zwei retrospektiven Fallbeispielen wird gezeigt, dass die generierten Pseudorezeptoren für COX-2 und PPARα mit den realen Zuständen ihrer kokristallisierten Bindetaschen in den PDB Einträge 6cox und 2p54 kompatibel sind. Im retrospektiven virtuellen Screening in der Wirkstoffdatenbank COBRA (8.311 Moleküle) nach COX-2 Inhibitoren (136 Aktive) konnte eine Anreicherung der aktiven Strukturen in den ersten zwei Perzentilen gezeigt werden (54% der Aktiven). Zudem konnten 80% der aktiven Moleküle bereits nach Vorhersage von 10% Falsch-Positiven gefunden werden. Im Falle des retrospektiven Screenings nach 94 PPAR Liganden konnten 30% der aktiven Moleküle nach der Vorhersage von 10% Falsch-Positiven entdeckt. Nach 20% Falsch-Positiver wurden 46% der PPAR Liganden wieder gefunden. Weiterhin konnte mit den ligandenbasierten Informationen eines H4 Pseudorezeptors eine Justierung einer potentiellen Bindetasche des Histamin H4 Rezeptors aus einer molekularen Dynamiksimulation vorgenommen werden. Schließlich wurde in einem prospektiven virtuellen Screening nach Histamin H4 Liganden mit einem Pseudorezeptor zwei Strukturen mit unterschiedlichem Grundgerüst und einem Ki ~ 30 µM identifiziert.
Die Identifikation neuer Hits und Leitstrukturen sind die ersten Schritte bei der Entwicklung neuer Arzneistoffe. Dieser Herausforderung wird derzeit primär mittels High-Throughput-Screening oder der gezielten Modifikationen bekannter Liganden begegnet. Eine weitere Option ist das computerbasierte virtuelle Screening, das es kostengünstig ermöglicht, in kurzer Zeit sehr viele Moleküle auf ihre potentielle biologische Aktivität hin zu untersuchen. Der in dieser Arbeit verwendete Ansatz zur Identifikation neuer Inhibitoren der 5-Lipoxygenase und der Cyclooxygenase-2 beruht auf dem Verfahren des ligandenbasierten virtuellen Screenings. Unter der Voraussetzung der Kenntnis mindestens eines Referenzliganden können so mittels einer Ähnlichkeitsanalyse potentielle neue strukturelle Grundgerüste identifiziert werden. Zu diesem Zweck wurde ein auf atomaren Partialladungen und der dreidimensionalen Struktur der Moleküle basierender Deskriptor (Charge3D/TripleCharge3D) entwickelt. In retrospektiven Studien mit Cyclooxygenase-2 Inhibitoren wurde die Effektivität der neuen Deskriptoren überprüft und mittel eines evolutionären Algorithmus optimiert. Der Charge3D Deskriptor erreicht Anreicherungsfaktoren bis zu 16,1 im ersten Perzentil der durchsuchten Datenbank, wohingegen der TripleCharge3D Deskriptor mit seiner detailierteren Ladungsauftrennung Werte von bis zu 24,8 erreichte. Ein ebensolches retrospektives Screening wurde für 5-Lipoxygenase Inhibitoren durchgeführt. Den maximalen Anreicherungsfaktor von 6,1 im ersten Prozent der Datenbank erreichte hier der Charge3D Deskriptor, der TripleCharge3D Deskriptor erreichte 5,3. Diese wesentlich geringeren Werte sind auf die Diversität der 5-LO Inhibitoren (54 Inhibitoren mit 39 verschiedenen Grundgerüsten) und deren unterschiedliche Inhibitortypen (Redox, nicht Redox und Eisen-bindende Inhibitoren) mit ihren jeweiligen Bindemodi zurückzuführen. In Screenings nach 5-LO Inhibitoren in der Naturstoffdatenbank der Firma AnalytiCon Discovery und COX-25-LO Dualinhibitoren in Datenbanken der Firma Asinex konnten unter Verwendung der beiden Deskriptoren Inhibitoren, mit für diese Targets bislang unbekannten Scaffolds identifiziert werden. Unter Verwendung des 2D Pharmakophor Deskriptors CATS wurden zuerst zwei neue Scaffolds für Inhibitoren der 5-LO identifiziert. Struktur 1 ist den in vitro Assaydaten zufolge ein direkter Inhibitor der 5-LO. Struktur 2 hingegen erreicht seine Wirkung nicht nur über die direkte Interaktion mit der 5-LO. Eine Erklärung dafür wäre die Wechselwirkung mit dem 5-LO aktivierenden Protein FLAP, der Hemmung der Translokation der 5-LO zur Kernmembran, oder die Inhibition 5-LO aktivierender bzw. inaktivierender Kinasen. In nachfolgenden Screenings mit den Strukturen 1 und 2 als Referenzstrukturen konnten mittels der Charge Deskriptoren Substanzderivate (17 Moleküle) mit 5-LO inhibitorischer Wirkung (5 Moleküle mit IC50 Werte ≤ 1 μM an partiell aufgereinigter 5-LO), identifiziert werden. Für das Screening nach COX-2/5-LO Dualinhibitoren wurden 11 Strukturen mit 7 unterschiedlichen Scaffolds unter Verwendung der Charge Deskriptoren aus gewählt. Drei Moleküle zeigten keine 5-LO Aktivität, und jeweils eines nur in intakten PMNLs bzw. im S100 Zellüberstand. Die restlichen 6 Moleküle waren in beiden 5-LO Assays aktiv (intakte PMNLs IC50 zwischen 2 und 15 μM, S100 Zellüberstand 5-LO zwischen 0.5 μM und 25 μM). Somit zeigten 7 Moleküle im S100 Assay Aktivität und konnten als direkte Inhibitoren der 5-LO identifiziert werden. Im Cyclooxygenase-2 Aktivitätsassay mit intakten MonoMac6 Zellen zeigte eine der 11 Strukturen zudem eine geringe (IC50 = 70 μM) inhibierende Aktivität. Modifikationen zur Verbesserung der COX-2 Hemmung könnten in einem potenten COX-2/5-LO Dualinhibitor resultieren, der beispielsweise in der Schmerzbehandlung eingesetzt werden könnte. Ein weiteres Projekt war die Erstellung eines Homologiemodells der 5-LO basierend auf der 15-Lipoxygenase Struktur des Kaninchens (PDB-Struktur: 1LOX). Die Sequenzidentität der beiden Strukturen (1LOX / humane 5-LO) lag bei 37 %. Das Modell wurde zum einen zur Vorhersage von zugänglichen Caspase-6 Schnittstellen an der 5-LO angewandt, und zum anderen wurden Dockingexperimente in Aktiven Zentrum und in Bereichen der C2-like Domäne der 5-LO durchgeführt. Hyperforin, ein bekannter Inhibitor d er 5-Lipoxygenase, wurde an verschiedenen Stellen des Modells für Dockingexperiment eingebracht. Die im Aktiven Zentrum erreichten Scorewerte (Chemscore = -9±1) deuteten hier auf eine unfavorisierte Bindungsstelle hin. BWA4C (ein bekannter Eisenbinder) und ZM230487 (ein nicht-redox Inhibitor) erhielten im Aktiven Zentrum Scorewerte von 27±0,1 und 22±2,5, wodurch eine Bindung als wahrscheinlich angenommen werden kann. Weitere Dockingexperimente an der C2-like Domäne, und speziell am Interface zwischen der C2-like und der katalytischen Domäne, ergaben ähnlich hohe Chemscorewerte für Hyperforin, BWA4C und ZM230487. Aus diesen Resultaten ließ sich kein eindeutiger Bindemodus für Hyperforin ableiten. Eine Positionierung im Aktiven Zentrum ist nach diesen Experimenten unwahrscheinlich, so dass die Existenz einer weiteren, experimentell noch nicht identifizierten Bindestelle vermutet werden kann. Eine solche Interaktionsfläche könnte als Ansatzpunkt für die Entwicklung weiterer 5-Lipoxygenaseinhibitoren eine zentrale Rolle einnehmen.
Die Komplementarität der molekularen Oberflächen und der Pharmakophorpunkte ist ein verbreiteter Konzept im rechnergestützen Moleküldesign. Diesem Konzept folgend wurde die Software SQUIRREL neu entwickelt und in der Programmiersprache Java implemetiert. Die Software generiert die Vorschläge für den bioisosteren Ersatz von Molekülen und Molekülfragmenten. SQUIRREL kombiniert Oberflächen- und Pharmakophoreigenschaften bioaktiver Substanzen und kann im virtuellen Screening und fragment-basierten de novo Design eingesetzt werden. In einer prospektiven Studie wurde SQUIRREL verwendet, um neue selektive PPARalpha-Agonisten aus einer kommerziellen Moleküldatenbank zu identifizieren. Die Software lieferte eine potente Substanz (EC50 = 44 nM) mit über 100facher Selektivität gegenüber PPARgamma. In einer zweiten Studie wurde eine Leitstruktur de novo generiert und synthetisiert. Als Ausgangstruktur diente der bekannte PPARalpha-Agonist GW590735. Während des Designvorgangs wurden zwei Teilstrukturen, die für die Aktivität von GW590735 verantwortlich sind, durch bioisostere Gruppen ersetzt, die von SQUIRRELnovo vorgeschlagen wurden. Die neue Leitstruktur aktiviert PPARalpha in einem zellbasierten Reportergen-Testsystem bei einem EC50 von 0.51 µM.
This work investigated the applicability of global pairwise sequence alignment to the detection of functional analogues in virtual screening. This variant of sequence comparison was developed for the identification of homologue proteins based on amino acid or nucleotide sequences. Because of the significant differences between biopolymers and small molecules several aspects of this approach for sequence comparison had to be adapted. All proposed concepts were implemented as the ‘Pharmacophore Alignment Search Tool’ (PhAST) and evaluated in retrospective experiments on the COBRA dataset in version 6.1. The aim to identify functional analogues raised the necessity for identification and classification of functional properties in molecular structures. This was realized by fragment-based atom-typing, where one out of nine functional properties was assigned to each non-hydrogen atom in a structure. These properties were pre-assigned to atoms in the fragments. Whenever a fragment matched a substructure in a molecule, the assigned properties were transferred from fragment atoms to structure atoms. Each functional property was represented by exactly one symbol. Unlike amino acid or nucleotide sequences, small drug-like molecules contain branches and cycles. This was a major obstacle in the application of sequence alignment to virtual screening, since this technique can only be applied to linear sequences of symbols. The best linearization technique was shown to be Minimum Volume Embedding. To the best of knowledge, this work represents the first application of dimensionality reduction to graph linearization. Sequence alignment relies on a scoring system that rates symbol equivalences (matches) and differences (mismatches) based on functional properties that correspond to rated symbols. Existing scoring schemes are applicable only to amino acids and nucleotides. In this work, scoring schemes for functional properties in drug-like molecules were developed based on property frequencies and isofunctionality judged from chemical experience, pairwise sequence alignments, pairwise kernel-based assignments and stochastic optimization. The scoring system based on property frequencies and isofunctionality proved to be the most powerful (measured in enrichment capability). All developed scoring systems performed superior compared to simple scoring approaches that rate matches and mismatches uniformly. The frameworks proposed for score calculations can be used to guide modifications to the atom-typing in promising directions. The scoring system was further modified to allow for emphasis on particular symbols in a sequence. It was proven that the application of weights to symbols that correspond to key interaction points important to receptor-ligand-interaction significantly improves screening capabilities of PhAST. It was demonstrated that the systematic application of weights to all sequence positions in retrospective experiments can be used for pharmacophore elucidation. A scoring system based on structural instead of functional similarity was investigated and found to be suitable for similarity searches in shape-constrained datasets. Three methods for similarity assessment based on alignments were evaluated: Sequence identity, alignment score and significance. PhAST achieved significantly higher enrichment with alignment scores compared to sequence identity. p-values as significance estimates were calculated in a combination of Marcov Chain Monte Carlo Simulation and Importance Sampling. p-values were adapted to library size in a Bonferroni correction, yielding E-values. A significance threshold of an E-value of 1*10-5 was proposed for the application in prospective screenings. PhAST was compared to state-of-the-art methods for virtual screening. The unweighted version was shown to exhibit comparable enrichment capabilities. Compound rankings obtained with PhAST were proven to be complementary to those of other methods. The application to three-dimensional instead of two-dimensional molecular representations resulted in altered compound rankings without increased enrichment. PhAST was employed in two prospective applications. A screening for non-nucleoside analogue inhibitors of bacterial thymidin kinase yielded a hit with a distinct structural framework but only weak activity. The search for drugs not member of the NSAID (non-steroidal anti-inflammatory drug) class as modulators of gamma-secretase resulted in a potent modulator with clear structural distiction from the reference compound. The calculation of significance estimates, emphasizing on key interactions, the pharmacophore elucidation capabilities and the unique compound rannkings set PhAST apart from other screening techniques.
Als zellulärer Sensor für Gallensäuren und als Regulator zahlreicher metabolischer und inflamma-torischer Gene stellt der nukleäre Farnesoid X Rezeptor (FXR) ein vielversprechendes neues Wirkstofftarget dar. Die Aktivierung von FXR mit natürlichen oder synthetischen Liganden führte in vitro und in vivo zu zahlreichen wünschenswerten Effekten wie gesteigerter Insulinfreisetzung, verringerter Insulinresistenz oder verbessertem Lipidprofil. Daneben stellt die Aktivierung von FXR ein Prinzip zur Behandlung von Lebererkrankungen wie nicht-alkoholischer Fettleber und primärer billiärer Zirrhose dar, das mit dem FXR-Agonisten Obeticholsäure bereits in klinischen Studien überprüft wird. Existierende synthetische FXR-Liganden sind Fettsäure- bzw. Gallensäuremimetika und imitieren die physiologischen FXR-Agonisten. Die meisten synthetischen FXR-Liganden sind jedoch aufgrund von Toxizität, geringer Selektivität oder schlechter Bioverfügbarkeit nicht zur wie-teren klinischen Entwicklung geeignet. Sie stellen außerdem vornehmlich vollagonistische FXR-Ligan-den dar, doch die klinischen Erfahrungen mit Liganden anderer nukleärer Rezeptoren wie den Peroxi-somen Proliferator-aktivierten Rezeptoren (PPAR) oder den Estrogenrezeptoren (ER) haben gezeigt, dass eine zu starke Aktivierung eines Ligand-aktivierten Transkriptionsfaktors Risiken erheblicher Nebenwirkungen bergen kann. Eine Möglichkeit, dieser Gefahr vorzubeugen, bietet die Entwicklung partialagonistischer FXR-Liganden, die den Rezeptor nur mit moderater Amplitude aktivieren.
In dieser Arbeit wurde ausgehend von der in einem virtuellen Screening identifizierten Leitstruktur 1, durch medizinisch chemische Optimierung und Studien zu den Struktur-Wirkungs-Beziehungen (SAR) ein potenter und selektiver FXR-Partialagonist entwickelt. Die drei Molekülteile der Leitstruktur 1 (azide Kopfgruppe, zentraler Anthranilamidkörper und Acylsubstituent) wurden einzeln hinsichtlich ihrer Potenz an FXR untersucht und optimiert. In der Untersuchung der SAR des Acylsubstituenten zeigten sich ein 2-Naphthoyl- und ein 4-tert-Butylbenzoylsubstituent der in 1 enthaltenen 4-Methylbenzoylgruppe überlegen. Unter Beibehaltung des 2-Naphthoylsubstituenten wurde hierauf durch selektive Methylierung bzw. Reduktion die Notwendigkeit beider Amidbindungen der Subs-tanzklasse für Aktivität an FXR nachgewiesen. Durch Erweiterung der aziden Kopfgruppe um einen zusätzlichen aromatischen Ring gelang eine weitere Potenzsteigerung, die sich durch eine Methyl-gruppe an 6-Position dieses neu eingeführten Ringes noch erhöhen ließe. Andere Substituenten am aromatischen Ring der Kopfgruppe führten dagegen an keiner Position zu einer Aktivitätsverbes-serung. Der Austausch der freien Carbonsäure durch metabolisch stabilere Bioisostere wie ein Methylketon oder ein Nitril stellte sich als ohne Aktivitätsverlust möglich heraus, wobei das Tetrazol als klassisches Carbonsäurebioisoster eine Ausnahme mit geringerer Potenz bildete. Die entscheiden-de Steigerung der Aktivität der Acylanthranilamide an FXR resultierte aus der Einführung eines zusätzlichen Substituenten in 4-Position des zentralen aromatischen Ringes, wobei eine Methoxy-gruppe zur größten Potenz führte. Das resultierende Anthranilamid 2 stellt einen hochpotenten FXR-Partialagonisten mit einem EC50-Wert von 8±3 nM in einem flFXR-Reportergenassay bei 18±1% Maximalaktivierung dar und ist der Leitstruktur somit um mehr als einen Faktor 1000 überlegen.
Die optimierte Verbindung 2 wurde aufgrund ihrer großen Potenz ausführlich in vitro pharma-kologisch charakterisiert. Dabei stellte sich die Substanz als metabolisch sehr stabil, moderat löslich in Wasser und gemessen an ihrer hohen Aktivität an FXR als wenig toxisch heraus. Darüber hinaus er-wies sich 2 als selektiv für FXR über den membranständigen G-Protein-gekoppelten Gallen-säurerezeptor TGR5 (Faktor >1000) sowie über die nukleären Rezeptoren PPARα (>1000), PPARγ (~375) und PPARδ (>1000). Bei der Quantifizierung seiner Effekte auf die FXR-Targetgene SHP, CYP7A1, BSEP, OSTα und IBABP durch qRT-PCR übte 2 im Bereich 0,1 µM bis 10 µM einen konzen-trationsunabhängigen partialagonistischen Effekt von etwa 40% des Effektes des physiologischen FXR-Agonisten Chenodeoxycholsäure (CDCA) aus. Mit der Verbindung 2 wurde somit ein hochpotenter, selektiver und metabolisch stabiler FXR-Partialagonist entwickelt und charakterisiert, der sich für künftige in vitro und in vivo Studien zu partieller FXR-Aktivierung empfehlen kann.
Development of a computational method for reaction-driven de novo design of druglike compounds
(2010)
A new method for computer-based de novo design of drug candidate structures is proposed. DOGS (Design of Genuine Structures) features a ligand-based strategy to suggest new molecular structures. The quality of designed compounds is assessed by a graph kernel method measuring the distance of designed molecules to a known reference ligand. Two graph representations of molecules (molecular graph and reduced graph) are implemented to feature different levels of abstraction from the molecular structure. A fully deterministic construction procedure explicitly designed to facilitate synthesizability of proposed structures is realized: DOGS uses readily available synthesis building blocks and established reaction schemes to assemble new molecules. This approach enables the software to propose not only the final compounds, but also to give suggestions for synthesis routes to generate them at the bench. The set of synthesis schemes comprises about 83 chemical reactions. Special focus was put on ring closure reactions forming drug-like substructures. The library of building blocks consists of about 25,000 readily available synthesis building blocks. DOGS builds up new structures in a stepwise process. Each virtual synthesis step adds a fragment to the growing molecule until a stop criterion (upper threshold for molecular mass or number of synthesis steps) is fulfilled. In a theoretical evaluation, a set of ~1,800 molecules proposed by DOGS is analyzed for critical properties of de novo designed compounds. The software is able to suggest drug-like molecules (79% violate less than two of Lipinski’s ‘rule of five’). In addition, a trained classifier for drug-likeness assigns a score >0.8 to 51% of the designed molecules (with 1.0 being the top score). In addition, most of the DOGS molecules are deemed to be synthesizable by a retro-synthesis descriptor (77% of molecules score in the top 10% of the decriptor’s value range). Calculated logP(o/w) values of constructed molecules resemble a unimodal distribution centred close to the mean of logP(o/w) values calculated for the reference compounds. A structural analysis of selected designs reveals that DOGS is capable of constructing molecules reflecting the overall topological arrangement of pharmacophoric features found in the reference ligands. At the same time, the DOGS designs represent innovative compounds being structurally distinct from the references. Synthesis routes for these examples are short and seem feasible in most cases. Some reaction steps might need modification by using protecting groups to avoid unwanted side reactions. Plausible bioisosters for known privileged fragments addressing the S1 pocket of trypsin were proposed by DOGS in a case study. Three of them can be found in known trypsin inhibitors as S1-adressing side chains. The software was also tested in two prospective case studies to design bioactive compounds. DOGS was applied to design ligands for human gamma-secretase and human histamine receptor subtype 4 (hH4R). Two selected designs for gamma-secretase were readily synthesizable as suggested by the software in one-step reactions. Both compounds represent inverse modulators of the target molecule. In a second case study, a ligand candidate selected for hH4R was synthesized exactly following the three-step synthesis plan suggested by DOGS. This compound showed low activity on the target structure. The concept of DOGS is able to deliver synthesizable and bioactive compounds. Suggested synthesis plans of selected compounds were readily pursuable. DOGS can therefore serve as a valuable idea generator for the design of new pharmacological active compounds.
In silico Methoden spielen in der Wirkstoffentwicklung eine immer größere Bedeutung. Sie können eine Größe Hilfe in der Analyse des Targets oder beim Screening von neuen Liganden sein. Ihre Stärken liegen vorallem in der Zeit- und Kostenreduzierung während einer
Wirkstoffentwicklung.
Ziel der Arbeit war die Entwicklung neuer COX-2 Liganden mit Hilfe von in silico Methoden. Weil von der mCOX-2 keine Kristallstruktur in der PDB publiziert war, begann die Arbeit mit der Modellierung der mCOX-2. Dafür wurde aus der Sequenz der hCOX-2 aus UniProt mit der ID P35354 mit Hilfe der Kristallstruktur 3LN1 ein Homologie Modell entwickelt und im Anschluss über eine Validierungsmethode, den Ramachandran Plot, analysiert. Der Ramachandran Plot zeigte, dass 93.7% der Aminosäuren in favorisierten Regionen, 6.1% in
erlaubten Regionen, 0.2% in geduldeten Regionen und 0.0% in unerlaubten Regionen lagen. Mit diesem Modell wurde eine MD-Simulation durchgeführt, um die Energie des Modells zu
minimieren.
Die neuen Verbindungen wurden über drei verschiedene Ansätze designt. Im ersten Ansatz wurde die Software DOGS verwendet. Dabei handelt es sich um ein de novo Design Programm, welches nicht nur neue Verbindungen entwickelt, sondern auch deren Syntheseweg vorschlägt. Die vorgeschlagenen Verbindungen wurden über eine Docking-Studie analysiert, wobei die Verbindungen aus Abbildung 15 identifiziert werden konnten. Verbindung 22 wurde ohne weitere Variationen synthetisiert. Die Verbindungen 71 und 86 wurden aus der modellierten Verbindung 87, welche von DOGS vorgeschlagen wurde, weiterentwickelt. Dabei wurde Verbindung 71 als ein Fragment von Verbindung 85 entwickelt. Verbindung 86 wurde direkt aus Verbindung 87 entwickelt, wobei einige Variationen durchgenommen wurde. Hierbei sollte vorallem die Form von Verbindung 87 beibehalten werden.
Literatur verwendet, um ausgehend von den Verbindungen APHS und ASS neue COX-2 Inhibitoren zu entwickeln (siehe Abb. 16). Dabei wurden mehrere Verbindungen designt, wovon Verbindung 3 als ein leichter Inhibitor identifiziert werden konnte. 3 enthält keine für COX-Inhibitoren typische polare Gruppe, besitzt dafür aber eine Acetylgruppe, die gemäß in silico Untersuchungen in der Lage sein könnte, Ser530 in COX-2 zu acetylieren.
In der letzten Studie wurden mit Hilfe eines Fragment-basierten Designs neue Verbindungen entwickelt, wobei das Benzensulfonamid von Celecoxib aus der Kristallstruktur 1PTH extrahiert und mit kleinen Fragmente verknüpft wurde, welche zuvor über eine Docking-Studie analysiert wurden. Hieraus entwickelte sich Verbindung 35, die in einer kleinen SAR-Studie zu 70 optimiert werden konnte. Dabei konnte das Sulfonamid, welches typisch für Coxibe ist, gegen eine Carbonsäure ausgetauscht werden (69). Erst durch eine Vergrößerung der Verbindung um einen Benzyl-Rest am sekundären Amin von 69 führte zur potenten Verbindung 70.
Zusammenfassend konnten in dieser Arbeit fünf neue COX-2 Inhibitoren als Leitstrukturen entwickelt werden. Dabei kamen fortschrittliche in silico Methoden wie die De-Novo Design Software DOGS aber auch rationale Designmethoden zum Einsatz. Beide Methoden boten Vor- und Nachteile und haben jeweils zu guten Ergebnissen geführt. Bei der Entwicklung der vielversprechendsten Leitstrukturen 70 und 71 wurden die Vorteile beider Ansätze kombiniert.
Die vorliegende, in kumulativer Schreibweise verfasste Arbeit erläutert die Entwicklung, Charakterisierung und Optimierung zweier unterschiedlicher Leitstrukturen, die als Agonisten von Peroxisomen Proliferator-aktivierten Rezeptoren (PPAR) und gleichsam als duale Inhibitoren der mikrosomalen Prostaglandin E2 Synthase-1 (mPGES-1) und der 5-Lipoxygenase (5-LO) wirken. Chemisch betrachtet sind dies zum ersten die Gruppe der alpha-n-Hexyl-Pirinixinsäurederivate und zum zweiten die Gruppe der 2-(Phenylthio)-hexansäurederivate. Die Publikation zur Synthese und in vitro-pharmakologischen Charakterisierung der alpha-n-Hexyl-Pirinixinsäurederivate an PPAR (Zettl et al., QSAR & Combinatorial Science, 28:576–586, 2009) enthält einerseits die strukturelle Optimierung durch Variation der Aryl-Substitution des zentralen Pyrimidinringes der Leitstruktur und andererseits die durch Docking-Verfahren gestützte Untersuchung des Einflusses der Stereochemie auf die PPAR-Aktivierung. Letztlich konnte durch die Einführung von Biphenyl-Substituenten eine Verbesserung insbesondere der PPARalpha-Aktivität gegenüber der als strukturellen Referenz dienenden alpha-n-Hexyl-Pirinixinsäure (Rau et al., Archiv der Pharmazie, 341:191–195, 2008) erreicht werden. Mit Hilfe von präparativer enantioselektiver HPLC wurde eine ausgewählte Verbindung in ihre beiden Enantiomere getrennt. Deren in vitro-pharmakologische Charakterisierung ergab, dass das (R)-Enantiomer insbesondere bei PPARalpha als Eutomer fungiert. Dieses Ergebnis konnte mit Hilfe von Docking-Studien weiter untermauert werden. Hierbei wurde deutlich, dass die Besetzung der linken proximalen Bindetasche der PPARalpha-Liganden-Bindungs-Domäne durch den alpha-n-Hexyl-Rest lediglich im Fall einer (R)-Konfiguration optimal erfolgen kann. Die Synthese und die in vitro-pharmakologische Charakterisierung der Substanzklasse der 2-(Phenylthio)-hexansäurederivate an PPAR sind in Zettl et al., Bioorganic & Medicinal Chemistry Letters, 19: 4421-4426, 2009 zusammengefasst. Bei der Analyse der Struktur-Wirkungs-Beziehungen erwies sich die Leitstruktur als hochaktiv und sehr robust. Je nach Substitutionsmuster des lipophilen Molekülteils wurden potente selektive PPARalpha-Agonisten wie auch PPARalpha-präferenzielle duale PPARalpha/gamma-Agonisten dargestellt. Durch die Synthese von Kohlenstoff-Analoga und alpha-unsubstituierten Verbindungen wurde des Weiteren der Einfluss des Schwefelatoms und des n-Butylrestes in alpha-Position zur Carbonsäure auf die PPAR-Aktivität untersucht. Hierbei konnte gezeigt werden, dass beide Strukturelemente einen großen Beitrag zur hohen PPARalpha-Aktivität der Leitstruktur leisten. Wie auch bei den alpha-n-Hexyl-Pirinixinsäurederivaten wurde eine ausgewählte Verbindung in ihre Enantiomere getrennt und der Einfluss des Stereozentrums in alpha-Position zur Carbonsäure untersucht. Das Ergebnis bestätigte die Resultate der vorangegangenen Studie: Das (R)-Enantiomer wirkte als Eutomer, wobei der stereochemische Einfluss bei PPARalpha besonders deutlich war. Ausgewählte Synthesen und die in vitro-pharmakologische Charakterisierung von Pirinixinsäurederivaten an mPGES-1, 5-LO sowie der Cyclooxygenase (COX) sind in Koeberle und Zettl et al., Journal of Medicinal Chemistry, 51:8068–8076, 2009 publiziert. Die Arbeit beinhaltet eine umfassende Reihe an Pirinixinsäurederivaten mit Strukturvariationen in alpha-Position zur Carbonsäure und im Aryl-Substitutionsmuster des Pyrimidinringes. Hinsichtlich der alpha-Substitution zeigte sich, dass für Alkylreste eine Kettenlänge von mindestens 6 Kohlenstoffatomen für einen dualen Wirkmechanismus erforderlich ist. Als Leitstruktur für duale mPGES-1/5-LO-Inhibitoren ergab sich somit alpha-n-Hexyl-substituierte Pirinixinsäure, deren Aryl-Substitutionsmuster am zentralen Pyrimidin weiter optimiert wurde. Als vorteilhaft erwies sich die Substitution mit Biphenylresten, wodurch die Darstellung von niedrig mikromolar aktiven dualen mPGES-1/5-LO-Inhibitoren gelang. Bei der Analyse der Strukur-Wirkungs-Beziehungen von unterschiedlichen Biphenylresten zeigte sich eine hohe strukturelle Toleranz hinsichtlich der dualen inhibitorischen Aktivität an der mPGES-1 und der 5-LO. Somit stellen die alpha-n-Hexyl-Pirinixinsäurederivate die ersten publizierten dualen mPGES-1/5-LO-Inhibitoren dar.
This study focuses on structural features of a particular GPCR type, the family C GPCRs. Structure- and ligand-based approaches were adopted for prediction of novel mGluR5 binding ligand and their binding modes. The objectives of this study were: 1. An analysis of function and structural implication of amino acids in the TM region of family C GPCRs. 2. The prediction of the TM domain structure of mGluR5. 3. The discovery of novel selective allosteric modulators of mGluR5 by virtual screening. 4. The prediction of a ligand binding mode for the allosteric binding site in mGluR5. GPCRs are a super-family of structurally related proteins although their primary amino acid sequence can be diverse. Using sequence information a conservation analysis of family C GPCRs should be applied to reveal characteristic differences and similarities with respect function, folding and ligand binding. Using experimental data and conservation analysis the allosteric binding site of mGluR5 should be characterized regarding NAM and PAM and selective ligand binding. For further evaluation experimental knowledge about family A GPCRs as well as conservation between vertebrate rhodopsins was planned to be compared to results obtained for family C GPCRs (Section 4.1 Conservation analysis of family C GPCRs). Since no receptor structure is available for any family C GPCR, discussion of conserved sequence positions between family A and C GPCRs requires the prediction of a receptor structure for mGluR5 using a family A receptor as template. In order to predict the mGluR5 structure a sequence alignment to a GPCR template protein will have to be proposed and GPCR specific features considered in structure calculation (Section 4.1.4 Structure prediction of mGluR5). The obtained structure was intended to be involved in ligand binding mode prediction of newly discovered active molecules. For discovery of novel selective mGluR modulators several ligand-based virtual screening protocols were adapted and evaluated. Prediction models were derived for selection of possibly active molecules using a diverse collection of known mGluR binding ligands. For that purpose a data collection of known mGluR binding ligands should be established and this reference collection analyzed with respect to different ligand activity classes, NAM or PAM and selective modulators. The prediction of novel NAMs and PAMs using several combinations of 2D-, 3D-, pharmacophore or molecule shape encoding methods with machine learning techniques and similarity determining methods should be tested in a prospective manner (Section 4.2 Virtual screening for novel mGluR modulators). In collaboration with Merz Pharmaceuticals (Merz GmbH & Co. KGaA, Frankfurt am Main, Germany) the modulating effect of a few hundred molecules should be approved in a functional cell-based assay. With the objective to predict a binding mode of the discovered active molecules, molecule docking should be applied using the allosteric binding site of the modeled mGluR5 structure (Section 4.2.4 Modeling of binding modes). Predicted ligand binding modes are to be correlated to conservation profiles that had resulted from the sequence-based entropy analysis and information from mutation experiments, and shall be compared to known ligand binding poses from crystal structures of family A GPCRs.
Das Ziel des adaptiven Entwurfs von Substanzbibliotheken ist es, die vollständige biologische Testung einer molekularen Screeningbibliothek zu vermeiden. Stattdessen erfolgt, geleitet durch Optimierungsalgorithmen, eine "intelligente" Navigation durch den chemischen Raum, um so bevorzugt Substanzen mit gewünschten Eigenschaften auszuwählen. In einer retrospektiven Studie wurden die Optimierungsalgorithmen "Zufallssuche", "Simulated Annealing", "Evolutionsstrategie" und "Partikelschwarmoptimierung" im Hinblick auf den Entwurf von Bibliotheken von Serinproteaseinhibitoren systematischen verglichen. Die Gesamtzahl verfügbarer Substanztestungen wurde auf 300 beschränkt, um Laborbedingungen zu simulieren. Als Ergebnis zeigten sich besonders die Evolutionsstrategien für einen Einsatz in einer Niedrigdurchsatzscreening-Kampagne geeignet, da diese effizient mit großen Populationen und wenigen Iterationen arbeiteten. Der zweite Teil dieser Arbeit beschreibt den erfolgreichen Entwurf einer fokussierten Bibliothek von RNA-Liganden. In einer hybriden, prospektiven Optimierungsstudie wurden nach dem Vorbild einer iterativen Niedrigdurchsatzscreening-Kampagne vom Computer vorgeschlagene Moleküle im Labor getestet. Die Substanzen wurden auf Inhibition einer spezifischen molekularen Wechselwirkung im Replikationszyklus von HIV getestet (Tat-TAR-Interaktion). In vier Generationen wurden 9 von 170 untersuchten Verbindungen positiv auf Inhibition der Tat-TAR-Interaktion getestet (Trefferquote: 5,3%), wobei lediglich 0,089% der Verbindungen der Screeningbibliothek untersucht wurden. Die zwei potentesten Kandidaten wiesen einen IC50 von 51 uM bzw. 116 uM auf.
Die Identifizierung neuartiger Verbindungsklassen für ein pharmakologisches Zielsystem ist eine fordernde Aufgabe für die frühe präklinische Forschung, insbesondere wenn bereits vorherige umfangreiche Studien durchgeführt und viele Leitstrukturserien gefunden wurden. In dieser Arbeit konnte gezeigt werden, dass Scaffold Hopping durch Methoden des Virtual Screenings auch für Systeme möglich ist, für die bereits eine Vielzahl von Referenzsubstanzen beschrieben ist und somit wenig freier chemischer Raum für Innovation zur Verfügung steht. Als Beispielsystem wurde die GlycinB-Bindungsstelle der NR1-Untereinheit des NMDA-Rezeptors betrachtet. Verschiedene zwei- und dreidimensionale Techniken des Virtual Screenings wurden einer umfangreichen retrospektiven Validierung unterworfen. Zur Durchführung der prospektiven Virtual-Screening-Studie wurde eine automatisierte in silico Plattform entwickelt, die 8,9 Millionen käufliche Substanzen aus 46 Substanzkatalogen von 33 verschiedenen Anbietern sammelte, um etwa 5 Millionen unterschiedliche Moleküle in zweidimensionaler Darstellung aufzuarbeiten. Diese Menge an Substanzen stellt den größten Teil der zurzeit kommerziell verfügbaren chemischen Verbindungen, also den „verfügbaren chemischen Raum“ dar. Anhand der retrospektiv validierten Virtual Screening Techniken konnten in einer prospektiven Suche 21 GlycinB-Antagonisten mit neuartigen, d.h. für GlycinB noch unbeschriebenen Scaffolds gefunden werden. Ausgehend von drei dieser Virtual Screening Hits wurden 53 weitere Verbindungen mit insgesamt fünf unterschiedlichen neuartigen Scaffolds und einem gemeinsamen Azo-Motiv identifiziert. Die Struktur-Wirkungsbeziehungen dieser fünf chemischen Serien wurden charakterisiert. Das Ergebnis dieser Arbeit zeigt eindeutig, dass es lohnend ist, alle vorhandenen Methoden auszuschöpfen, da sich die validierten Methoden komplementär zueinander verhielten und kein Virtual Screening Hit von mehr als einer Technik gefunden wurde. Die Flexibilität von Proteinen als Antwort auf die Bindung unterschiedlicher Liganden stellt ein bislang ungelöstes chemieinformatisches Problem dar, welches auch grundlegende pharmakologische Bedeutung hat. So verursachen z.B. bei NMDA/GlycinB agonistische Liganden eine Konformationsänderung des Rezeptors. Diese ruft dann eine direkte funktionale Antwort in Form der Öffnung des Ionenkanals hervor. Auch der Bindungsmodus der Antagonisten von GlycinB ist trotz Vorhandenseins von zwei Kristallstrukturen und mehreren Hundert zum Teil hochaffiner Referenzstrukturen zum großen Teil ungeklärt. Im zweiten Teil dieser Arbeit wurde ein auf Moleküldynamiksimulationen basierendes Verfahren entwickelt, welches flexible Aminosäurereste im Rezeptor und damit induzierbare Bewegungen des Proteinrückgrates bestimmt. Die so identifizierten Reste wurden dann in einem erweiterten Verfahren des Induced-Fit-Dockings als explizit flexibel betrachtet. Hierdurch war die Berechnung verschiedener Bindungsmodi von Antagonisten möglich, die aufgrund ihrer Form und Größe nicht in die verfügbaren Kristallstrukturen von GlycinB passten. Diese benötigten somit einen Induced-Fit-Effekt des Rezeptors, um eine Bindung einzugehen. Für die im ersten Teil dieser Arbeit identifizierten Azo-Liganden wurde auf Basis dieser Methode ein gemeinsamer Bindungsmodus vorgeschlagen. Ebenso konnte anhand der Methodik eine Aussage über die funktionale Auswirkung der Proteinflexibilität beim Übergang vom antagonistischen zum agonistischen Rezeptorzustand von GlycinB getroffen werden. Ein großes Problem aktueller Dockingverfahren ist die mangelnde Verfügbarkeit von Scoringfunktionen, welche die tatsächliche biologische Bindungsaffinität eines Liganden berechnen. Hier wurde ein Verfahren für das Zielsystem GlycinB gezeigt, welches aufgrund der Berechnung des thermodynamischen Entropie- und Enthalpiegewinns durch Verdrängung von hydrophob eingeschlossenen Wasser aus der Bindungsstelle durch den Liganden eine Aussage über dessen zu erwartende Bindungsaffinität trifft. Dieses neuartige Scoringsystem wurde auf die im Virtual Screening identifizierten Serie von Azo-Liganden angewandt und verfügte über eine im Vergleich zu klassischen Scoringfunktionen des Molecular Dockings verbesserte Vorhersagekraft der biologischen Bindungsaffinität.
Eine verzögerte und mitunter unvollständige Immunrekonstitution nach allogener Stammzelltransplantation (SZT) birgt ein erhöhtes Risiko für Infektionen und das Auftreten eines Rezidivs. Adoptive Immuntherapien können dazu beitragen, die Immunrekonstitution zu beschleunigen. Die Indikation hierzu ist jedoch streng geregelt, da eine zusätzliche Immuntherapie mit Risiken, wie z.B. dem Auftreten einer Graft-versus-Host-Disease (GvHD), verbunden ist. Im Mittelpunkt dieser Arbeit steht die Untersuchung der Immunrekonstitution im Hinblick auf das Auftreten von Komplikationen und das Überleben nach SZT. Dazu wurde ein multivariates Normwertmodell entwickelt, das die Beurteilung der Rekonstitution verschiedener Leukozytensubpopulationen ermöglicht. Der Einfluss der Regeneration spezifischer Immunzellen wie Cytomegalievirus-spezifischer T-Zellen (CMV-CTLs) und regulatorischer T-Zellen (Tregs) auf den Verlauf nach SZT wurde insbesondere hinsichtlich CMV-bedingter Komplikationen, GvHD und Rezidiv untersucht.
Ziel der Arbeit war die Analyse von langen eukaryotischen Signalpeptiden, mit einer Länge von mindestens 40 Aminosäuren, und ihre Diskriminierung zu kurzen SP. Signalpeptide sind notwendig, um die im Cytosol translatierten Proteine zum Ort ihrer Funktion zu dirigieren. Sie spielen dadurch eine fundamentale Rolle bei der Entwicklung von Zellen. Signalpeptide weisen keine Sequenzhomologie, aber einen typischen, in drei Regionen gegliederten Aufbau (n-, h-, c-Region) auf. In den letzten Jahren wurden zunehmend Beispiele von Signalpeptiden gefunden, die neben dem Targeting zum endoplasmatischen Retikulum weitere Post-Targeting-Funktionen aufweisen. Auffällig ist hier die besondere Länge der Signalpeptide. Für die Analyse dieser langen Signalpeptide standen bis jetzt keine gezielt entwickelten Vorhersageprogramme zur Verfügung. Im Rahmen dieser Arbeit wurde diese Gruppe langer Signalpeptide untersucht und ein Modell zu deren interner Organisation entwickelt. Das entwickelte „NtraC“-Modell erweitert etablierte sequenzbasierte Ansätze für kurze SP um eine Sekundärstruktur-motivierte Perspektive für lange Sinalpeptide. Zuerst wird dabei ein Übergangsbereich (transition area, N„tra“C), der potentiell β-Turn bildende Aminosäuren enthält, identifiziert. Dieser dient im Modell zur Zerlegung des SP in zwei hinsichtlich ihrer Funktion unabhängige Domänen: eine N-terminale N-Domäne (‚N’traC) und eine C-terminale C-Domäne (Ntra‚C’). Diese mit bekannten Vorhersageprogrammen nicht identifizierbaren „kryptischen“ Domänen innerhalb der Signalpeptid-Sequenz können unterschiedliche Targeting-Kapazitäten aufweisen und entsprechen für sich genommen eigenständigen Protein-Targeting-Signalen. Im Fall einer ER-Targeting Kapazität z.B. weist eine Domäne für sich genommen eine n-, h-, und c-Region auf. 63% aller Vertebrata-Signalpeptide entsprechen der in dieser Arbeit vorgeschlagenen NtraC-Organisation. Eine basierend auf dem NtraC-Modell vorgeschlagene Architektur für die langen Signalpeptide von shrew-1 (43 Aminosäuren), DCBD2 (66 Aminosäuren) und RGMA (47 Aminosäuren) wurde vom Autor selbst in vitro überprüft. Für alle drei Proteine wurden eine N-Domäne mit mitochondrialer Targeting-Funktion und eine C-Domäne mit Signalpeptid-Funktion vorhergesagt. Die langen Signalpeptide der Proteine wurden bisher als reine ER-Targeting-Signale betrachtet. Die vorliegende Studie zeigt jedoch, dass in diesen langen Signalpeptiden multiple Targetingsignale kodiert sind. Die ER-Targeting-Kapazität der C-Domänen wurde durch SEAP-Assays überprüft, die mTP-Funktion der N-Domäne durch biochemische Aufreinigung von Mitochondrien. Die in silico-Vorhersagen konnten in vollem Umfang für alle drei Proteine in vitro bestätigt werden. Eine Untersuchung der semantischen Wolke aller Proteine mit NtraC-organisiertem Signalpeptid zeigte, dass eine NtraC-Organisation in mehr als 50% der Fälle im Zusammenhang mit Typ-I Transmembranproteinen auftritt. Auch die Proteine der hier experimentell untersuchten Signalpeptide von shrew-1, DCBD2, RGMA sind Typ-I Transmembranproteine. Des Weiteren weisen 15% aller langen Vertebrata-Signalpeptide eine Domänen-Kombination analog zu shrew-1, DCBD2 und RGMA auf. Der gefundene analoge Aufbau der langen Signalpeptide könnte somit funktionelle Gruppen von Proteinen zusammenführen, die bisher anderweitig nicht gruppiert werden konnten. Es konnte weiterhin gezeigt werden, dass bakterielle Autotransporter Gram-negativer Bakterien in Variation ebenfalls eine NtraC-Organisation in ihren Signalpeptiden aufweisen. Gleiches konnte für Gruppen langer viraler Signalpeptide gezeigt werden. Das NtraC-Modell ist somit nicht auf Vertebrata-Signalpeptide beschränkt. In der vorliegenden Arbeit wurde ein Modell zur Domänen-Architektur langer Signalpeptide entwickelt und erfolgreich angewendet: das NtraC-Modell. Ein Vorhersage-Algorithmus zur in silico-Untersuchung langer Signalpeptide wurde implementiert und in einer webbasierten Benutzeroberfläche öffentlich zugänglich gemacht. Das Modell trifft auf 63% der annotierten langen Vertebrata-Signalpeptide zu. Des Weiteren wurden, basierend auf dem NtraC-Modell, für die langen Signalpeptide von drei Proteinen (shrew-1, DCBD2, RGMA) in vitro-Versuche durchgeführt. Die erhaltenen in vitro-Ergebnisse unterstützen klar die These, dass lange Signalpeptide eine aus definierten Domänen bestehende Organisation aufweisen können.
Reggie-1 (flotillin-2) and reggie-2 (flotillin-1) are membrane microdomain proteins which are associated with the membrane by means of acylation. They influence different cellular signaling processes, such as neuronal, T-cell and insulin signaling. Upon stimulation of the EGF receptor, reggie-1 becomes phosphorylated and undergoes tyrosine 163 dependent translocation from the plasma membrane to endosomal compartments. In addition, reggie-1 was shown to influence actindependent processes. Reggie-2 has been demonstrated to affect caveolin- and clathrin-independent endocytosis. Both proteins form homo- and hetero-oligomers, but the function of these oligomers has remained elusive. Moreover, it has not been clarified if functions of reggie-1 are also influenced by reggie-2 and vice versa. The first aim of the study was to further investigate the interplay and the heterooligomerization of reggie proteins and their functional effects. Both reggie proteins were individually depleted by means of siRNA. In different siRNA systems and various cell lines, reggie-1 depleted cells showed reduced protein amounts of reggie-1 and reggie-2, but reggie-2 knock down cells still expressed reggie-1 protein. The decrease of reggie-2 in reggie-1 depleted cells was only detected at protein but not at mRNA level. Furthermore, reggie-2 expression could be rescued by expression of siRNA resistant wild type reggie-1-EGFP constructs, but not by the soluble myristoylation mutant G2A. This mutant was also not able to associate with endogenous reggie-1 or reggie-2, which demonstrates that membrane association of reggie-1 is necessary for hetero-oligomerization. In addition, fluorescence microscopy studies and membrane fractionations showed that correct localization of overexpressed reggie-2 was dependent on co-overexpressed reggie-1. Thus, hetero-oligomerization is crucial for membrane association of reggie-2 and for its protein stability or protein expression. Moreover, the binding of reggie-2 to reggie-1 required tyrosine 163 of reggie-1 which was previously shown to be important for endosomal translocation of reggie-1. Since reggie-2 was implicated to function in clathrin- and caveolin-independent endocytosis pathways, the effect of reggie-2 depletion on reggie-1 endocytosis was investigated. Indeed, reggie-1 was dependent on reggie-2 for endosomal localization and EGF-induced endocytosis. By FRET-FLIM analysis it could be shown that reggie heterooligomers are dynamic in size or conformation upon EGF stimulation. Thus, it can be concluded that reggie proteins are interdependent in different aspects, such as protein stability or expression, membrane association and subcellular localization. In addition, these results demonstrate that the hetero-oligomers are dynamic and reggie proteins influence each other in terms of function. A further aim was the characterization of reggie-1 and reggie-2 function in actindependent processes, where so far only reggie-1 was known to play a role. Depletion of either of the proteins reduced cell migration, cell spreading and the number of focal adhesions in steady state cells. Thus, also reggie-2 affects actin-dependent processes. Further investigation of the focal adhesions during cell spreading revealed that depletion of reggie-1 displayed different effects as compared to reggie-2 knock down. Reggie-1 depleted cells had elongated cell-matrix-adhesions and showed reduced activation of FAK and ERK2. On the other hand, depletion of reggie-2 resulted in a restricted localization of focal adhesion at the periphery of the cell and decreased ERK2 phosphorylation, but it did not affect FAK autophosphorylation. Hence, reggie proteins influence the regulation of cell-matrix-adhesions differently. A link between reggie proteins and focal adhesions is the actin cross-linking protein -actinin. The interaction of -actinin with reggie-1 could be verified by means of co-immunoprecipitations and FRET-FLIM analysis. Reggie-1 binds -actinin especially in membrane ruffles and in other locations where actin remodeling takes place. Moreover, -actinin showed a different localization pattern during cell spreading in reggie-1 depleted cells, as compared to the control cells. These results provide further insights into the function of both reggie proteins. Their interplay and hetero-oligomerization was shown to be crucial for their role in endocytosis. In addition, both reggie proteins influence actin-dependent processes and differentially affect focal adhesion regulation.
Analysis of coding principles in the olfactory system and their application in cheminformatics
(2007)
Unser Geruchssinn vermittelt uns die Wahrnehmung der chemischen Welt. Im Laufe der Evolution haben sich in unserem olfaktorischen System Mechanismen entwickelt, die wahrscheinlich optimal auf die Erfüllung dieser Aufgabe angepasst sind. Die Analyse dieser Verarbeitungsstrategien verspricht Einblicke in effiziente Algorithmen für die Kodierung und Verarbeitung chemischer Information, deren Entwicklung und Anwendung dem Kern der Chemieinformatik entspricht. In dieser Arbeit nähern wir uns der Entschlüsselung dieser Mechanismen durch die rechnerische Modellierung von funktionellen Einheiten des olfaktorischen Systems. Hierbei verfolgten wir einen interdisziplinären Ansatz, der die Gebiete der Chemie, der Neurobiologie und des maschinellen Lernens mit einbezieht.
The aim of the thesis was to identify structure activity relationships (SAR) in the primary screening data of high-throughput screening (HTS) assays. The strategy was to perform a hierarchical clustering of the molecules, assign the primary screening data to the created clusters and derive models from the clusters. The models should serve to identify singletons, clusters enriched with actives, not confirmed hits and false-negatives. Two hierarchical clustering algorithms, NIPALSTREE and hierarchical k-means have been developed and adapted for this purpose, respectively. A graphical user interface (GUI) has been implemented to extract SAR from the clustering results. Retrospective and prospective applications of the clustering approach were performed. SAR models were created by combining the clustering results with different chemoinformatic methods. NIPALSTREE projects a data set onto one dimension using principle component analysis. The data set is sorted according to the scoring vector and split at the median position into two subsets. The algorithm is applied recursively onto the subsets. The hierarchical k-means recursively separates a data set into two clusters using the k-means algorithm. Both algorithms are capable of clustering large data sets with more than a million data points. They were validated and compared to each other on the basis of different structural classes. NIPALSTREE provided with the loading vectors first insights into SAR whereas the hierarchical k-means yielded superior results. A GUI was developed allowing the display of and the navigation in the clustering results. Functionalities were integrated to analyse the clusters in the dendrogram, molecules in a cluster, and physicochemical properties of a molecule. Measures were developed to identify clusters enriched with actives, to characterize singletons and to analyse selectivity and specificity. Different protease inhibitors of the COBRA database were examined using the hierarchical k-means algorithm. Supported by similarity searches and nearest neighbour analyses thrombin inhibitor singletons were quickly isolated and displayed in the dendrogram. By scaling enrichment factors to the logarithm of the dendrogram level, clusters enriched with different structural classes of factor Xa inhibitors were simultaneously identified. The observed co-clustering of other protease inhibitors provided a deeper insight into selectivity and specificity and shows the utility of the approach for constructing focussed screening libraries. Specificity was analyzed by extracting and clustering relative frequencies of the protease inhibitors from the clusters of dendrogram level 7. A unique ligand based point of view on the pocketome of the protease enzymes was obtained. To identify not confirmed hits and false-negatives in the primary screening data of HTS assays, three assays were retrospectively analysed with the hierarchical k-means algorithm. A rule catalogue was developed judging hits in terminal clusters based on the cluster size, the percent control values of the entries in a cluster, the overall hit rate, the hit rate in the cluster and the environment of a cluster in the dendrogram. It resulted in the identification of a high proportion of not confirmed hits and provided for each hit a rating in context of related non-hits. This allows prioritizing compounds for follow-up studies. Non-hits and hits were retrieved from terminal clusters containing hits. Molecules bearing false-negative scaffolds were co-extracted and enriched. To minimize the number of false-positives in the extracted lists, Bayesian regularized artificial neutral network classification models were trained with the data. Applying the models marked improvement of enrichment factors for the false-negatives was obtained. It proofs the scaffold-hopping potential of the approach. NIPALSTREE, the hierarchical k-means algorithm and self-organising maps were prospectively applied to identify novel lead candidates for dopamine D3 receptors. Compounds with novel scaffolds and low nanomolar binding affinity (65 nM, compound 42) were identified. To provide a deeper insight into the SAR of these molecules, different alternative computational methods were employed. Support vector-based regression and partial least squares were examined. Predictive models for dopamine D2 and D3 receptor binding affinity values were obtained. Important features explaining SAR were extracted from the models. The prospective application of the models to the diverse and novel virtual screening data was of limited success only. Docking studies were performed using a homology model of the dopamine D3 receptor. The visual inspection of the binding modes resulted in the hypothesis of two alternative binding pockets for the aryl moiety of dopamine D3 receptor antagonists. A pharmacophore model was created simultaneously requiring both aryl moieties. Virtual screening with the model identified a nanomolar hit (65 nM, compound 59) corroborating the hypothesis of the two binding pockets and providing a new lead structure for dopamine D3 receptors. The presented data shows that the combined approach of hierarchically clustering a data set in combination with the subsequent usage of the clusters for model generation is suited to extract SAR from screening data. The models are successful in identifying singletons, clusters enriched with actives, not confirmed hits and false-negative scaffolds.
The goal of this thesis was the development, evaluation and application of novel virtual screening approaches for the rational compilation of high quality pharmacological screening libraries. The criteria for a high quality were a high probability of the selected molecules to be active compared to randomly selected molecules and diversity in the retrieved chemotypes of the selected molecules to be prepared for the attrition of single lead structures. For the latter criterion the virtual screening approach had to perform “scaffold hopping”. The first molecular descriptor that was explicitly reported for that purpose was the topological pharmacophore CATS descriptor, representing a correlation vector (CV) of all pharmacophore points in a molecule. The representation is alignment-free and thus renders fast screening of large databases feasible. In a first series of experiments the CATS descriptor was conceptually extended to the three-dimensional pharmacophore-pair CATS3D descriptor and the molecular surface based SURFCATS descriptor. The scaling of the CATS3D descriptor, the combination of CATS3D with different similarity metrics and the dependence of the CATS3D descriptor on the threedimensional conformations of the molecules in the virtual screening database were evaluated in retrospective screening experiments. The “scaffold hopping” capabilities of CATS3D and SURFCATS were compared to CATS and the substructure fingerprint MACCS keys. Prospective virtual screening with CATS3D similarity searching was applied for the TAR RNA and the metabotropic glutamate receptor 5 (mGlur5). A combination of supervised and unsupervised neural networks trained on CATS3D descriptors was applied prospectively to compile a focused but still diverse library of mGluR5 modulators. In a second series of experiments the SQUID fuzzy pharmacophore model method was developed, that was aimed to provide a more general query for virtual screening than the CATS family descriptors. A prospective application of the fuzzy pharmacophore models was performed for TAR RNA ligands. In a last experiment a structure-/ligand-based pharmacophore model was developed for taspase1 based on a homology model of the enzyme. This model was applied prospectively for the screening for the first inhibitors of taspase1. The effect of different similarity metrics (Euc: Euclidean distance, Manh: Manhattan distance and Tani: Tanimoto similarity) and different scaling methods (unscaled, scaling1: scaling by the number of atoms, and scaling2: scaling by the added incidences of potential pharmacophore points of atom pairs) on CATS3D similarity searching was evaluated in retrospective virtual screening experiments. 12 target classes of the COBRA database of annotated ligands from recent scientific literature were used for that purpose. Scaling2, a new development for the CATS3D descriptor, was shown to perform best on average in combination with all three similarity metrics (enrichment factor ef (1%): Manh = 11.8 ± 4.3, Euc = 11.9 ± 4.6, Tani = 12.8 ± 5.1). The Tanimoto coefficient was found to perform best with the new scaling method. Using the other scaling methods the Manhattan distance performed best (ef (1%): unscaled: Manh = 9.6 ± 4.0, Euc = 8.1 ± 3.5, Tani = 8.3 ± 3.8; scaling1: Manh = 10.3 ± 4.1, Euc = 8.8 ± 3.6, Tani = 9.1 ± 3.8). Since CATS3D is independent of an alignment, the dependence of a “receptor relevant” conformation might also be weaker compared to other methods like docking. Using such methods might be a possibility to overcome problems like protein flexibility or the computational expensive calculation of many conformers. To test this hypothesis, co-crystal structures of 11 target classes served as queries for virtual screening of the COBRA database. Different numbers of conformations were calculated for the COBRA database. Using only a single conformation already resulted in a significant enrichment of isofunctional molecules on average (ef (1%) = 6.0 ± 6.5). This observation was also made for ligand classes with many rotatable bonds (e.g. HIV-protease: 19.3 ± 6.2 rotatable bonds in COBRA, ef (1%) = 12.2 ± 11.8). On average only an improvement from using the maximum number of conformations (on average 37 conformations / molecule) to using single conformations of 1.1 fold was found. It was found that using more conformations actives and inactives equally became more similar to the reference compounds according to the CATS3D representations. Applying the same parameters as before to calculate conformations for the crystal structure ligands resulted in an average Cartesian RMSD of the single conformations to the crystal structure conformations of 1.7 ± 0.7 Å. For the maximum number of conformations, the RMSD decreased to 1.0 ± 0.5 Å (1.8 fold improvement on average). To assess the virtual screening performance and the scaffold hopping potential of CATS3D and SURFACATS, these descriptors were compared to CATS and the MACCS keys, a fingerprint based on exact chemical substructures. Retrospective screening of ten classes of the COBRA database was performed. According to the average enrichment factors the MACCS keys performed best (ef (1%): MACCS = 17.4 ± 6.4, CATS = 14.6 ± 5.4, CATS3D = 13.9 ± 4.9, SURFCATS = 12.2 ± 5.5). The classes, where MACCS performed best, consisted of a lower average fraction of different scaffolds relative to the number of molecules (0.44 ± 0.13), than the classes, where CATS performed best (0.65 ± 0.13). CATS3D was the best performing method for only a single target class with an intermediate fraction of scaffolds (0.55). SURFCATS was not found to perform best for a single class. These results indicate that CATS and the CATS3D descriptors might be better suited to find novel scaffolds than the MACCS keys. All methods were also shown to complement each other by retrieving scaffolds that were not found by the other methods. A prospective evaluation of CATS3D similarity searching was done for metabotropic glutamate receptor 5 (mGluR5) allosteric modulators. Seven known antagonists of mGluR5 with sub-micromolar IC50 were used as reference ligands for virtual screening of the 20,000 most drug-like compounds – as predicted by an artificial neural network approach – of the Asinex vendor database (194,563 compounds). Eight of 29 virtual screening hits were found with a Ki below 50 µM in a binding assay. Most of the ligands were only moderately specific for mGluR5 (maximum of > 4.2 fold selectivity) relative to mGluR1, the most similar receptor to mGluR5. One ligand exhibited even a better Ki for mGluR1 than for mGluR5 (mGluR5: Ki > 100 µM, mGluR1: Ki = 14 µM). All hits had different scaffolds than the reference molecules. It was demonstrated that the compiled library contained molecules that were different from the reference structures – as estimated by MACCS substructure fingerprints – but were still considered isofunctional by both CATS and CATS3D pharmacophore approaches. Artificial neural networks (ANN) provide an alternative to similarity searching in virtual screening, with the advantage that they incorporate knowledge from a learning procedure. A combination of artificial neural networks for the compilation of a focused but still structurally diverse screening library was employed prospectively for mGluR5. Ensembles of neural networks were trained on CATS3D representations of the training data for the prediction of “mGluR5-likeness” and for “mGluR5/mGluR1 selectivity”, the most similar receptor to mGluR5, yielding Matthews cc between 0.88 and 0.92 as well as 0.88 and 0.91 respectively. The best 8,403 hits (the focused library: the intersection of the best hits from both prediction tasks) from virtually ranking the Enamine vendor database (ca. 1,000,000 molecules), were further analyzed by two self-organizing maps (SOMs), trained on CATS3D descriptors and on MACCS substructure fingerprints. A diverse and representative subset of the hits was obtained by selecting the most similar molecules to each SOM neuron. Binding studies of the selected compounds (16 molecules from each map) gave that three of the molecules from the CATS3D SOM and two of the molecules from the MACCS SOM showed mGluR5 binding. The best hit with a Ki of 21 µM was found in the CATS3D SOM. The selectivity of the compounds for mGluR5 over mGluR1 was low. Since the binding pockets in the two receptors are similar the general CATS3D representation might not have been appropriate for the prediction of selectivity. In both SOMs new active molecules were found in neurons that did not contain molecules from the training set, i. e. the approach was able to enter new areas of chemical space with respect to mGluR5. The combination of supervised and unsupervised neural networks and CATS3D seemed to be suited for the retrieval of dissimilar molecules with the same class of biological activity, rather than for the optimization of molecules with respect to activity or selectivity. A new virtual screening approach was developed with the SQUID (Sophisticated Quantification of Interaction Distributions) fuzzy pharmacophore method. In SQUID pairs of Gaussian probability densities are used for the construction of a CV descriptor. The Gaussians represent clusters of atoms comprising the same pharmacophoric feature within an alignment of several active reference molecules. The fuzzy representation of the molecules should enhance the performance in scaffold hopping. Pharmacophore models with different degrees of fuzziness (resolution) can be defined which might be an appropriate means to compensate for ligand and receptor flexibility. For virtual screening the 3D distribution of Gaussian densities is transformed into a two-point correlation vector representation which describes the probability density for the presence of atom-pairs, comprising defined pharmacophoric features. The fuzzy pharmacophore CV was used to rank CATS3D representations of molecules. The approach was validated by retrospective screening for cyclooxygenase 2 (COX-2) and thrombin ligands. A variety of models with different degrees of fuzziness were calculated and tested for both classes of molecules. Best performance was obtained with pharmacophore models reflecting an intermediate degree of fuzziness. Appropriately weighted fuzzy pharmacophore models performed better in retrospective screening than CATS3D similarity searching using single query molecules, for both COX-2 and thrombin (ef (1%): COX-2: SQUID = 39.2., best CATS3D result = 26.6; Thrombin: SQUID = 18.0, best CATS3D result = 16.7). The new pharmacophore method was shown to complement MOE pharmacophore models. SQUID fuzzy pharmacophore and CATS3D virtual screening were applied prospectively to retrieve novel scaffolds of RNA binding molecules, inhibiting the Tat-TAR interaction. A pharmacophore model was built up from one ligand (acetylpromazine, IC50 = 500 µM) and a fragment of another known ligand (CGP40336A), which was assumed to bind with a comparable binding mode as acetylpromazine. The fragment was flexible aligned to the TAR bound NMR conformation of acetylpromazine. Using an optimized SQUID pharmacophore model the 20,000 most druglike molecules from the SPECS database (229,658 compounds) were screened for Tat-TAR ligands. Both reference inhibitors were also applied for CATS3D similarity searching. A set of 19 molecules from the SQUID and CATS3D results was selected for experimental testing. In a fluorescence resonance energy transfer (FRET) assay the best SQUID hit showed an IC50 value of 46 µM, which represents an approximately tenfold improvement over the reference acetylpromazine. The best hit from CATS3D similarity searching showed an IC50 comparable to acetylpromazine (IC50 = 500 µM). Both hits contained different molecular scaffolds than the reference molecules. Structure-based pharmacophores provide an alternative to ligand-based approaches, with the advantage that no ligands have to be known in advance and no topological bias is introduced. The latter is e.g. favorable for hopping from peptide-like substrates to drug-like molecules. A homology model of the threonine aspartase taspase1 was calculated based on the crystal structures of a homologous isoaspartyl peptidase. Docking studies of the substrate with GOLD identified a binding mode where the cleaved bond was situated directly above the reactive N-terminal threonine. The predicted enzyme-substrate complex was used to derive a pharmacophore model for virtual screening for novel taspase1 inhibitors. 85 molecules were identified from virtual screening with the pharmacophore model as potential taspase1- inhibitors, however biochemical data was not available before the end of this thesis. In summary this thesis demonstrated the successful development, improvement and application of pharmacophore-based virtual screening methods for the compilation of molecule-libraries for early phase drug development. The highest potential of such methods seemed to be in scaffold hopping, the non-trivial task of finding different molecules with the same biological activity.
Das Enzym 5-Lipoxygenase (5-LO) spielt eine essentielle Rolle in der Biosynthese der Leukotriene, bioaktiver Metabolite der Arachidonsäure (AA), die an einer Vielzahl entzündlicher und allergischer Erkrankungen beteiligt sind. Die 5-LO wird bevorzugt in Zellen myeloiden Ursprungs wie Granulozyten, Monozyten oder B-Lymphozyten exprimiert. In die Regulation der zellulären 5-LO-Aktivität in der Epstein-Barr Virus-transformierten B-lymphozytären Zelllinie BL41-E95-A sind Caspasen, Aspartat-spezifische Cysteinproteasen, involviert. Das Passagieren von BL41-E95-A führt zu einer Erhöhung der Proliferationsrate der B-Lymphozyten sowie zu einem deutlichen Verlust der 5-LO-Aktivität, der mit dem Auftreten eines 62 kDa-Spaltproduktes der 5-LO und einer signifikanten Aktivitätserhöhung der Caspase-8 und -6 korreliert. Isolierte humane 5-LO wird durch rekombinante Caspase-6 zwischen Asp170 und Ser171 zu einem 58 kDa-Fragment in vitro gespalten, wobei das Tetrapeptid VEID170 innerhalb der 5-LO als Erkennungsmotiv für den Angriff der Caspase-6 dient. In einigen weiteren untersuchten Zelllinien wie Mono Mac 6 (MM6), RBL-1, PMNL oder HeLa, die nicht den B-Lymphozyten angehören, konnte die 5-LO-Spaltung weder durch das Passagieren von Zellen noch durch die Behandlung mit diversen proapoptotischen Agentien ausgelöst werden. Laut Ergebnissen aus in vitro-Untersuchungen scheinen 5-LO-positive HeLa- bzw. MM6-Zellen einen Faktor zu exprimieren, der die 5-LO direkt oder indirekt vor dem Angriff der Caspase-6 und anschließender Prozessierung schützt. Die in den BL41-E95-A-Zellen beobachtete Aktivierung der Caspasen mit anschließender Prozessierung der 5-LO lässt sich durch zwei Pflanzeninhaltsstoffe supprimieren, das Hyperforin (HP) aus Johanniskraut-Extrakten und das Myrtucommulon (MC) aus Myrte-Blättern. Beide Verbindungen scheinen in B-Lymphozyten zu einer Hemmung der Caspasen-Aktivierung zu führen. Nichtsdestotrotz führt die Behandlung der B-Lymphozyten mit HP bzw. MC zu einem apoptotischen Tod der Zellen. Offensichtlich wird dabei ein (unbekannter) einzigartiger Mechanismus der Apoptose-Induktion ausgelöst. In der vorliegenden Arbeit konnte zum ersten Mal eine potente Apoptose-induzierende Wirkung des natürlich vorkommenden Myrtucommulons auf Krebszelllinien gezeigt werden. In allen getesteten Krebszelllinien führte Myrtucommulon zum Zelltod, wobei die HL-60-Zellen mit einem IC50-Wert von 3,26 ± 0,51 µM MC am sensitivsten gegenüber MC-Einfluss waren. Zusätzlich konnte in HL-60- und MM6-Zellen nach MC-Behandlung neben einer erhöhten Caspasen-Aktivität und PARP-Spaltung ein signifikanter DNA-Abbau detektiert werden. Von besonderer Bedeutung ist die Tatsache, dass die zytotoxische MC-Wirkung eine bemerkenswerte Selektivität für entartete Zelllinien zu besitzen scheint und gegenüber nicht-transfizierten Zellen minimal ist.
The goal of this thesis was to gain further insight into the binding behavior of ligands in the heptahelical domain (HD) of group I metabotropic glutamate receptors (mGluRs). This was realized by the establishment of strategies for the detection and optimization of molecules acting as non-competitive antagonists of group I mGluRs (mGluR1/5). These strategies should guarantee high diversity in the retrieved chemotypes of the detected compounds not resembling original reference molecules (“scaffold-hopping”). The detection of new scaffolds, in turn, was divided into two approaches: First the development of pharmacological assays to screen compounds at a certain target for bioactivity (here: affinity towards the allosteric recognition site of mGluR1 and mGluR5), and second the evaluation of computer assisted methods for the identification of virtual hits to be screened afterwards on the pharmacological assays established before. Promising molecules should be optimized with respect to activity/affinity and selectivity, their binding mode investigated and, finally, compared to existing lead compounds. Initially, membrane based binding assays for the HD of mGlu1 and mGlu5 receptors with enhanced throughput (shifting from 24-well plates to 96-well plates) were set up. For the mGluR1 assay the potent antagonist EMQMCM exhibited high affinity towards the binding site (Ki ~3nM), which is in accordance with published data from Mabire et al. (functional IC50 3nM). For mGluR5 the reference antagonist MPEP binds with high affinity to the receptor (binding IC50 13.8nM), which confirmed earlier findings from Anderson et al. (binding IC50 15nM). In another series of experiments the properties of rat cerebellar (mGluR1) and corticalmembranes (mGluR5) as well as of radiotracers were investigated by means of binding saturation studies and kinetic experiments. Furthermore, the influence of the solvent DMSO, necessary for compound screening of lipophilic substances, on positive and negative controls was evaluated. As the precise architecture of the HD of mGluR1 is still not known our efforts in identifying new ligands for this receptor focused on the ligand-based approach. All computer assisted methods that were applied to virtually screen large compound collections and to retrieve potential hits (“activity-enriched subsets”) acting at the heptahelical domain of mGluR1 relied on the existence of a valid dataset of reference molecules. This was realized by an initial compilation of a mGluR reference data collection comprising in total 357 entries predominantly negative but also some positive allosteric modulators for mGluR1 and mGluR5. In the next step a pharmacophore model for non-competitive mGluR1 antagonists was constructed. It was based upon six selective, potent and structurally diverse ligands. Prospective virtual screening was performed using the CATS atom-pair descriptor. The Asinex Gold-Collection was screened for each seed compound and some of the most similar compounds (according to the CATS descriptor) were ordered and tested forbinding affinity and functional activity at mGluR1. A high hit rate of approximately 26% (IC50 < 15 micro M) was yielded confirming the applicability of this method. One compound exerted functional activity below one micro molar (IC50-value of C-07:362nM ± 0.03). Moreover, non-linear principal component analysis was employed. Again the Asinex vendor database served as test database and was filtered by the pharmacophore model for mGluR1 established before. Test molecules that were adjacently located with mGluR1 antagonist references were selected. 15 compounds were tested on mGluR1 in binding and functional assays and three of them exhibited functional activity (IC50) below 15 micro M. The most potent molecule P-06 revealed an IC50-value of 1.11 micro M (± 0.41). The COBRA database comprising 5,376 structurally diverse bioactive molecules affecting various targets was encoded with the CATS descriptor and used for training two selforganizing maps (SOM). The encoded mGluR reference data collection was projected onto this map according to the SOM algorithm. This projection allowed to clearly distinguish between antagonists of mGluR1 and mGluR5 subtype. 28 compounds were ordered and tested on activity and affinity for mGluR1. They exhibited functional activity down to the sub-micro molar range (IC50-value of S-08: 744nM ± 0.29) yielding a final hit rate of 46% (<15 micro M). Then, the Asinex collection was screened using the SOM approach. For a predicted target panel including the muscarinic mACh (M1) receptor, the histamine H1-receptor and the dopamine D2/D3 receptors, the tested mGluR ligands exhibited the calculated binding pattern. This virtual screening concept might provide a basis for early recognition of potential sideeffects in lead discovery. We superimposed a set of 39 quinoline derivatives as non-competitive mGluR1 antagonists that were recently published by Mabire and co-workers. A CoMFA model (QSAR) was established and the influence of several side chains on functional activity was investigated. The coumarine derivative C-07 was obtained as a result of similarity searching. Starting from this compound a series of chemical derivatives was synthesized. This led to the discovery of potent (B-28, IC50: 58nM ± 0.008; Ki: 293nM ± 0.022) and selective (rmGluR5 IC50: 28.6 micro M) mGluR1 antagonists. From a homology model of mGluR1 we derived a potential binding mode for coumarines within the allosteric transmembrane region. Potential interacting patterns with amino acids were proposed considering the difference of the binding pockets between rat and human receptors. The proposed binding modes for quinolines (here:EMQMCM) and coumarines (here:B-04) were compared and discussed considering in particular the influence on activity of several side chains of quinolines obtained from the QSAR studies. The present studies demonstrated the applicability of ligand-based virtual screening for non-competitive antagonists of a G-protein coupled receptor, resulting in novel, potent and selective agents.
In der vorliegenden Arbeit sollte das basolaterale Targeting des Transmembranproteins shrew-1 in polarisierten Epithelzellen analysiert werden. Es konnte gezeigt werden, dass die cytoplasmatische Domäne von shrew-1 mehrere spezifische basolaterale Sortingmotive enthält. Die Funktionalität dieser Motive wurde anhand Mutationsanalysen von Schlüsselaminosäuren untersucht. Substitution dieser Aminosäuren führt zu einer apikalen Lokalisation von shrew-1 in polarisierten MDCK Zellen. Durch Analyse der Proteinverteilung von shrew-1 Varianten in polarisierten LLC-PK1 Zellen wurde deutlich, dass das Sorting von shrew-1 in die basolaterale Plasmamembran ein AP-1B-abhängiger Prozess ist. Außerdem konnte mittels Coimmunopräzipitation eine Interaktion zwischen shrew-1 und der Untereinheit my1B aus dem Adapterproteinkomplex AP-1B nachgewiesen werden. Untersuchungen des Targetings von shrew-1 Varianten in polarisierten MDCK und LLCPK1 Zellen mit Hilfe der Transzytoseexperimente zeigten, dass die apikal lokalisierte Mutante shrew-1-NTD5 auf dem Weg zur apikalen Membranregion, trotz fehlender Sortinginformation, die basolaterale Plasmamembran durchquert. Durch Inhibition der Membranfusion mittels Tanninsäure konnte zusätzlich gezeigt werden, dass die Passage der basolateralen Plasmamembran für das Targeting von sowohl shrew-1 als auch von shrew-1-NTD5 essentiell ist. Die Beobachtungen des Turnovers von shrew-1 in der Plasmamembran von lebenden Zellen zeigten, dass shrew-1 aktiv endozytiert wird und dass nachfolgend ein Recycling des Proteins zur Plasmamembran stattfindet. Anhand der durchgeführten Untersuchungen lässt sich zusammenfassend ein Targetingmodell für shrew-1 in polarisierten Epithelzellen aufstellen, das ein postendozytotisches Sorting beschreibt: Dabei wird shrew-1 zunächst in Post-Golgi-Carriern auf unbekanntem Weg zur basolateralen Plasmamembran gebracht, wo seine unmittelbare Internalisierung und ein Weitertransport zum Recyclingendosom stattfinden. Der im Recyclingendosom lokalisierte und am Sorting beteiligte Adapterproteinkomplex AP-1B vermittelt dann den Rücktransport von shrew-1 zur basolateralen Plasmamembran.