Refine
Year of publication
Document Type
- Doctoral Thesis (28)
Has Fulltext
- yes (28)
Is part of the Bibliography
- no (28) (remove)
Keywords
- Computational chemistry (5)
- Arzneimitteldesign (3)
- Bioinformatik (3)
- Screening (3)
- Virtual Screening (3)
- Docking (2)
- Drug design (2)
- In silico-Methode (2)
- Molekulare Bioinformatik (2)
- Neuronales Netz (2)
Institute
- Biowissenschaften (15)
- Biochemie und Chemie (6)
- Pharmazie (6)
- Medizin (1)
Die vorliegende, in kumulativer Schreibweise verfasste Arbeit erläutert die Entwicklung, Charakterisierung und Optimierung zweier unterschiedlicher Leitstrukturen, die als Agonisten von Peroxisomen Proliferator-aktivierten Rezeptoren (PPAR) und gleichsam als duale Inhibitoren der mikrosomalen Prostaglandin E2 Synthase-1 (mPGES-1) und der 5-Lipoxygenase (5-LO) wirken. Chemisch betrachtet sind dies zum ersten die Gruppe der alpha-n-Hexyl-Pirinixinsäurederivate und zum zweiten die Gruppe der 2-(Phenylthio)-hexansäurederivate. Die Publikation zur Synthese und in vitro-pharmakologischen Charakterisierung der alpha-n-Hexyl-Pirinixinsäurederivate an PPAR (Zettl et al., QSAR & Combinatorial Science, 28:576–586, 2009) enthält einerseits die strukturelle Optimierung durch Variation der Aryl-Substitution des zentralen Pyrimidinringes der Leitstruktur und andererseits die durch Docking-Verfahren gestützte Untersuchung des Einflusses der Stereochemie auf die PPAR-Aktivierung. Letztlich konnte durch die Einführung von Biphenyl-Substituenten eine Verbesserung insbesondere der PPARalpha-Aktivität gegenüber der als strukturellen Referenz dienenden alpha-n-Hexyl-Pirinixinsäure (Rau et al., Archiv der Pharmazie, 341:191–195, 2008) erreicht werden. Mit Hilfe von präparativer enantioselektiver HPLC wurde eine ausgewählte Verbindung in ihre beiden Enantiomere getrennt. Deren in vitro-pharmakologische Charakterisierung ergab, dass das (R)-Enantiomer insbesondere bei PPARalpha als Eutomer fungiert. Dieses Ergebnis konnte mit Hilfe von Docking-Studien weiter untermauert werden. Hierbei wurde deutlich, dass die Besetzung der linken proximalen Bindetasche der PPARalpha-Liganden-Bindungs-Domäne durch den alpha-n-Hexyl-Rest lediglich im Fall einer (R)-Konfiguration optimal erfolgen kann. Die Synthese und die in vitro-pharmakologische Charakterisierung der Substanzklasse der 2-(Phenylthio)-hexansäurederivate an PPAR sind in Zettl et al., Bioorganic & Medicinal Chemistry Letters, 19: 4421-4426, 2009 zusammengefasst. Bei der Analyse der Struktur-Wirkungs-Beziehungen erwies sich die Leitstruktur als hochaktiv und sehr robust. Je nach Substitutionsmuster des lipophilen Molekülteils wurden potente selektive PPARalpha-Agonisten wie auch PPARalpha-präferenzielle duale PPARalpha/gamma-Agonisten dargestellt. Durch die Synthese von Kohlenstoff-Analoga und alpha-unsubstituierten Verbindungen wurde des Weiteren der Einfluss des Schwefelatoms und des n-Butylrestes in alpha-Position zur Carbonsäure auf die PPAR-Aktivität untersucht. Hierbei konnte gezeigt werden, dass beide Strukturelemente einen großen Beitrag zur hohen PPARalpha-Aktivität der Leitstruktur leisten. Wie auch bei den alpha-n-Hexyl-Pirinixinsäurederivaten wurde eine ausgewählte Verbindung in ihre Enantiomere getrennt und der Einfluss des Stereozentrums in alpha-Position zur Carbonsäure untersucht. Das Ergebnis bestätigte die Resultate der vorangegangenen Studie: Das (R)-Enantiomer wirkte als Eutomer, wobei der stereochemische Einfluss bei PPARalpha besonders deutlich war. Ausgewählte Synthesen und die in vitro-pharmakologische Charakterisierung von Pirinixinsäurederivaten an mPGES-1, 5-LO sowie der Cyclooxygenase (COX) sind in Koeberle und Zettl et al., Journal of Medicinal Chemistry, 51:8068–8076, 2009 publiziert. Die Arbeit beinhaltet eine umfassende Reihe an Pirinixinsäurederivaten mit Strukturvariationen in alpha-Position zur Carbonsäure und im Aryl-Substitutionsmuster des Pyrimidinringes. Hinsichtlich der alpha-Substitution zeigte sich, dass für Alkylreste eine Kettenlänge von mindestens 6 Kohlenstoffatomen für einen dualen Wirkmechanismus erforderlich ist. Als Leitstruktur für duale mPGES-1/5-LO-Inhibitoren ergab sich somit alpha-n-Hexyl-substituierte Pirinixinsäure, deren Aryl-Substitutionsmuster am zentralen Pyrimidin weiter optimiert wurde. Als vorteilhaft erwies sich die Substitution mit Biphenylresten, wodurch die Darstellung von niedrig mikromolar aktiven dualen mPGES-1/5-LO-Inhibitoren gelang. Bei der Analyse der Strukur-Wirkungs-Beziehungen von unterschiedlichen Biphenylresten zeigte sich eine hohe strukturelle Toleranz hinsichtlich der dualen inhibitorischen Aktivität an der mPGES-1 und der 5-LO. Somit stellen die alpha-n-Hexyl-Pirinixinsäurederivate die ersten publizierten dualen mPGES-1/5-LO-Inhibitoren dar.
Kenntnisse über die dreidimensionale Struktur therapeutisch relevanter Zielproteine bieten wertvolle Informationen für den rationalen Wirkstoffentwurf. Die stetig wachsende Zahl aufgeklärter Kristallstrukturen von Proteinen ermöglicht eine qualitative und quantitative rechnergestützte Untersuchung von spezifischen Protein-Liganden Wechselwirkungen. Im Rahmen dieser Arbeit wurden neue Algorithmen für die Identifikation und den Ähnlichkeitsvergleich von Proteinbindetaschen und ihren Eigenschaften entwickelt und in dem Programm PocketomePicker zusammengefasst. Die Software gliedert sich in die Routinen PocketPicker, PocketShapelets und PocketGraph. Ferner wurde in dieser Arbeit die Methode ReverseLIQUID reimplementiert und im Rahmen einer Kooperation für das strukturbasierte Virtuelle Screening angewendet. Die genannten Methoden und ihre wissenschaftliche Anwendungen sollte hier zusammengefasst werden: Die Methode PocketPicker ermöglicht die Vorhersage potentieller Bindetaschen auf Proteinoberflächen. Diese Technik implementiert einen geometrischen Ansatz auf Basis „künstlicher Gitter“ zur Identifikation zusammenhängender vergrabener Bereiche der Proteinoberfläche als Orte möglicher Ligandenbindestellen. Die Methode erreicht eine korrekte Vorhersage der tatsächlichen Bindetasche für 73 % der Einträge eines repräsentativen Datensatzes von Proteinstrukturen. Für 90 % der Proteinstrukturen wird die tatsächlich Ligandenbindestelle unter den drei wahrscheinlichsten vorhergesagten Taschen gefunden. PocketPicker übertrifft die Vorhersagequalität anderer etablierter Algorithmen und ermöglicht Taschenidentifikationen auf apo-Strukturen ohne signifikante Einbußen des Vorhersageerfolges. Andere Verfahren weisen deutlich eingeschränkte Ergebnisse bei der Anwendung auf apo-Strukturen auf. PocketPicker erlaubt den alignmentfreien Ähnlichkeitsvergleich von Bindetaschenfor-men durch die Kodierung berechneter Bindevolumen als Korrelationsdeskriptoren. Dieser Ansatz wurde erfolgreich für Funktionsvorhersage von Bindetaschen aus Homologiemodellen von APOBEC3C und Glutamat Dehydrogenase des Malariaerregers Plasmodium falciparum angewendet. Diese beiden Projekte wurden in Zusammenarbeit mit Kollaborationspartnern durchgeführt. Zudem wurden PocketPicker Korrelationsdeskriptoren erfolgreich für die automatisierte Konformationsanalyse der enzymatischen Tasche von Aldose Reduktase angewendet. Für detaillierte Analysen der Form und der physikochemischen Eigenschaften von Proteinbindetaschen wurde in dieser Arbeit die Methode PocketShapelets entwickelt. Diese Technik ermöglicht strukturelle Alignments von extrahierten Bindevolumen durch Zerlegungen der Oberfläche von Proteinbindetaschen. Die Überlagerung gelingt durch die Identifikation strukturell ähnlicher Oberflächenkurvaturen zweier Taschen. PocketShapelets wurde erfolgreich zur Analyse funktioneller Ähnlichkeit von Bindetaschen verwendet, die auf Betrachtungen physikochemischer Eigenschaften basiert. Zur Analyse der topologischen Vielfalt von Bindetaschengeometrien wurde in dieser Arbeit die Methode PocketGraph entwickelt. Dieser Ansatz nutzt das Konzept des sog. „Wachsenden Neuronalen Gases“ aus dem Bereich des maschinellen Lernens für eine automatische Extraktion des strukturellen Aufbaus von Bindetaschen. Ferner ermöglicht diese Methode die Zerlegung einer Bindestelle in ihre Subtaschen. Die von PocketPicker charakterisierten Taschenvolumen bilden die Grundlage für die Methode ReverseLIQUID. Dieses Programm wurde in dieser Arbeit weiterentwickelt und im Rahmen einer Kooperation zur Identifikation eines Inhibitors der Serinprotease HtrA des Erregers Helicobacter pylori verwendet. Mit ReverseLIQUID konnte ein strukturbasiertes Pharmakophormodell für das Virtuelle Screening erstellt werden. Dieser Ansatz ermöglichte die Identifikation einer Substanz mit niedrig mikromolarer Affinität gegenüber der Zielstruktur.
Das Enzym 5-Lipoxygenase (5-LO) spielt eine essentielle Rolle in der Biosynthese der Leukotriene, bioaktiver Metabolite der Arachidonsäure (AA), die an einer Vielzahl entzündlicher und allergischer Erkrankungen beteiligt sind. Die 5-LO wird bevorzugt in Zellen myeloiden Ursprungs wie Granulozyten, Monozyten oder B-Lymphozyten exprimiert. In die Regulation der zellulären 5-LO-Aktivität in der Epstein-Barr Virus-transformierten B-lymphozytären Zelllinie BL41-E95-A sind Caspasen, Aspartat-spezifische Cysteinproteasen, involviert. Das Passagieren von BL41-E95-A führt zu einer Erhöhung der Proliferationsrate der B-Lymphozyten sowie zu einem deutlichen Verlust der 5-LO-Aktivität, der mit dem Auftreten eines 62 kDa-Spaltproduktes der 5-LO und einer signifikanten Aktivitätserhöhung der Caspase-8 und -6 korreliert. Isolierte humane 5-LO wird durch rekombinante Caspase-6 zwischen Asp170 und Ser171 zu einem 58 kDa-Fragment in vitro gespalten, wobei das Tetrapeptid VEID170 innerhalb der 5-LO als Erkennungsmotiv für den Angriff der Caspase-6 dient. In einigen weiteren untersuchten Zelllinien wie Mono Mac 6 (MM6), RBL-1, PMNL oder HeLa, die nicht den B-Lymphozyten angehören, konnte die 5-LO-Spaltung weder durch das Passagieren von Zellen noch durch die Behandlung mit diversen proapoptotischen Agentien ausgelöst werden. Laut Ergebnissen aus in vitro-Untersuchungen scheinen 5-LO-positive HeLa- bzw. MM6-Zellen einen Faktor zu exprimieren, der die 5-LO direkt oder indirekt vor dem Angriff der Caspase-6 und anschließender Prozessierung schützt. Die in den BL41-E95-A-Zellen beobachtete Aktivierung der Caspasen mit anschließender Prozessierung der 5-LO lässt sich durch zwei Pflanzeninhaltsstoffe supprimieren, das Hyperforin (HP) aus Johanniskraut-Extrakten und das Myrtucommulon (MC) aus Myrte-Blättern. Beide Verbindungen scheinen in B-Lymphozyten zu einer Hemmung der Caspasen-Aktivierung zu führen. Nichtsdestotrotz führt die Behandlung der B-Lymphozyten mit HP bzw. MC zu einem apoptotischen Tod der Zellen. Offensichtlich wird dabei ein (unbekannter) einzigartiger Mechanismus der Apoptose-Induktion ausgelöst. In der vorliegenden Arbeit konnte zum ersten Mal eine potente Apoptose-induzierende Wirkung des natürlich vorkommenden Myrtucommulons auf Krebszelllinien gezeigt werden. In allen getesteten Krebszelllinien führte Myrtucommulon zum Zelltod, wobei die HL-60-Zellen mit einem IC50-Wert von 3,26 ± 0,51 µM MC am sensitivsten gegenüber MC-Einfluss waren. Zusätzlich konnte in HL-60- und MM6-Zellen nach MC-Behandlung neben einer erhöhten Caspasen-Aktivität und PARP-Spaltung ein signifikanter DNA-Abbau detektiert werden. Von besonderer Bedeutung ist die Tatsache, dass die zytotoxische MC-Wirkung eine bemerkenswerte Selektivität für entartete Zelllinien zu besitzen scheint und gegenüber nicht-transfizierten Zellen minimal ist.
Im Rahmen dieser Arbeit wurde die Eignung von Pseudorezeptoren im virtuellen Screening untersucht. Hierzu wurde nach intensiver Auseinandersetzung mit bisher bekannten Konzepten ein neues Computerprogramm zur automatischen Konstruktion von Pseudorezeptormodellen entwickelt. Das Ziel von Pseudorezeptoren ist die Konstruktion eines alternativen, artifiziellen Wirtssystems aus bekannten Liganden eines Zielproteins, dessen dreidimensionale Struktur unbekannt ist. Der generierte Pseudorezeptor ist zu verstehen als die Menge aller Pseudoatome, die um die Ausgangssubstanz(en) projiziert werden. Bei multiplen Referenzliganden wird eine Gewichtung der Pseudoatome durchgeführt. Zudem wird ausschließlich von Distanz- und Winkelparametern Gebrauch gemacht, die aus Untersuchungen von Kokristall-strukturen gewonnenen wurden. Eine abschließende Kodierung generierter Pseudorezeptoren als 90-dimensionalen Korrelationsvektor wurde zum virtuellen Screening eingesetzt. In zwei retrospektiven Fallbeispielen wird gezeigt, dass die generierten Pseudorezeptoren für COX-2 und PPARα mit den realen Zuständen ihrer kokristallisierten Bindetaschen in den PDB Einträge 6cox und 2p54 kompatibel sind. Im retrospektiven virtuellen Screening in der Wirkstoffdatenbank COBRA (8.311 Moleküle) nach COX-2 Inhibitoren (136 Aktive) konnte eine Anreicherung der aktiven Strukturen in den ersten zwei Perzentilen gezeigt werden (54% der Aktiven). Zudem konnten 80% der aktiven Moleküle bereits nach Vorhersage von 10% Falsch-Positiven gefunden werden. Im Falle des retrospektiven Screenings nach 94 PPAR Liganden konnten 30% der aktiven Moleküle nach der Vorhersage von 10% Falsch-Positiven entdeckt. Nach 20% Falsch-Positiver wurden 46% der PPAR Liganden wieder gefunden. Weiterhin konnte mit den ligandenbasierten Informationen eines H4 Pseudorezeptors eine Justierung einer potentiellen Bindetasche des Histamin H4 Rezeptors aus einer molekularen Dynamiksimulation vorgenommen werden. Schließlich wurde in einem prospektiven virtuellen Screening nach Histamin H4 Liganden mit einem Pseudorezeptor zwei Strukturen mit unterschiedlichem Grundgerüst und einem Ki ~ 30 µM identifiziert.
Das Ziel des adaptiven Entwurfs von Substanzbibliotheken ist es, die vollständige biologische Testung einer molekularen Screeningbibliothek zu vermeiden. Stattdessen erfolgt, geleitet durch Optimierungsalgorithmen, eine "intelligente" Navigation durch den chemischen Raum, um so bevorzugt Substanzen mit gewünschten Eigenschaften auszuwählen. In einer retrospektiven Studie wurden die Optimierungsalgorithmen "Zufallssuche", "Simulated Annealing", "Evolutionsstrategie" und "Partikelschwarmoptimierung" im Hinblick auf den Entwurf von Bibliotheken von Serinproteaseinhibitoren systematischen verglichen. Die Gesamtzahl verfügbarer Substanztestungen wurde auf 300 beschränkt, um Laborbedingungen zu simulieren. Als Ergebnis zeigten sich besonders die Evolutionsstrategien für einen Einsatz in einer Niedrigdurchsatzscreening-Kampagne geeignet, da diese effizient mit großen Populationen und wenigen Iterationen arbeiteten. Der zweite Teil dieser Arbeit beschreibt den erfolgreichen Entwurf einer fokussierten Bibliothek von RNA-Liganden. In einer hybriden, prospektiven Optimierungsstudie wurden nach dem Vorbild einer iterativen Niedrigdurchsatzscreening-Kampagne vom Computer vorgeschlagene Moleküle im Labor getestet. Die Substanzen wurden auf Inhibition einer spezifischen molekularen Wechselwirkung im Replikationszyklus von HIV getestet (Tat-TAR-Interaktion). In vier Generationen wurden 9 von 170 untersuchten Verbindungen positiv auf Inhibition der Tat-TAR-Interaktion getestet (Trefferquote: 5,3%), wobei lediglich 0,089% der Verbindungen der Screeningbibliothek untersucht wurden. Die zwei potentesten Kandidaten wiesen einen IC50 von 51 uM bzw. 116 uM auf.
Analysis of coding principles in the olfactory system and their application in cheminformatics
(2007)
Unser Geruchssinn vermittelt uns die Wahrnehmung der chemischen Welt. Im Laufe der Evolution haben sich in unserem olfaktorischen System Mechanismen entwickelt, die wahrscheinlich optimal auf die Erfüllung dieser Aufgabe angepasst sind. Die Analyse dieser Verarbeitungsstrategien verspricht Einblicke in effiziente Algorithmen für die Kodierung und Verarbeitung chemischer Information, deren Entwicklung und Anwendung dem Kern der Chemieinformatik entspricht. In dieser Arbeit nähern wir uns der Entschlüsselung dieser Mechanismen durch die rechnerische Modellierung von funktionellen Einheiten des olfaktorischen Systems. Hierbei verfolgten wir einen interdisziplinären Ansatz, der die Gebiete der Chemie, der Neurobiologie und des maschinellen Lernens mit einbezieht.
We investigate the utility of modern kernel-based machine learning methods for ligand-based virtual screening. In particular, we introduce a new graph kernel based on iterative graph similarity and optimal assignments, apply kernel principle component analysis to projection error-based novelty detection, and discover a new selective agonist of the peroxisome proliferator-activated receptor gamma using Gaussian process regression. Virtual screening, the computational ranking of compounds with respect to a predicted property, is a cheminformatics problem relevant to the hit generation phase of drug development. Its ligand-based variant relies on the similarity principle, which states that (structurally) similar compounds tend to have similar properties. We describe the kernel-based machine learning approach to ligand-based virtual screening; in this, we stress the role of molecular representations, including the (dis)similarity measures defined on them, investigate effects in high-dimensional chemical descriptor spaces and their consequences for similarity-based approaches, review literature recommendations on retrospective virtual screening, and present an example workflow. Graph kernels are formal similarity measures that are defined directly on graphs, such as the annotated molecular structure graph, and correspond to inner products. We review graph kernels, in particular those based on random walks, subgraphs, and optimal vertex assignments. Combining the latter with an iterative graph similarity scheme, we develop the iterative similarity optimal assignment graph kernel, give an iterative algorithm for its computation, prove convergence of the algorithm and the uniqueness of the solution, and provide an upper bound on the number of iterations necessary to achieve a desired precision. In a retrospective virtual screening study, our kernel consistently improved performance over chemical descriptors as well as other optimal assignment graph kernels. Chemical data sets often lie on manifolds of lower dimensionality than the embedding chemical descriptor space. Dimensionality reduction methods try to identify these manifolds, effectively providing descriptive models of the data. For spectral methods based on kernel principle component analysis, the projection error is a quantitative measure of how well new samples are described by such models. This can be used for the identification of compounds structurally dissimilar to the training samples, leading to projection error-based novelty detection for virtual screening using only positive samples. We provide proof of principle by using principle component analysis to learn the concept of fatty acids. The peroxisome proliferator-activated receptor (PPAR) is a nuclear transcription factor that regulates lipid and glucose metabolism, playing a crucial role in the development of type 2 diabetes and dyslipidemia. We establish a Gaussian process regression model for PPAR gamma agonists using a combination of chemical descriptors and the iterative similarity optimal assignment kernel via multiple kernel learning. Screening of a vendor library and subsequent testing of 15 selected compounds in a cell-based transactivation assay resulted in 4 active compounds. One compound, a natural product with cyclobutane scaffold, is a full selective PPAR gamma agonist (EC50 = 10 +/- 0.2 muM, inactive on PPAR alpha and PPAR beta/delta at 10 muM). The study delivered a novel PPAR gamma agonist, de-orphanized a natural bioactive product, and, hints at the natural product origins of pharmacophore patterns in synthetic ligands.
The goal of this thesis was the development, evaluation and application of novel virtual screening approaches for the rational compilation of high quality pharmacological screening libraries. The criteria for a high quality were a high probability of the selected molecules to be active compared to randomly selected molecules and diversity in the retrieved chemotypes of the selected molecules to be prepared for the attrition of single lead structures. For the latter criterion the virtual screening approach had to perform “scaffold hopping”. The first molecular descriptor that was explicitly reported for that purpose was the topological pharmacophore CATS descriptor, representing a correlation vector (CV) of all pharmacophore points in a molecule. The representation is alignment-free and thus renders fast screening of large databases feasible. In a first series of experiments the CATS descriptor was conceptually extended to the three-dimensional pharmacophore-pair CATS3D descriptor and the molecular surface based SURFCATS descriptor. The scaling of the CATS3D descriptor, the combination of CATS3D with different similarity metrics and the dependence of the CATS3D descriptor on the threedimensional conformations of the molecules in the virtual screening database were evaluated in retrospective screening experiments. The “scaffold hopping” capabilities of CATS3D and SURFCATS were compared to CATS and the substructure fingerprint MACCS keys. Prospective virtual screening with CATS3D similarity searching was applied for the TAR RNA and the metabotropic glutamate receptor 5 (mGlur5). A combination of supervised and unsupervised neural networks trained on CATS3D descriptors was applied prospectively to compile a focused but still diverse library of mGluR5 modulators. In a second series of experiments the SQUID fuzzy pharmacophore model method was developed, that was aimed to provide a more general query for virtual screening than the CATS family descriptors. A prospective application of the fuzzy pharmacophore models was performed for TAR RNA ligands. In a last experiment a structure-/ligand-based pharmacophore model was developed for taspase1 based on a homology model of the enzyme. This model was applied prospectively for the screening for the first inhibitors of taspase1. The effect of different similarity metrics (Euc: Euclidean distance, Manh: Manhattan distance and Tani: Tanimoto similarity) and different scaling methods (unscaled, scaling1: scaling by the number of atoms, and scaling2: scaling by the added incidences of potential pharmacophore points of atom pairs) on CATS3D similarity searching was evaluated in retrospective virtual screening experiments. 12 target classes of the COBRA database of annotated ligands from recent scientific literature were used for that purpose. Scaling2, a new development for the CATS3D descriptor, was shown to perform best on average in combination with all three similarity metrics (enrichment factor ef (1%): Manh = 11.8 ± 4.3, Euc = 11.9 ± 4.6, Tani = 12.8 ± 5.1). The Tanimoto coefficient was found to perform best with the new scaling method. Using the other scaling methods the Manhattan distance performed best (ef (1%): unscaled: Manh = 9.6 ± 4.0, Euc = 8.1 ± 3.5, Tani = 8.3 ± 3.8; scaling1: Manh = 10.3 ± 4.1, Euc = 8.8 ± 3.6, Tani = 9.1 ± 3.8). Since CATS3D is independent of an alignment, the dependence of a “receptor relevant” conformation might also be weaker compared to other methods like docking. Using such methods might be a possibility to overcome problems like protein flexibility or the computational expensive calculation of many conformers. To test this hypothesis, co-crystal structures of 11 target classes served as queries for virtual screening of the COBRA database. Different numbers of conformations were calculated for the COBRA database. Using only a single conformation already resulted in a significant enrichment of isofunctional molecules on average (ef (1%) = 6.0 ± 6.5). This observation was also made for ligand classes with many rotatable bonds (e.g. HIV-protease: 19.3 ± 6.2 rotatable bonds in COBRA, ef (1%) = 12.2 ± 11.8). On average only an improvement from using the maximum number of conformations (on average 37 conformations / molecule) to using single conformations of 1.1 fold was found. It was found that using more conformations actives and inactives equally became more similar to the reference compounds according to the CATS3D representations. Applying the same parameters as before to calculate conformations for the crystal structure ligands resulted in an average Cartesian RMSD of the single conformations to the crystal structure conformations of 1.7 ± 0.7 Å. For the maximum number of conformations, the RMSD decreased to 1.0 ± 0.5 Å (1.8 fold improvement on average). To assess the virtual screening performance and the scaffold hopping potential of CATS3D and SURFACATS, these descriptors were compared to CATS and the MACCS keys, a fingerprint based on exact chemical substructures. Retrospective screening of ten classes of the COBRA database was performed. According to the average enrichment factors the MACCS keys performed best (ef (1%): MACCS = 17.4 ± 6.4, CATS = 14.6 ± 5.4, CATS3D = 13.9 ± 4.9, SURFCATS = 12.2 ± 5.5). The classes, where MACCS performed best, consisted of a lower average fraction of different scaffolds relative to the number of molecules (0.44 ± 0.13), than the classes, where CATS performed best (0.65 ± 0.13). CATS3D was the best performing method for only a single target class with an intermediate fraction of scaffolds (0.55). SURFCATS was not found to perform best for a single class. These results indicate that CATS and the CATS3D descriptors might be better suited to find novel scaffolds than the MACCS keys. All methods were also shown to complement each other by retrieving scaffolds that were not found by the other methods. A prospective evaluation of CATS3D similarity searching was done for metabotropic glutamate receptor 5 (mGluR5) allosteric modulators. Seven known antagonists of mGluR5 with sub-micromolar IC50 were used as reference ligands for virtual screening of the 20,000 most drug-like compounds – as predicted by an artificial neural network approach – of the Asinex vendor database (194,563 compounds). Eight of 29 virtual screening hits were found with a Ki below 50 µM in a binding assay. Most of the ligands were only moderately specific for mGluR5 (maximum of > 4.2 fold selectivity) relative to mGluR1, the most similar receptor to mGluR5. One ligand exhibited even a better Ki for mGluR1 than for mGluR5 (mGluR5: Ki > 100 µM, mGluR1: Ki = 14 µM). All hits had different scaffolds than the reference molecules. It was demonstrated that the compiled library contained molecules that were different from the reference structures – as estimated by MACCS substructure fingerprints – but were still considered isofunctional by both CATS and CATS3D pharmacophore approaches. Artificial neural networks (ANN) provide an alternative to similarity searching in virtual screening, with the advantage that they incorporate knowledge from a learning procedure. A combination of artificial neural networks for the compilation of a focused but still structurally diverse screening library was employed prospectively for mGluR5. Ensembles of neural networks were trained on CATS3D representations of the training data for the prediction of “mGluR5-likeness” and for “mGluR5/mGluR1 selectivity”, the most similar receptor to mGluR5, yielding Matthews cc between 0.88 and 0.92 as well as 0.88 and 0.91 respectively. The best 8,403 hits (the focused library: the intersection of the best hits from both prediction tasks) from virtually ranking the Enamine vendor database (ca. 1,000,000 molecules), were further analyzed by two self-organizing maps (SOMs), trained on CATS3D descriptors and on MACCS substructure fingerprints. A diverse and representative subset of the hits was obtained by selecting the most similar molecules to each SOM neuron. Binding studies of the selected compounds (16 molecules from each map) gave that three of the molecules from the CATS3D SOM and two of the molecules from the MACCS SOM showed mGluR5 binding. The best hit with a Ki of 21 µM was found in the CATS3D SOM. The selectivity of the compounds for mGluR5 over mGluR1 was low. Since the binding pockets in the two receptors are similar the general CATS3D representation might not have been appropriate for the prediction of selectivity. In both SOMs new active molecules were found in neurons that did not contain molecules from the training set, i. e. the approach was able to enter new areas of chemical space with respect to mGluR5. The combination of supervised and unsupervised neural networks and CATS3D seemed to be suited for the retrieval of dissimilar molecules with the same class of biological activity, rather than for the optimization of molecules with respect to activity or selectivity. A new virtual screening approach was developed with the SQUID (Sophisticated Quantification of Interaction Distributions) fuzzy pharmacophore method. In SQUID pairs of Gaussian probability densities are used for the construction of a CV descriptor. The Gaussians represent clusters of atoms comprising the same pharmacophoric feature within an alignment of several active reference molecules. The fuzzy representation of the molecules should enhance the performance in scaffold hopping. Pharmacophore models with different degrees of fuzziness (resolution) can be defined which might be an appropriate means to compensate for ligand and receptor flexibility. For virtual screening the 3D distribution of Gaussian densities is transformed into a two-point correlation vector representation which describes the probability density for the presence of atom-pairs, comprising defined pharmacophoric features. The fuzzy pharmacophore CV was used to rank CATS3D representations of molecules. The approach was validated by retrospective screening for cyclooxygenase 2 (COX-2) and thrombin ligands. A variety of models with different degrees of fuzziness were calculated and tested for both classes of molecules. Best performance was obtained with pharmacophore models reflecting an intermediate degree of fuzziness. Appropriately weighted fuzzy pharmacophore models performed better in retrospective screening than CATS3D similarity searching using single query molecules, for both COX-2 and thrombin (ef (1%): COX-2: SQUID = 39.2., best CATS3D result = 26.6; Thrombin: SQUID = 18.0, best CATS3D result = 16.7). The new pharmacophore method was shown to complement MOE pharmacophore models. SQUID fuzzy pharmacophore and CATS3D virtual screening were applied prospectively to retrieve novel scaffolds of RNA binding molecules, inhibiting the Tat-TAR interaction. A pharmacophore model was built up from one ligand (acetylpromazine, IC50 = 500 µM) and a fragment of another known ligand (CGP40336A), which was assumed to bind with a comparable binding mode as acetylpromazine. The fragment was flexible aligned to the TAR bound NMR conformation of acetylpromazine. Using an optimized SQUID pharmacophore model the 20,000 most druglike molecules from the SPECS database (229,658 compounds) were screened for Tat-TAR ligands. Both reference inhibitors were also applied for CATS3D similarity searching. A set of 19 molecules from the SQUID and CATS3D results was selected for experimental testing. In a fluorescence resonance energy transfer (FRET) assay the best SQUID hit showed an IC50 value of 46 µM, which represents an approximately tenfold improvement over the reference acetylpromazine. The best hit from CATS3D similarity searching showed an IC50 comparable to acetylpromazine (IC50 = 500 µM). Both hits contained different molecular scaffolds than the reference molecules. Structure-based pharmacophores provide an alternative to ligand-based approaches, with the advantage that no ligands have to be known in advance and no topological bias is introduced. The latter is e.g. favorable for hopping from peptide-like substrates to drug-like molecules. A homology model of the threonine aspartase taspase1 was calculated based on the crystal structures of a homologous isoaspartyl peptidase. Docking studies of the substrate with GOLD identified a binding mode where the cleaved bond was situated directly above the reactive N-terminal threonine. The predicted enzyme-substrate complex was used to derive a pharmacophore model for virtual screening for novel taspase1 inhibitors. 85 molecules were identified from virtual screening with the pharmacophore model as potential taspase1- inhibitors, however biochemical data was not available before the end of this thesis. In summary this thesis demonstrated the successful development, improvement and application of pharmacophore-based virtual screening methods for the compilation of molecule-libraries for early phase drug development. The highest potential of such methods seemed to be in scaffold hopping, the non-trivial task of finding different molecules with the same biological activity.
Die Komplementarität der molekularen Oberflächen und der Pharmakophorpunkte ist ein verbreiteter Konzept im rechnergestützen Moleküldesign. Diesem Konzept folgend wurde die Software SQUIRREL neu entwickelt und in der Programmiersprache Java implemetiert. Die Software generiert die Vorschläge für den bioisosteren Ersatz von Molekülen und Molekülfragmenten. SQUIRREL kombiniert Oberflächen- und Pharmakophoreigenschaften bioaktiver Substanzen und kann im virtuellen Screening und fragment-basierten de novo Design eingesetzt werden. In einer prospektiven Studie wurde SQUIRREL verwendet, um neue selektive PPARalpha-Agonisten aus einer kommerziellen Moleküldatenbank zu identifizieren. Die Software lieferte eine potente Substanz (EC50 = 44 nM) mit über 100facher Selektivität gegenüber PPARgamma. In einer zweiten Studie wurde eine Leitstruktur de novo generiert und synthetisiert. Als Ausgangstruktur diente der bekannte PPARalpha-Agonist GW590735. Während des Designvorgangs wurden zwei Teilstrukturen, die für die Aktivität von GW590735 verantwortlich sind, durch bioisostere Gruppen ersetzt, die von SQUIRRELnovo vorgeschlagen wurden. Die neue Leitstruktur aktiviert PPARalpha in einem zellbasierten Reportergen-Testsystem bei einem EC50 von 0.51 µM.