Refine
Year of publication
Document Type
- Doctoral Thesis (28)
Has Fulltext
- yes (28)
Is part of the Bibliography
- no (28)
Keywords
- Computational chemistry (5)
- Arzneimitteldesign (3)
- Bioinformatik (3)
- Screening (3)
- Virtual Screening (3)
- Docking (2)
- Drug design (2)
- In silico-Methode (2)
- Molekulare Bioinformatik (2)
- Neuronales Netz (2)
Institute
- Biowissenschaften (15)
- Biochemie und Chemie (6)
- Pharmazie (6)
- Medizin (1)
Virtual screening of potential bioactive substances using the support vector machine approach
(2005)
Die vorliegende Dissertation stellt eine kumulative Arbeit dar, die in insgesamt acht wissenschaftlichen Publikationen (fünf publiziert, zwei eingerichtet und eine in Vorbereitung) dargelegt ist. In diesem Forschungsprojekt wurden Anwendungen von maschinellem Lernen für das virtuelle Screening von Moleküldatenbanken durchgeführt. Das Ziel war primär die Einführung und Überprüfung des Support-Vector-Machine (SVM) Ansatzes für das virtuelle Screening nach potentiellen Wirkstoffkandidaten. In der Einleitung der Arbeit ist die Rolle des virtuellen Screenings im Wirkstoffdesign beschrieben. Methoden des virtuellen Screenings können fast in jedem Bereich der gesamten pharmazeutischen Forschung angewendet werden. Maschinelles Lernen kann einen Einsatz finden von der Auswahl der ersten Moleküle, der Optimierung der Leitstrukturen bis hin zur Vorhersage von ADMET (Absorption, Distribution, Metabolism, Toxicity) Eigenschaften. In Abschnitt 4.2 werden möglichen Verfahren dargestellt, die zur Beschreibung von chemischen Strukturen eingesetzt werden können, um diese Strukturen in ein Format zu bringen (Deskriptoren), das man als Eingabe für maschinelle Lernverfahren wie Neuronale Netze oder SVM nutzen kann. Der Fokus ist dabei auf diejenigen Verfahren gerichtet, die in der vorliegenden Arbeit verwendet wurden. Die meisten Methoden berechnen Deskriptoren, die nur auf der zweidimensionalen (2D) Struktur basieren. Standard-Beispiele hierfür sind physikochemische Eigenschaften, Atom- und Bindungsanzahl etc. (Abschnitt 4.2.1). CATS Deskriptoren, ein topologisches Pharmakophorkonzept, sind ebenfalls 2D-basiert (Abschnitt 4.2.2). Ein anderer Typ von Deskriptoren beschreibt Eigenschaften, die aus einem dreidimensionalen (3D) Molekülmodell abgeleitet werden. Der Erfolg dieser Beschreibung hangt sehr stark davon ab, wie repräsentativ die 3D-Konformation ist, die für die Berechnung des Deskriptors angewendet wurde. Eine weitere Beschreibung, die wir in unserer Arbeit eingesetzt haben, waren Fingerprints. In unserem Fall waren die verwendeten Fingerprints ungeeignet zum Trainieren von Neuronale Netzen, da der Fingerprintvektor zu viele Dimensionen (~ 10 hoch 5) hatte. Im Gegensatz dazu hat das Training von SVM mit Fingerprints funktioniert. SVM hat den Vorteil im Vergleich zu anderen Methoden, dass sie in sehr hochdimensionalen Räumen gut klassifizieren kann. Dieser Zusammenhang zwischen SVM und Fingerprints war eine Neuheit, und wurde von uns erstmalig in die Chemieinformatik eingeführt. In Abschnitt 4.3 fokussiere ich mich auf die SVM-Methode. Für fast alle Klassifikationsaufgaben in dieser Arbeit wurde der SVM-Ansatz verwendet. Ein Schwerpunkt der Dissertation lag auf der SVM-Methode. Wegen Platzbeschränkungen wurde in den beigefügten Veröffentlichungen auf eine detaillierte Beschreibung der SVM verzichtet. Aus diesem Grund wird in Abschnitt 4.3 eine vollständige Einführung in SVM gegeben. Darin enthalten ist eine vollständige Diskussion der SVM Theorie: optimale Hyperfläche, Soft-Margin-Hyperfläche, quadratische Programmierung als Technik, um diese optimale Hyperfläche zu finden. Abschnitt 4.3 enthält auch eine Diskussion von Kernel-Funktionen, welche die genaue Form der optimalen Hyperfläche bestimmen. In Abschnitt 4.4 ist eine Einleitung in verschiede Methoden gegeben, die wir für die Auswahl von Deskriptoren genutzt haben. In diesem Abschnitt wird der Unterschied zwischen einer „Filter“- und der „Wrapper“-basierten Auswahl von Deskriptoren herausgearbeitet. In Veröffentlichung 3 (Abschnitt 7.3) haben wir die Vorteile und Nachteile von Filter- und Wrapper-basierten Methoden im virtuellen Screening vergleichend dargestellt. Abschnitt 7 besteht aus den Publikationen, die unsere Forschungsergebnisse enthalten. Unsere erste Publikation (Veröffentlichung 1) war ein Übersichtsartikel (Abschnitt 7.1). In diesem Artikel haben wir einen Gesamtüberblick der Anwendungen von SVM in der Bio- und Chemieinformatik gegeben. Wir diskutieren Anwendungen von SVM für die Gen-Chip-Analyse, die DNASequenzanalyse und die Vorhersage von Proteinstrukturen und Proteininteraktionen. Wir haben auch Beispiele beschrieben, wo SVM für die Vorhersage der Lokalisation von Proteinen in der Zelle genutzt wurden. Es wird dabei deutlich, dass SVM im Bereich des virtuellen Screenings noch nicht verbreitet war. Um den Einsatz von SVM als Hauptmethode unserer Forschung zu begründen, haben wir in unserer nächsten Publikation (Veröffentlichung 2) (Abschnitt 7.2) einen detaillierten Vergleich zwischen SVM und verschiedenen neuronalen Netzen, die sich als eine Standardmethode im virtuellen Screening etabliert haben, durchgeführt. Verglichen wurde die Trennung von wirstoffartigen und nicht-wirkstoffartigen Molekülen („Druglikeness“-Vorhersage). Die SVM konnte 82% aller Moleküle richtig klassifizieren. Die Klassifizierung war zudem robuster als mit dreilagigen feedforward-ANN bei der Verwendung verschiedener Anzahlen an Hidden-Neuronen. In diesem Projekt haben wir verschiedene Deskriptoren zur Beschreibung der Moleküle berechnet: Ghose-Crippen Fragmentdeskriptoren [86], physikochemische Eigenschaften [9] und topologische Pharmacophore (CATS) [10]. Die Entwicklung von weiteren Verfahren, die auf dem SVM-Konzept aufbauen, haben wir in den Publikationen in den Abschnitten 7.3 und 7.8 beschrieben. Veröffentlichung 3 stellt die Entwicklung einer neuen SVM-basierten Methode zur Auswahl von relevanten Deskriptoren für eine bestimmte Aktivität dar. Eingesetzt wurden die gleichen Deskriptoren wie in dem oben beschriebenen Projekt. Als charakteristische Molekülgruppen haben wir verschiedene Untermengen der COBRA Datenbank ausgewählt: 195 Thrombin Inhibitoren, 226 Kinase Inhibitoren und 227 Faktor Xa Inhibitoren. Es ist uns gelungen, die Anzahl der Deskriptoren von ursprünglich 407 auf ungefähr 50 zu verringern ohne signifikant an Klassifizierungsgenauigkeit zu verlieren. Unsere Methode haben wir mit einer Standardmethode für diese Anwendung verglichen, der Kolmogorov-Smirnov Statistik. Die SVM-basierte Methode erwies sich hierbei in jedem betrachteten Fall als besser als die Vergleichsmethoden hinsichtlich der Vorhersagegenauigkeit bei der gleichen Anzahl an Deskriptoren. Eine ausführliche Beschreibung ist in Abschnitt 4.4 gegeben. Dort sind auch verschiedene „Wrapper“ für die Deskriptoren-Auswahl beschrieben. Veröffentlichung 8 beschreibt die Anwendung von aktivem Lernen mit SVM. Die Idee des aktiven Lernens liegt in der Auswahl von Molekülen für das Lernverfahren aus dem Bereich an der Grenze der verschiedenen zu unterscheidenden Molekülklassen. Auf diese Weise kann die lokale Klassifikation verbessert werden. Die folgenden Gruppen von Moleküle wurden genutzt: ACE (Angiotensin converting enzyme), COX2 (Cyclooxygenase 2), CRF (Corticotropin releasing factor) Antagonisten, DPP (Dipeptidylpeptidase) IV, HIV (Human immunodeficiency virus) protease, Nuclear Receptors, NK (Neurokinin receptors), PPAR (peroxisome proliferator-activated receptor), Thrombin, GPCR und Matrix Metalloproteinasen. Aktives Lernen konnte die Leistungsfähigkeit des virtuellen Screenings verbessern, wie sich in dieser retrospektiven Studie zeigte. Es bleibt abzuwarten, ob sich das Verfahren durchsetzen wird, denn trotzt des Gewinns an Vorhersagegenauigkeit ist es aufgrund des mehrfachen SVMTrainings aufwändig. Die Publikationen aus den Abschnitten 7.5, 7.6 und 7.7 (Veröffentlichungen 5-7) zeigen praktische Anwendungen unserer SVM-Methoden im Wirkstoffdesign in Kombination mit anderen Verfahren, wie der Ähnlichkeitssuche und neuronalen Netzen zur Eigenschaftsvorhersage. In zwei Fällen haben wir mit dem Verfahren neuartige Liganden für COX-2 (cyclooxygenase 2) und dopamine D3/D2 Rezeptoren gefunden. Wir konnten somit klar zeigen, dass SVM-Methoden für das virtuelle Screening von Substanzdatensammlungen sinnvoll eingesetzt werden können. Es wurde im Rahmen der Arbeit auch ein schnelles Verfahren zur Erzeugung großer kombinatorischer Molekülbibliotheken entwickelt, welches auf der SMILES Notation aufbaut. Im frühen Stadium des Wirstoffdesigns ist es wichtig, eine möglichst „diverse“ Gruppe von Molekülen zu testen. Es gibt verschiedene etablierte Methoden, die eine solche Untermenge auswählen können. Wir haben eine neue Methode entwickelt, die genauer als die bekannte MaxMin-Methode sein sollte. Als erster Schritt wurde die „Probability Density Estimation“ (PDE) für die verfügbaren Moleküle berechnet. [78] Dafür haben wir jedes Molekül mit Deskriptoren beschrieben und die PDE im N-dimensionalen Deskriptorraum berechnet. Die Moleküle wurde mit dem Metropolis Algorithmus ausgewählt. [87] Die Idee liegt darin, wenige Moleküle aus den Bereichen mit hoher Dichte auszuwählen und mehr Moleküle aus den Bereichen mit niedriger Dichte. Die erhaltenen Ergebnisse wiesen jedoch auf zwei Nachteile hin. Erstens wurden Moleküle mit unrealistischen Deskriptorwerten ausgewählt und zweitens war unser Algorithmus zu langsam. Dieser Aspekt der Arbeit wurde daher nicht weiter verfolgt. In Veröffentlichung 6 (Abschnitt 7.6) haben wir in Zusammenarbeit mit der Molecular-Modeling Gruppe von Aventis-Pharma Deutschland (Frankfurt) einen SVM-basierten ADME Filter zur Früherkennung von CYP 2C9 Liganden entwickelt. Dieser nichtlineare SVM-Filter erreichte eine signifikant höhere Vorhersagegenauigkeit (q2 = 0.48) als ein auf den gleichen Daten entwickelten PLS-Modell (q2 = 0.34). Es wurden hierbei Dreipunkt-Pharmakophordeskriptoren eingesetzt, die auf einem dreidimensionalen Molekülmodell aufbauen. Eines der wichtigen Probleme im computerbasierten Wirkstoffdesign ist die Auswahl einer geeigneten Konformation für ein Molekül. Wir haben versucht, SVM auf dieses Problem anzuwenden. Der Trainingdatensatz wurde dazu mit jeweils mehreren Konformationen pro Molekül angereichert und ein SVM Modell gerechnet. Es wurden anschließend die Konformationen mit den am schlechtesten vorhergesagten IC50 Wert aussortiert. Die verbliebenen gemäß dem SVM-Modell bevorzugten Konformationen waren jedoch unrealistisch. Dieses Ergebnis zeigt Grenzen des SVM-Ansatzes auf. Wir glauben jedoch, dass weitere Forschung auf diesem Gebiet zu besseren Ergebnissen führen kann.
Helicobacter pylori (H. pylori) ist ein gram-negatives, mikroaerophiles Bakterium. Es kolonisiert die menschliche Magenschleimhaut, wobei mehr als 50% der Menschheit befallen sind. Als Pathogen begünstigt es die Entstehung von Magengeschwüren und –krebs. Experimentelle Befunde deuten darauf hin, dass H. pylori während der Infektion Kontakt zu Membranproteinen der Wirtszellen aufnimmt, um ein Typ IV Sekretionssystem aufzubauen und den primären Virulenzfaktor CagA (Cytotoxin Associated Antigen A) in die Wirtszelle zu translokieren. Diese Integrine genannten Membranproteine werden bei polaren Epithelzellen allerdings bevorzugt basolateral expremiert. Außerdem können extrazellulär geschnittene E-Cadherinfragmente im Medium mit H. pylori infizierter Zellkulturen nachgewiesen werden. Beide Beobachtungen legen den Schluss nahe, dass eine Protease von H. pylori sekretiert wird und die Zell-Zell-Kontakte degradiert, um H. pylori den Zugang zur basolateralen Seite der Wirtszellen zu ermöglichen. Das vom Gen hp1019 des Stammes H. pylori 26695 codierte Protein HtrA konnte im Rahmen einer Kooperation mit dem Paul-Ehrlich-Institut in Langen im Überstand von H. pylori mit proteolytischer Aktivität nachgewiesen werden. Um den Einfluss dieser extrazellulären Protease auf die Infektion von Kulturzellen mir H. pylori zu untersuchen, sollte ein niedermolekularer Inhibitor für HtrA gefunden werden. Ein Homologiemodell als Grundlage für ein strukturbasiertes virtuelles Screening wurde berechnet, wobei die aktive Konformation der Protease DegP von Escherichia coli als Vorlage diente (PDB Identifikation 3cs0). Für einen neue, im Rahmen dieser Untersuchung entwickelten Methode wurde PocketPicker eingesetzt, um Größe und Form der die Bindetaschen auf der Proteinoberfläche vorherzusagen. Durch die komplementäre Projektion von Proteinatomtypen auf diese definierte Volumen kann so für eine von PocketPicker vorgesagte Bindetasche ein potentielles Pharmakophormodell berechnet und für Datenbanksuchen eingesetzt werden. In retrospektiven Studien konnte die Funktion dieser Berechungen für eine Auswahl an pharmakologisch wichtigen Proteinen aus verschiedenen Strukturklassen validiert werden. Dabei stellte sich vor allem eine Abhängigkeit der Güte der Modelle von der Güte der Vorhersage von PocketPicker heraus, was den Schluss zulässt, dass eine möglichst genaue Definition der Bindetasche für das Gelingen eines strukturbasierten virtuellen Screening unerlässlich ist. Für die Protease HtrA von H. pylori konnten erfolgreich drei strukturabgeleitete Pharmakophormodelle berechnet werden, wobei jeweils verschiedene von PocketPicker vorhergesagte Bindetaschen einbezogen wurden. Die Molekülkataloge der Firmen Asinex und Specs wurden nach Ähnlichkeit zu diesen Modellen sortiert und nach Begutachtung der jeweils ähnlichsten 100 Substanzen wurden 26 Substanzen ausgewählt und bestellt. In einem in vitro Assay mit der rekombinanten Protease HtrA inhibierten 6 Substanzen den Verdau eines rekombinanten Substrats. Die beste Verbindung erreichte in dem Assay eine maximale Inhibition von ca. 77 % bei einer mittleren inhibitorischen Konzentration bei halbmaximaler Inhibition (IC50) von ca. 26 µM.
We investigate the utility of modern kernel-based machine learning methods for ligand-based virtual screening. In particular, we introduce a new graph kernel based on iterative graph similarity and optimal assignments, apply kernel principle component analysis to projection error-based novelty detection, and discover a new selective agonist of the peroxisome proliferator-activated receptor gamma using Gaussian process regression. Virtual screening, the computational ranking of compounds with respect to a predicted property, is a cheminformatics problem relevant to the hit generation phase of drug development. Its ligand-based variant relies on the similarity principle, which states that (structurally) similar compounds tend to have similar properties. We describe the kernel-based machine learning approach to ligand-based virtual screening; in this, we stress the role of molecular representations, including the (dis)similarity measures defined on them, investigate effects in high-dimensional chemical descriptor spaces and their consequences for similarity-based approaches, review literature recommendations on retrospective virtual screening, and present an example workflow. Graph kernels are formal similarity measures that are defined directly on graphs, such as the annotated molecular structure graph, and correspond to inner products. We review graph kernels, in particular those based on random walks, subgraphs, and optimal vertex assignments. Combining the latter with an iterative graph similarity scheme, we develop the iterative similarity optimal assignment graph kernel, give an iterative algorithm for its computation, prove convergence of the algorithm and the uniqueness of the solution, and provide an upper bound on the number of iterations necessary to achieve a desired precision. In a retrospective virtual screening study, our kernel consistently improved performance over chemical descriptors as well as other optimal assignment graph kernels. Chemical data sets often lie on manifolds of lower dimensionality than the embedding chemical descriptor space. Dimensionality reduction methods try to identify these manifolds, effectively providing descriptive models of the data. For spectral methods based on kernel principle component analysis, the projection error is a quantitative measure of how well new samples are described by such models. This can be used for the identification of compounds structurally dissimilar to the training samples, leading to projection error-based novelty detection for virtual screening using only positive samples. We provide proof of principle by using principle component analysis to learn the concept of fatty acids. The peroxisome proliferator-activated receptor (PPAR) is a nuclear transcription factor that regulates lipid and glucose metabolism, playing a crucial role in the development of type 2 diabetes and dyslipidemia. We establish a Gaussian process regression model for PPAR gamma agonists using a combination of chemical descriptors and the iterative similarity optimal assignment kernel via multiple kernel learning. Screening of a vendor library and subsequent testing of 15 selected compounds in a cell-based transactivation assay resulted in 4 active compounds. One compound, a natural product with cyclobutane scaffold, is a full selective PPAR gamma agonist (EC50 = 10 +/- 0.2 muM, inactive on PPAR alpha and PPAR beta/delta at 10 muM). The study delivered a novel PPAR gamma agonist, de-orphanized a natural bioactive product, and, hints at the natural product origins of pharmacophore patterns in synthetic ligands.
Identifizierung und Charakterisierung neuartiger 5-Lipoxygenase-Inhibitoren – in silico und in vitro
(2009)
Ziel dieser Arbeit war die Identifizierung und Charakterisierung neuer potenter 5-LO-Inhibitoren unter Verwendung sowohl computergestützter als auch experimenteller Methoden. Ausgangspunkt war ein ligandenbasiertes virtuelles Screening unter Verwendung der ladungsbasierten Deskriptoren Charge3D und TripleCharge3D. Hierbei konnten zwei neue direkte 5-LO-Inhibitoren identifiziert werden. Jede dieser beiden Substanzen diente als Startpunkt weiterer virtueller Screenings mit dem Ziel, die Potenz der Substanzen zu verbessern bzw. eine SAR der Substanzklasse zu erhalten. Dabei zeigte sich für die Klasse der Thiazolinone, dass eine hohe Toleranz gegenüber unterschiedlichen Substituenten am Grundgerüst bezüglich der Auswirkung auf die Aktivität vorliegt: insbesondere werden relativ große Substituenten toleriert. Des Weiteren scheint der 2-Phenylsubstituent für die 5-LO-inhibitorische Aktivität essentiell zu sein, da Derivate, die einen Heterozyklus an dieser Position aufweisen, inaktiv sind. Eines der aktivsten Derivate dieser Klasse, C06 (Substanz 12), konnte weiter molekular-pharmakologisch charakterisiert werden. Die Substanz zeigt keine offensichtlichen zytotoxischen Effekte, ist unabhängig vom Stimulus der 5-LO-Aktivierung und zeigt nanomolare inhibitorische Aktivität sowohl in intakten PMNL (IC50-Wert 0,65 ;M) als auch in PMNL-Homogenaten (IC50-Wert 0,66 ;M) sowie in zellfreiem PMNL-S100 (IC50-Wert 0,26 ;M) und am gereinigten Enzym (IC50-Wert 0,3 ;M). C06 ist selektiv für die 5-LO, da andere arachidonsäurebindende Proteine (PPARs, cPLA2 und 12- und 15-LO) nicht beeinflusst werden. Auch Nager-5-LO (aus der Ratte und der Maus) wird inhibiert mit IC50-Werten im nanomolaren Bereich. Allerdings zeigte sich die Substanz inaktiv in einem menschlichen Vollblutassay in Gegenwart von Serum. C06 scheint nicht an die für die Interaktion der 5-LO mit der Membran verantwortliche C2-ähnliche Domäne der 5-LO zu binden. Ebenso hat der Membranbestandteil Phosphatidylcholin keinen bzw. nur geringen Einfluss auf das inhibitorische Potential von C06. Aktivitätstests mit steigender Substratkonzentration deuten auf einen allosterischen Bindemodus von C06 hin. Diese experimentellen Daten flossen in die Identifizierung des putativen Bindemodus an der 5-LO ein. Hierzu wurde zunächst ein Homologie-Modell der 5-LO unter Verwendung der kürzlich neu veröffentlichten Daten der Röntgenkristallstruktur der Kaninchen-15-LO (PDB-Code: 2p0m [Choi et al., 2008]) erstellt. Durch eine Bindetaschenvorhersage mit dem Programm PocketPicker und einer pseudorezptorbasierten Auswahl der potentiellen Bindetasche mit anschliessendem Liganden-Docking konnten zwei Bindebereiche postuliert werden, beide an einer Oberflächenbindetasche der 5-LO ausserhalb des aktiven Zentrums. Dies ist im Einklang mit der SAR der Substanzklasse, die zeigt, dass relativ große Substituenten toleriert werden. Erste Mutationsstudien deuten darauf hin, dass die Bindung von C06 in einer Bindetasche um die Aminosäure Y558 erfolgt. In der zweiten postulierten Bindetasche konnten zwei Aminosäuren identifiziert werden, die für die Aktivität der 5-LO essentiell sind: Mutationen von F169 und F177 zu Alanin führten zu einer abgeschwächten Produktivität der 5-LO (12% bzw. 32% der Aktivität der wt-5-LO) sowie zu einem veränderten Produktspektrum. Bei der zweiten Klasse der 5-LO-Inhibitoren, die in der ersten virtuellen Screeningrunde mit den Deskriptoren Charge3D und TripleCharge3D identifiziert werden konnten, handelt es sich um Pyridin-Imidazole. In einem dreistufigen virtuellen Screening konnte die Potenz dieser Substanzklasse von 10 ;M (Substanz 10) in PMNL-S100 auf 0,3 ;M (Substanz 80) verbessert werden. Bei einer der aktivsten Substanzen aus der zweiten Screeningrunde, B02 (Substanz 68), die weiter charakterisiert wurde, handelt es sich um einen direkten 5-LO-Inhibitor mit nanomolarer inhibitorischer Aktivität, der an die C2-ähnliche Domäne bindet. Es wurde ein Bindemodus durch Bindetaschenvorhersage, pseudorezeptorbasierte Bindetaschenlokalisierung und Liganden-Docking postuliert. Ein Problem dieser Substanzklasse ist jedoch ihre Zytotoxizität. Im letzten Teil dieser Arbeit wurde durch ein Protein-Protein-Docking eine mögliche Konformation eines Dimers der 5-LO modelliert. Die postulierten Modelle zeigen bevorzugt eine Konformation, bei der beide Untereinheiten des Dimers eine „head-to-tail“-Orientierung einnehmen. Diese Dimer-Modelle können als Startpunkt genutzt werden, um Modulatoren der Protein-Protein-Interaktion als neuartige Inhibitoren der 5-LO zu entwerfen.
Identifizierung und Charakterisierung neuartiger 5-Lipoxygenase-Inhibitoren – in silico und in vitro
(2009)
Ziel dieser Arbeit war die Identifizierung und Charakterisierung neuer potenter 5-LO-Inhibitoren unter Verwendung sowohl computergestützter als auch experimenteller Methoden. Ausgangspunkt war ein ligandenbasiertes virtuelles Screening unter Verwendung der ladungsbasierten Deskriptoren Charge 3D und TripleCharge3D. Hierbei konnten zwei neue direkte 5-LO-Inhibitoren identifiziert werden. Jede dieser beiden Substanzen diente als Startpunkt weiterer virtueller Screenings mit dem Ziel, die Potenz der Substanzen zu verbessern bzw. eine SAR der Substanzklasse zu erhalten. Dabei zeigte sich für die Klasse der Thiazolinone, dass eine hohe Toleranz gegenüber unterschiedlichen Substituenten am Grundgerüst bezüglich der Auswirkung auf die Aktivität vorliegt: insbesondere werden relativ große Substituenten toleriert. Des Weiteren scheint der 2-Phenylsubstituent für die 5-LO-inhibitorische Aktivität essentiell zu sein, da Derivate, die einen Heterozyklus an dieser Position aufweisen, inaktiv sind. Eines der aktivsten Derivate dieser Klasse, C06 (Substanz 12), konnte weiter molekular-pharmakologisch charakterisiert werden. Die Substanz zeigt keine offensichtlichen zytotoxischen Effekte, ist unabhängig vom Stimulus der 5-LO-Aktivierung und zeigt nanomolare inhibitorische Aktivität sowohl in intakten PMNL (IC50-Wert 0,65 =M) als auch in PMNL-Homogenaten (IC50-Wert 0,66 =M) sowie in zellfreiem PMNL-S100 (IC50-Wert 0,26 =M) und am gereinigten Enzym (IC50-Wert 0,3 =M). C06 ist selektiv für die 5-LO, da andere arachidonsäurebindende Proteine (PPARs, cPLA2 und 12- und 15-LO) nicht beeinflusst werden. Auch Nager-5-LO (aus der Ratte und der Maus) wird inhibiert mit IC50-Werten im nanomolaren Bereich. Allerdings zeigte sich die Substanz inaktiv in einem menschlichen Vollblutassay in Gegenwart von Serum. C06 scheint nicht an die für die Interaktion der 5-LO mit der Membran verantwortliche C2-ähnliche Domäne der 5-LO zu binden. Ebenso hat der Membranbestandteil Phosphatidylcholin keinen bzw. nur geringen Einfluss auf das inhibitorische Potential von C06. Aktivitätstests mit steigender Substratkonzentration deuten auf einen allosterischen Bindemodus von C06 hin. Diese experimentellen Daten flossen in die Identifizierung des putativen putativen Bindemodus an der 5-LO ein. Hierzu wurde zunächst ein Homologie- Modell der 5-LO unter Verwendung der kürzlich neu veröffentlichten Daten der Röntgenkristallstruktur der Kaninchen-15-LO (PDB-Code: 2p0m [Choi et al., 2008]) erstellt. Durch eine Bindetaschenvorhersage mit dem Programm PocketPicker und einer pseudorezptorbasierten Auswahl der potentiellen Bindetasche mit anschliessendem Liganden-Docking konnten zwei Bindebereiche postuliert werden, beide an einer Oberflächenbindetasche der 5-LO ausserhalb des aktiven Zentrums. .....
Das Ziel dieser Arbeit war es, RNA-Strukturen als potentielle Zielstrukturen für die Medikamentenentwicklung zu untersuchen. Hierbei ging es im Speziellen um die Anwendung Virtueller Screening Verfahren für die RNA-Liganden-Vorhersage. Hierzu wurde die als TAR-Motiv (transactivating response element) bekannte RNA-Struktur der mRNAs des HI-Virus ausgewählt. Diese Struktur wurde gewählt, da mit den vier PDB-Einträgen 1ANR, 1ARJ, 1LVJ und 1QD3 bereits experimentell motivierte Strukturmodelle zum Beginn der Untersuchung vorlagen. Ausschlaggebend war hierbei auch das Vorhandensein eines Tat-TAR-FRET-Assays im Rahmen des SFB 579, in welchem diese Arbeit angefertigt wurde. Die Aufmerksamkeit, welche dem HI-Virus im Rahmen der Bekämpfung der Immunschwächekrankheit bereits zukam, führte bei dem gewählten Testmodell ebenfalls zu einem, wenn auch immer noch überschaubaren Datensatz bereits getesteter Substanzen, der als Grundlage für einen Liganden-basierten Ansatz als erste Basis dienen konnte. Basierend auf diesen Voruntersuchungen ergaben sich die weiteren Schritte dieser Arbeit. Die Arbeit lässt sich zusammenfassend in vier zum Teil parallel verlaufende Phasen einteilen: Phase 1:Bestandsaufnahme bekannter Informationen über die Zielstruktur · experimentell bestimmte Zielstrukturen · experimentell bestimmte Liganden/Nichtliganden der Zielstruktur Phase 2: Ableiten eines ligandenbasierten Ansatzes zur Vorhersage von potentiellen Bindern der Zielstruktur aus Substanzbibliotheken, der nicht auf Strukturdaten der Zielstruktur beruht. Phase 3: Analyse der bekannten Konformere der Zielstruktur auf konstante Angriffspunkte für ein spezielles Liganden-Design. Phase 4: Einbinden der bekannten Strukturinformationen der Zielstruktur zur weiteren Verfeinerung der Auswahlverfahren neuer Kandidaten für die weitere experimentelle Bestimmung des Bindeverhaltens. Im Rahmen dieser Arbeit konnten mittels der Anwendung von künstlichen neuronalen Netzen in einem ligandenbasierten Ansatz durch virtuelles Screening der Chemikalien-Datenbanken verschiedener Lieferanten fünf neue potentielle TAR-RNA-Liganden identifiziert werden (drei davon mit einem Methylenaminoguanidyl-Substrukturmotiv), sowie als „Spin-Off“ durch die Anwendung der ursprünglich nur für den Tat-TAR-FRET-Assay vorgesehenen Testsubstanzen in einem Kooperationsprojekt (mittels CFivTT-Assay) zwei neue potentiell antibakterielle Verbindungen identifiziert werden. Die Beschäftigung mit der offensichtlichen Flexibilität der TAR-RNA und damit einer nicht eindeutig zu definierenden Referenz-Zielstruktur für das Liganden-Docking führte zur Erstellung eines Software-Pakets, mit dem flexible Zielstrukturen – basierend auf den Konformer-Datensätzen von MD-Simulationen – auf konstante Angriffspunkte untersucht werden können. Hierbei wurde ausgehend von der Integration eines Taschenvorhersage-Programms (PocketPicker) eine Reihe von Filtern implementiert, die auf den hierzu in einer MySQL-Datenbank abgelegten Strukturinformationen eine Einschränkung des möglichen Taschenraums für das zukünftige Liganden-Design automatisiert vornehmen können. Des Weiteren ermöglicht dieser Ansatz einen einfachen Zugriff auf die einzelnen Konformere und die Möglichkeit Annotationen zu den Konformeren und den daraus abgeleiteten Tascheninformationen hinzuzufügen, so dass diese Informationen für die Erstellung von Liganden-Docking-Versuchen verwendet werden können. Ferner wurden im Rahmen dieser Arbeit ein neuer Deskriptor für die Beschreibung von Taschenoberflächen eingeführt: der auf der „Skalierungs-Index-Methode“ basierende molekulare SIMPrint. Die Beschäftigung mit der Verteilung der potentiellen Bindetaschen auf der Oberfläche der Konformerensemble führte ferner zur Definition der Taschenoberflächenbildungswahrscheinlichkeit (Pocket Surface Generation Probability – PSGP) für einzelne Atome einer Zielstruktur, die tendenziell für die Einschätzung der Ausbildung einer potentiell langlebigen Interaktion eines Liganden mit der Zielstruktur herangezogen werden kann, um beispielsweise Docking-Posen zu bewerten.
Kenntnisse über die dreidimensionale Struktur therapeutisch relevanter Zielproteine bieten wertvolle Informationen für den rationalen Wirkstoffentwurf. Die stetig wachsende Zahl aufgeklärter Kristallstrukturen von Proteinen ermöglicht eine qualitative und quantitative rechnergestützte Untersuchung von spezifischen Protein-Liganden Wechselwirkungen. Im Rahmen dieser Arbeit wurden neue Algorithmen für die Identifikation und den Ähnlichkeitsvergleich von Proteinbindetaschen und ihren Eigenschaften entwickelt und in dem Programm PocketomePicker zusammengefasst. Die Software gliedert sich in die Routinen PocketPicker, PocketShapelets und PocketGraph. Ferner wurde in dieser Arbeit die Methode ReverseLIQUID reimplementiert und im Rahmen einer Kooperation für das strukturbasierte Virtuelle Screening angewendet. Die genannten Methoden und ihre wissenschaftliche Anwendungen sollte hier zusammengefasst werden: Die Methode PocketPicker ermöglicht die Vorhersage potentieller Bindetaschen auf Proteinoberflächen. Diese Technik implementiert einen geometrischen Ansatz auf Basis „künstlicher Gitter“ zur Identifikation zusammenhängender vergrabener Bereiche der Proteinoberfläche als Orte möglicher Ligandenbindestellen. Die Methode erreicht eine korrekte Vorhersage der tatsächlichen Bindetasche für 73 % der Einträge eines repräsentativen Datensatzes von Proteinstrukturen. Für 90 % der Proteinstrukturen wird die tatsächlich Ligandenbindestelle unter den drei wahrscheinlichsten vorhergesagten Taschen gefunden. PocketPicker übertrifft die Vorhersagequalität anderer etablierter Algorithmen und ermöglicht Taschenidentifikationen auf apo-Strukturen ohne signifikante Einbußen des Vorhersageerfolges. Andere Verfahren weisen deutlich eingeschränkte Ergebnisse bei der Anwendung auf apo-Strukturen auf. PocketPicker erlaubt den alignmentfreien Ähnlichkeitsvergleich von Bindetaschenfor-men durch die Kodierung berechneter Bindevolumen als Korrelationsdeskriptoren. Dieser Ansatz wurde erfolgreich für Funktionsvorhersage von Bindetaschen aus Homologiemodellen von APOBEC3C und Glutamat Dehydrogenase des Malariaerregers Plasmodium falciparum angewendet. Diese beiden Projekte wurden in Zusammenarbeit mit Kollaborationspartnern durchgeführt. Zudem wurden PocketPicker Korrelationsdeskriptoren erfolgreich für die automatisierte Konformationsanalyse der enzymatischen Tasche von Aldose Reduktase angewendet. Für detaillierte Analysen der Form und der physikochemischen Eigenschaften von Proteinbindetaschen wurde in dieser Arbeit die Methode PocketShapelets entwickelt. Diese Technik ermöglicht strukturelle Alignments von extrahierten Bindevolumen durch Zerlegungen der Oberfläche von Proteinbindetaschen. Die Überlagerung gelingt durch die Identifikation strukturell ähnlicher Oberflächenkurvaturen zweier Taschen. PocketShapelets wurde erfolgreich zur Analyse funktioneller Ähnlichkeit von Bindetaschen verwendet, die auf Betrachtungen physikochemischer Eigenschaften basiert. Zur Analyse der topologischen Vielfalt von Bindetaschengeometrien wurde in dieser Arbeit die Methode PocketGraph entwickelt. Dieser Ansatz nutzt das Konzept des sog. „Wachsenden Neuronalen Gases“ aus dem Bereich des maschinellen Lernens für eine automatische Extraktion des strukturellen Aufbaus von Bindetaschen. Ferner ermöglicht diese Methode die Zerlegung einer Bindestelle in ihre Subtaschen. Die von PocketPicker charakterisierten Taschenvolumen bilden die Grundlage für die Methode ReverseLIQUID. Dieses Programm wurde in dieser Arbeit weiterentwickelt und im Rahmen einer Kooperation zur Identifikation eines Inhibitors der Serinprotease HtrA des Erregers Helicobacter pylori verwendet. Mit ReverseLIQUID konnte ein strukturbasiertes Pharmakophormodell für das Virtuelle Screening erstellt werden. Dieser Ansatz ermöglichte die Identifikation einer Substanz mit niedrig mikromolarer Affinität gegenüber der Zielstruktur.
Im Rahmen dieser Arbeit wurde die Eignung von Pseudorezeptoren im virtuellen Screening untersucht. Hierzu wurde nach intensiver Auseinandersetzung mit bisher bekannten Konzepten ein neues Computerprogramm zur automatischen Konstruktion von Pseudorezeptormodellen entwickelt. Das Ziel von Pseudorezeptoren ist die Konstruktion eines alternativen, artifiziellen Wirtssystems aus bekannten Liganden eines Zielproteins, dessen dreidimensionale Struktur unbekannt ist. Der generierte Pseudorezeptor ist zu verstehen als die Menge aller Pseudoatome, die um die Ausgangssubstanz(en) projiziert werden. Bei multiplen Referenzliganden wird eine Gewichtung der Pseudoatome durchgeführt. Zudem wird ausschließlich von Distanz- und Winkelparametern Gebrauch gemacht, die aus Untersuchungen von Kokristall-strukturen gewonnenen wurden. Eine abschließende Kodierung generierter Pseudorezeptoren als 90-dimensionalen Korrelationsvektor wurde zum virtuellen Screening eingesetzt. In zwei retrospektiven Fallbeispielen wird gezeigt, dass die generierten Pseudorezeptoren für COX-2 und PPARα mit den realen Zuständen ihrer kokristallisierten Bindetaschen in den PDB Einträge 6cox und 2p54 kompatibel sind. Im retrospektiven virtuellen Screening in der Wirkstoffdatenbank COBRA (8.311 Moleküle) nach COX-2 Inhibitoren (136 Aktive) konnte eine Anreicherung der aktiven Strukturen in den ersten zwei Perzentilen gezeigt werden (54% der Aktiven). Zudem konnten 80% der aktiven Moleküle bereits nach Vorhersage von 10% Falsch-Positiven gefunden werden. Im Falle des retrospektiven Screenings nach 94 PPAR Liganden konnten 30% der aktiven Moleküle nach der Vorhersage von 10% Falsch-Positiven entdeckt. Nach 20% Falsch-Positiver wurden 46% der PPAR Liganden wieder gefunden. Weiterhin konnte mit den ligandenbasierten Informationen eines H4 Pseudorezeptors eine Justierung einer potentiellen Bindetasche des Histamin H4 Rezeptors aus einer molekularen Dynamiksimulation vorgenommen werden. Schließlich wurde in einem prospektiven virtuellen Screening nach Histamin H4 Liganden mit einem Pseudorezeptor zwei Strukturen mit unterschiedlichem Grundgerüst und einem Ki ~ 30 µM identifiziert.
Die Identifikation neuer Hits und Leitstrukturen sind die ersten Schritte bei der Entwicklung neuer Arzneistoffe. Dieser Herausforderung wird derzeit primär mittels High-Throughput-Screening oder der gezielten Modifikationen bekannter Liganden begegnet. Eine weitere Option ist das computerbasierte virtuelle Screening, das es kostengünstig ermöglicht, in kurzer Zeit sehr viele Moleküle auf ihre potentielle biologische Aktivität hin zu untersuchen. Der in dieser Arbeit verwendete Ansatz zur Identifikation neuer Inhibitoren der 5-Lipoxygenase und der Cyclooxygenase-2 beruht auf dem Verfahren des ligandenbasierten virtuellen Screenings. Unter der Voraussetzung der Kenntnis mindestens eines Referenzliganden können so mittels einer Ähnlichkeitsanalyse potentielle neue strukturelle Grundgerüste identifiziert werden. Zu diesem Zweck wurde ein auf atomaren Partialladungen und der dreidimensionalen Struktur der Moleküle basierender Deskriptor (Charge3D/TripleCharge3D) entwickelt. In retrospektiven Studien mit Cyclooxygenase-2 Inhibitoren wurde die Effektivität der neuen Deskriptoren überprüft und mittel eines evolutionären Algorithmus optimiert. Der Charge3D Deskriptor erreicht Anreicherungsfaktoren bis zu 16,1 im ersten Perzentil der durchsuchten Datenbank, wohingegen der TripleCharge3D Deskriptor mit seiner detailierteren Ladungsauftrennung Werte von bis zu 24,8 erreichte. Ein ebensolches retrospektives Screening wurde für 5-Lipoxygenase Inhibitoren durchgeführt. Den maximalen Anreicherungsfaktor von 6,1 im ersten Prozent der Datenbank erreichte hier der Charge3D Deskriptor, der TripleCharge3D Deskriptor erreichte 5,3. Diese wesentlich geringeren Werte sind auf die Diversität der 5-LO Inhibitoren (54 Inhibitoren mit 39 verschiedenen Grundgerüsten) und deren unterschiedliche Inhibitortypen (Redox, nicht Redox und Eisen-bindende Inhibitoren) mit ihren jeweiligen Bindemodi zurückzuführen. In Screenings nach 5-LO Inhibitoren in der Naturstoffdatenbank der Firma AnalytiCon Discovery und COX-25-LO Dualinhibitoren in Datenbanken der Firma Asinex konnten unter Verwendung der beiden Deskriptoren Inhibitoren, mit für diese Targets bislang unbekannten Scaffolds identifiziert werden. Unter Verwendung des 2D Pharmakophor Deskriptors CATS wurden zuerst zwei neue Scaffolds für Inhibitoren der 5-LO identifiziert. Struktur 1 ist den in vitro Assaydaten zufolge ein direkter Inhibitor der 5-LO. Struktur 2 hingegen erreicht seine Wirkung nicht nur über die direkte Interaktion mit der 5-LO. Eine Erklärung dafür wäre die Wechselwirkung mit dem 5-LO aktivierenden Protein FLAP, der Hemmung der Translokation der 5-LO zur Kernmembran, oder die Inhibition 5-LO aktivierender bzw. inaktivierender Kinasen. In nachfolgenden Screenings mit den Strukturen 1 und 2 als Referenzstrukturen konnten mittels der Charge Deskriptoren Substanzderivate (17 Moleküle) mit 5-LO inhibitorischer Wirkung (5 Moleküle mit IC50 Werte ≤ 1 μM an partiell aufgereinigter 5-LO), identifiziert werden. Für das Screening nach COX-2/5-LO Dualinhibitoren wurden 11 Strukturen mit 7 unterschiedlichen Scaffolds unter Verwendung der Charge Deskriptoren aus gewählt. Drei Moleküle zeigten keine 5-LO Aktivität, und jeweils eines nur in intakten PMNLs bzw. im S100 Zellüberstand. Die restlichen 6 Moleküle waren in beiden 5-LO Assays aktiv (intakte PMNLs IC50 zwischen 2 und 15 μM, S100 Zellüberstand 5-LO zwischen 0.5 μM und 25 μM). Somit zeigten 7 Moleküle im S100 Assay Aktivität und konnten als direkte Inhibitoren der 5-LO identifiziert werden. Im Cyclooxygenase-2 Aktivitätsassay mit intakten MonoMac6 Zellen zeigte eine der 11 Strukturen zudem eine geringe (IC50 = 70 μM) inhibierende Aktivität. Modifikationen zur Verbesserung der COX-2 Hemmung könnten in einem potenten COX-2/5-LO Dualinhibitor resultieren, der beispielsweise in der Schmerzbehandlung eingesetzt werden könnte. Ein weiteres Projekt war die Erstellung eines Homologiemodells der 5-LO basierend auf der 15-Lipoxygenase Struktur des Kaninchens (PDB-Struktur: 1LOX). Die Sequenzidentität der beiden Strukturen (1LOX / humane 5-LO) lag bei 37 %. Das Modell wurde zum einen zur Vorhersage von zugänglichen Caspase-6 Schnittstellen an der 5-LO angewandt, und zum anderen wurden Dockingexperimente in Aktiven Zentrum und in Bereichen der C2-like Domäne der 5-LO durchgeführt. Hyperforin, ein bekannter Inhibitor d er 5-Lipoxygenase, wurde an verschiedenen Stellen des Modells für Dockingexperiment eingebracht. Die im Aktiven Zentrum erreichten Scorewerte (Chemscore = -9±1) deuteten hier auf eine unfavorisierte Bindungsstelle hin. BWA4C (ein bekannter Eisenbinder) und ZM230487 (ein nicht-redox Inhibitor) erhielten im Aktiven Zentrum Scorewerte von 27±0,1 und 22±2,5, wodurch eine Bindung als wahrscheinlich angenommen werden kann. Weitere Dockingexperimente an der C2-like Domäne, und speziell am Interface zwischen der C2-like und der katalytischen Domäne, ergaben ähnlich hohe Chemscorewerte für Hyperforin, BWA4C und ZM230487. Aus diesen Resultaten ließ sich kein eindeutiger Bindemodus für Hyperforin ableiten. Eine Positionierung im Aktiven Zentrum ist nach diesen Experimenten unwahrscheinlich, so dass die Existenz einer weiteren, experimentell noch nicht identifizierten Bindestelle vermutet werden kann. Eine solche Interaktionsfläche könnte als Ansatzpunkt für die Entwicklung weiterer 5-Lipoxygenaseinhibitoren eine zentrale Rolle einnehmen.
Die Komplementarität der molekularen Oberflächen und der Pharmakophorpunkte ist ein verbreiteter Konzept im rechnergestützen Moleküldesign. Diesem Konzept folgend wurde die Software SQUIRREL neu entwickelt und in der Programmiersprache Java implemetiert. Die Software generiert die Vorschläge für den bioisosteren Ersatz von Molekülen und Molekülfragmenten. SQUIRREL kombiniert Oberflächen- und Pharmakophoreigenschaften bioaktiver Substanzen und kann im virtuellen Screening und fragment-basierten de novo Design eingesetzt werden. In einer prospektiven Studie wurde SQUIRREL verwendet, um neue selektive PPARalpha-Agonisten aus einer kommerziellen Moleküldatenbank zu identifizieren. Die Software lieferte eine potente Substanz (EC50 = 44 nM) mit über 100facher Selektivität gegenüber PPARgamma. In einer zweiten Studie wurde eine Leitstruktur de novo generiert und synthetisiert. Als Ausgangstruktur diente der bekannte PPARalpha-Agonist GW590735. Während des Designvorgangs wurden zwei Teilstrukturen, die für die Aktivität von GW590735 verantwortlich sind, durch bioisostere Gruppen ersetzt, die von SQUIRRELnovo vorgeschlagen wurden. Die neue Leitstruktur aktiviert PPARalpha in einem zellbasierten Reportergen-Testsystem bei einem EC50 von 0.51 µM.