Refine
Document Type
- Doctoral Thesis (14)
Has Fulltext
- yes (14)
Is part of the Bibliography
- no (14)
Keywords
- Computational chemistry (4)
- Arzneimitteldesign (3)
- Virtual Screening (3)
- Bioinformatik (2)
- Drug design (2)
- Molekulare Bioinformatik (2)
- Screening (2)
- Virtuelles Screening (2)
- Wirkstoff-Rezeptor-Bindung (2)
- Wirkstoffdesign (2)
Institute
- Biowissenschaften (14) (remove)
Reggie-1 (flotillin-2) and reggie-2 (flotillin-1) are membrane microdomain proteins which are associated with the membrane by means of acylation. They influence different cellular signaling processes, such as neuronal, T-cell and insulin signaling. Upon stimulation of the EGF receptor, reggie-1 becomes phosphorylated and undergoes tyrosine 163 dependent translocation from the plasma membrane to endosomal compartments. In addition, reggie-1 was shown to influence actindependent processes. Reggie-2 has been demonstrated to affect caveolin- and clathrin-independent endocytosis. Both proteins form homo- and hetero-oligomers, but the function of these oligomers has remained elusive. Moreover, it has not been clarified if functions of reggie-1 are also influenced by reggie-2 and vice versa. The first aim of the study was to further investigate the interplay and the heterooligomerization of reggie proteins and their functional effects. Both reggie proteins were individually depleted by means of siRNA. In different siRNA systems and various cell lines, reggie-1 depleted cells showed reduced protein amounts of reggie-1 and reggie-2, but reggie-2 knock down cells still expressed reggie-1 protein. The decrease of reggie-2 in reggie-1 depleted cells was only detected at protein but not at mRNA level. Furthermore, reggie-2 expression could be rescued by expression of siRNA resistant wild type reggie-1-EGFP constructs, but not by the soluble myristoylation mutant G2A. This mutant was also not able to associate with endogenous reggie-1 or reggie-2, which demonstrates that membrane association of reggie-1 is necessary for hetero-oligomerization. In addition, fluorescence microscopy studies and membrane fractionations showed that correct localization of overexpressed reggie-2 was dependent on co-overexpressed reggie-1. Thus, hetero-oligomerization is crucial for membrane association of reggie-2 and for its protein stability or protein expression. Moreover, the binding of reggie-2 to reggie-1 required tyrosine 163 of reggie-1 which was previously shown to be important for endosomal translocation of reggie-1. Since reggie-2 was implicated to function in clathrin- and caveolin-independent endocytosis pathways, the effect of reggie-2 depletion on reggie-1 endocytosis was investigated. Indeed, reggie-1 was dependent on reggie-2 for endosomal localization and EGF-induced endocytosis. By FRET-FLIM analysis it could be shown that reggie heterooligomers are dynamic in size or conformation upon EGF stimulation. Thus, it can be concluded that reggie proteins are interdependent in different aspects, such as protein stability or expression, membrane association and subcellular localization. In addition, these results demonstrate that the hetero-oligomers are dynamic and reggie proteins influence each other in terms of function. A further aim was the characterization of reggie-1 and reggie-2 function in actindependent processes, where so far only reggie-1 was known to play a role. Depletion of either of the proteins reduced cell migration, cell spreading and the number of focal adhesions in steady state cells. Thus, also reggie-2 affects actin-dependent processes. Further investigation of the focal adhesions during cell spreading revealed that depletion of reggie-1 displayed different effects as compared to reggie-2 knock down. Reggie-1 depleted cells had elongated cell-matrix-adhesions and showed reduced activation of FAK and ERK2. On the other hand, depletion of reggie-2 resulted in a restricted localization of focal adhesion at the periphery of the cell and decreased ERK2 phosphorylation, but it did not affect FAK autophosphorylation. Hence, reggie proteins influence the regulation of cell-matrix-adhesions differently. A link between reggie proteins and focal adhesions is the actin cross-linking protein -actinin. The interaction of -actinin with reggie-1 could be verified by means of co-immunoprecipitations and FRET-FLIM analysis. Reggie-1 binds -actinin especially in membrane ruffles and in other locations where actin remodeling takes place. Moreover, -actinin showed a different localization pattern during cell spreading in reggie-1 depleted cells, as compared to the control cells. These results provide further insights into the function of both reggie proteins. Their interplay and hetero-oligomerization was shown to be crucial for their role in endocytosis. In addition, both reggie proteins influence actin-dependent processes and differentially affect focal adhesion regulation.
Helicobacter pylori (H. pylori) ist ein gram-negatives, mikroaerophiles Bakterium. Es kolonisiert die menschliche Magenschleimhaut, wobei mehr als 50% der Menschheit befallen sind. Als Pathogen begünstigt es die Entstehung von Magengeschwüren und –krebs. Experimentelle Befunde deuten darauf hin, dass H. pylori während der Infektion Kontakt zu Membranproteinen der Wirtszellen aufnimmt, um ein Typ IV Sekretionssystem aufzubauen und den primären Virulenzfaktor CagA (Cytotoxin Associated Antigen A) in die Wirtszelle zu translokieren. Diese Integrine genannten Membranproteine werden bei polaren Epithelzellen allerdings bevorzugt basolateral expremiert. Außerdem können extrazellulär geschnittene E-Cadherinfragmente im Medium mit H. pylori infizierter Zellkulturen nachgewiesen werden. Beide Beobachtungen legen den Schluss nahe, dass eine Protease von H. pylori sekretiert wird und die Zell-Zell-Kontakte degradiert, um H. pylori den Zugang zur basolateralen Seite der Wirtszellen zu ermöglichen. Das vom Gen hp1019 des Stammes H. pylori 26695 codierte Protein HtrA konnte im Rahmen einer Kooperation mit dem Paul-Ehrlich-Institut in Langen im Überstand von H. pylori mit proteolytischer Aktivität nachgewiesen werden. Um den Einfluss dieser extrazellulären Protease auf die Infektion von Kulturzellen mir H. pylori zu untersuchen, sollte ein niedermolekularer Inhibitor für HtrA gefunden werden. Ein Homologiemodell als Grundlage für ein strukturbasiertes virtuelles Screening wurde berechnet, wobei die aktive Konformation der Protease DegP von Escherichia coli als Vorlage diente (PDB Identifikation 3cs0). Für einen neue, im Rahmen dieser Untersuchung entwickelten Methode wurde PocketPicker eingesetzt, um Größe und Form der die Bindetaschen auf der Proteinoberfläche vorherzusagen. Durch die komplementäre Projektion von Proteinatomtypen auf diese definierte Volumen kann so für eine von PocketPicker vorgesagte Bindetasche ein potentielles Pharmakophormodell berechnet und für Datenbanksuchen eingesetzt werden. In retrospektiven Studien konnte die Funktion dieser Berechungen für eine Auswahl an pharmakologisch wichtigen Proteinen aus verschiedenen Strukturklassen validiert werden. Dabei stellte sich vor allem eine Abhängigkeit der Güte der Modelle von der Güte der Vorhersage von PocketPicker heraus, was den Schluss zulässt, dass eine möglichst genaue Definition der Bindetasche für das Gelingen eines strukturbasierten virtuellen Screening unerlässlich ist. Für die Protease HtrA von H. pylori konnten erfolgreich drei strukturabgeleitete Pharmakophormodelle berechnet werden, wobei jeweils verschiedene von PocketPicker vorhergesagte Bindetaschen einbezogen wurden. Die Molekülkataloge der Firmen Asinex und Specs wurden nach Ähnlichkeit zu diesen Modellen sortiert und nach Begutachtung der jeweils ähnlichsten 100 Substanzen wurden 26 Substanzen ausgewählt und bestellt. In einem in vitro Assay mit der rekombinanten Protease HtrA inhibierten 6 Substanzen den Verdau eines rekombinanten Substrats. Die beste Verbindung erreichte in dem Assay eine maximale Inhibition von ca. 77 % bei einer mittleren inhibitorischen Konzentration bei halbmaximaler Inhibition (IC50) von ca. 26 µM.
We investigate the utility of modern kernel-based machine learning methods for ligand-based virtual screening. In particular, we introduce a new graph kernel based on iterative graph similarity and optimal assignments, apply kernel principle component analysis to projection error-based novelty detection, and discover a new selective agonist of the peroxisome proliferator-activated receptor gamma using Gaussian process regression. Virtual screening, the computational ranking of compounds with respect to a predicted property, is a cheminformatics problem relevant to the hit generation phase of drug development. Its ligand-based variant relies on the similarity principle, which states that (structurally) similar compounds tend to have similar properties. We describe the kernel-based machine learning approach to ligand-based virtual screening; in this, we stress the role of molecular representations, including the (dis)similarity measures defined on them, investigate effects in high-dimensional chemical descriptor spaces and their consequences for similarity-based approaches, review literature recommendations on retrospective virtual screening, and present an example workflow. Graph kernels are formal similarity measures that are defined directly on graphs, such as the annotated molecular structure graph, and correspond to inner products. We review graph kernels, in particular those based on random walks, subgraphs, and optimal vertex assignments. Combining the latter with an iterative graph similarity scheme, we develop the iterative similarity optimal assignment graph kernel, give an iterative algorithm for its computation, prove convergence of the algorithm and the uniqueness of the solution, and provide an upper bound on the number of iterations necessary to achieve a desired precision. In a retrospective virtual screening study, our kernel consistently improved performance over chemical descriptors as well as other optimal assignment graph kernels. Chemical data sets often lie on manifolds of lower dimensionality than the embedding chemical descriptor space. Dimensionality reduction methods try to identify these manifolds, effectively providing descriptive models of the data. For spectral methods based on kernel principle component analysis, the projection error is a quantitative measure of how well new samples are described by such models. This can be used for the identification of compounds structurally dissimilar to the training samples, leading to projection error-based novelty detection for virtual screening using only positive samples. We provide proof of principle by using principle component analysis to learn the concept of fatty acids. The peroxisome proliferator-activated receptor (PPAR) is a nuclear transcription factor that regulates lipid and glucose metabolism, playing a crucial role in the development of type 2 diabetes and dyslipidemia. We establish a Gaussian process regression model for PPAR gamma agonists using a combination of chemical descriptors and the iterative similarity optimal assignment kernel via multiple kernel learning. Screening of a vendor library and subsequent testing of 15 selected compounds in a cell-based transactivation assay resulted in 4 active compounds. One compound, a natural product with cyclobutane scaffold, is a full selective PPAR gamma agonist (EC50 = 10 +/- 0.2 muM, inactive on PPAR alpha and PPAR beta/delta at 10 muM). The study delivered a novel PPAR gamma agonist, de-orphanized a natural bioactive product, and, hints at the natural product origins of pharmacophore patterns in synthetic ligands.
Identifizierung und Charakterisierung neuartiger 5-Lipoxygenase-Inhibitoren – in silico und in vitro
(2009)
Ziel dieser Arbeit war die Identifizierung und Charakterisierung neuer potenter 5-LO-Inhibitoren unter Verwendung sowohl computergestützter als auch experimenteller Methoden. Ausgangspunkt war ein ligandenbasiertes virtuelles Screening unter Verwendung der ladungsbasierten Deskriptoren Charge 3D und TripleCharge3D. Hierbei konnten zwei neue direkte 5-LO-Inhibitoren identifiziert werden. Jede dieser beiden Substanzen diente als Startpunkt weiterer virtueller Screenings mit dem Ziel, die Potenz der Substanzen zu verbessern bzw. eine SAR der Substanzklasse zu erhalten. Dabei zeigte sich für die Klasse der Thiazolinone, dass eine hohe Toleranz gegenüber unterschiedlichen Substituenten am Grundgerüst bezüglich der Auswirkung auf die Aktivität vorliegt: insbesondere werden relativ große Substituenten toleriert. Des Weiteren scheint der 2-Phenylsubstituent für die 5-LO-inhibitorische Aktivität essentiell zu sein, da Derivate, die einen Heterozyklus an dieser Position aufweisen, inaktiv sind. Eines der aktivsten Derivate dieser Klasse, C06 (Substanz 12), konnte weiter molekular-pharmakologisch charakterisiert werden. Die Substanz zeigt keine offensichtlichen zytotoxischen Effekte, ist unabhängig vom Stimulus der 5-LO-Aktivierung und zeigt nanomolare inhibitorische Aktivität sowohl in intakten PMNL (IC50-Wert 0,65 =M) als auch in PMNL-Homogenaten (IC50-Wert 0,66 =M) sowie in zellfreiem PMNL-S100 (IC50-Wert 0,26 =M) und am gereinigten Enzym (IC50-Wert 0,3 =M). C06 ist selektiv für die 5-LO, da andere arachidonsäurebindende Proteine (PPARs, cPLA2 und 12- und 15-LO) nicht beeinflusst werden. Auch Nager-5-LO (aus der Ratte und der Maus) wird inhibiert mit IC50-Werten im nanomolaren Bereich. Allerdings zeigte sich die Substanz inaktiv in einem menschlichen Vollblutassay in Gegenwart von Serum. C06 scheint nicht an die für die Interaktion der 5-LO mit der Membran verantwortliche C2-ähnliche Domäne der 5-LO zu binden. Ebenso hat der Membranbestandteil Phosphatidylcholin keinen bzw. nur geringen Einfluss auf das inhibitorische Potential von C06. Aktivitätstests mit steigender Substratkonzentration deuten auf einen allosterischen Bindemodus von C06 hin. Diese experimentellen Daten flossen in die Identifizierung des putativen putativen Bindemodus an der 5-LO ein. Hierzu wurde zunächst ein Homologie- Modell der 5-LO unter Verwendung der kürzlich neu veröffentlichten Daten der Röntgenkristallstruktur der Kaninchen-15-LO (PDB-Code: 2p0m [Choi et al., 2008]) erstellt. Durch eine Bindetaschenvorhersage mit dem Programm PocketPicker und einer pseudorezptorbasierten Auswahl der potentiellen Bindetasche mit anschliessendem Liganden-Docking konnten zwei Bindebereiche postuliert werden, beide an einer Oberflächenbindetasche der 5-LO ausserhalb des aktiven Zentrums. .....
Kenntnisse über die dreidimensionale Struktur therapeutisch relevanter Zielproteine bieten wertvolle Informationen für den rationalen Wirkstoffentwurf. Die stetig wachsende Zahl aufgeklärter Kristallstrukturen von Proteinen ermöglicht eine qualitative und quantitative rechnergestützte Untersuchung von spezifischen Protein-Liganden Wechselwirkungen. Im Rahmen dieser Arbeit wurden neue Algorithmen für die Identifikation und den Ähnlichkeitsvergleich von Proteinbindetaschen und ihren Eigenschaften entwickelt und in dem Programm PocketomePicker zusammengefasst. Die Software gliedert sich in die Routinen PocketPicker, PocketShapelets und PocketGraph. Ferner wurde in dieser Arbeit die Methode ReverseLIQUID reimplementiert und im Rahmen einer Kooperation für das strukturbasierte Virtuelle Screening angewendet. Die genannten Methoden und ihre wissenschaftliche Anwendungen sollte hier zusammengefasst werden: Die Methode PocketPicker ermöglicht die Vorhersage potentieller Bindetaschen auf Proteinoberflächen. Diese Technik implementiert einen geometrischen Ansatz auf Basis „künstlicher Gitter“ zur Identifikation zusammenhängender vergrabener Bereiche der Proteinoberfläche als Orte möglicher Ligandenbindestellen. Die Methode erreicht eine korrekte Vorhersage der tatsächlichen Bindetasche für 73 % der Einträge eines repräsentativen Datensatzes von Proteinstrukturen. Für 90 % der Proteinstrukturen wird die tatsächlich Ligandenbindestelle unter den drei wahrscheinlichsten vorhergesagten Taschen gefunden. PocketPicker übertrifft die Vorhersagequalität anderer etablierter Algorithmen und ermöglicht Taschenidentifikationen auf apo-Strukturen ohne signifikante Einbußen des Vorhersageerfolges. Andere Verfahren weisen deutlich eingeschränkte Ergebnisse bei der Anwendung auf apo-Strukturen auf. PocketPicker erlaubt den alignmentfreien Ähnlichkeitsvergleich von Bindetaschenfor-men durch die Kodierung berechneter Bindevolumen als Korrelationsdeskriptoren. Dieser Ansatz wurde erfolgreich für Funktionsvorhersage von Bindetaschen aus Homologiemodellen von APOBEC3C und Glutamat Dehydrogenase des Malariaerregers Plasmodium falciparum angewendet. Diese beiden Projekte wurden in Zusammenarbeit mit Kollaborationspartnern durchgeführt. Zudem wurden PocketPicker Korrelationsdeskriptoren erfolgreich für die automatisierte Konformationsanalyse der enzymatischen Tasche von Aldose Reduktase angewendet. Für detaillierte Analysen der Form und der physikochemischen Eigenschaften von Proteinbindetaschen wurde in dieser Arbeit die Methode PocketShapelets entwickelt. Diese Technik ermöglicht strukturelle Alignments von extrahierten Bindevolumen durch Zerlegungen der Oberfläche von Proteinbindetaschen. Die Überlagerung gelingt durch die Identifikation strukturell ähnlicher Oberflächenkurvaturen zweier Taschen. PocketShapelets wurde erfolgreich zur Analyse funktioneller Ähnlichkeit von Bindetaschen verwendet, die auf Betrachtungen physikochemischer Eigenschaften basiert. Zur Analyse der topologischen Vielfalt von Bindetaschengeometrien wurde in dieser Arbeit die Methode PocketGraph entwickelt. Dieser Ansatz nutzt das Konzept des sog. „Wachsenden Neuronalen Gases“ aus dem Bereich des maschinellen Lernens für eine automatische Extraktion des strukturellen Aufbaus von Bindetaschen. Ferner ermöglicht diese Methode die Zerlegung einer Bindestelle in ihre Subtaschen. Die von PocketPicker charakterisierten Taschenvolumen bilden die Grundlage für die Methode ReverseLIQUID. Dieses Programm wurde in dieser Arbeit weiterentwickelt und im Rahmen einer Kooperation zur Identifikation eines Inhibitors der Serinprotease HtrA des Erregers Helicobacter pylori verwendet. Mit ReverseLIQUID konnte ein strukturbasiertes Pharmakophormodell für das Virtuelle Screening erstellt werden. Dieser Ansatz ermöglichte die Identifikation einer Substanz mit niedrig mikromolarer Affinität gegenüber der Zielstruktur.
Im Rahmen dieser Arbeit wurde die Eignung von Pseudorezeptoren im virtuellen Screening untersucht. Hierzu wurde nach intensiver Auseinandersetzung mit bisher bekannten Konzepten ein neues Computerprogramm zur automatischen Konstruktion von Pseudorezeptormodellen entwickelt. Das Ziel von Pseudorezeptoren ist die Konstruktion eines alternativen, artifiziellen Wirtssystems aus bekannten Liganden eines Zielproteins, dessen dreidimensionale Struktur unbekannt ist. Der generierte Pseudorezeptor ist zu verstehen als die Menge aller Pseudoatome, die um die Ausgangssubstanz(en) projiziert werden. Bei multiplen Referenzliganden wird eine Gewichtung der Pseudoatome durchgeführt. Zudem wird ausschließlich von Distanz- und Winkelparametern Gebrauch gemacht, die aus Untersuchungen von Kokristall-strukturen gewonnenen wurden. Eine abschließende Kodierung generierter Pseudorezeptoren als 90-dimensionalen Korrelationsvektor wurde zum virtuellen Screening eingesetzt. In zwei retrospektiven Fallbeispielen wird gezeigt, dass die generierten Pseudorezeptoren für COX-2 und PPARα mit den realen Zuständen ihrer kokristallisierten Bindetaschen in den PDB Einträge 6cox und 2p54 kompatibel sind. Im retrospektiven virtuellen Screening in der Wirkstoffdatenbank COBRA (8.311 Moleküle) nach COX-2 Inhibitoren (136 Aktive) konnte eine Anreicherung der aktiven Strukturen in den ersten zwei Perzentilen gezeigt werden (54% der Aktiven). Zudem konnten 80% der aktiven Moleküle bereits nach Vorhersage von 10% Falsch-Positiven gefunden werden. Im Falle des retrospektiven Screenings nach 94 PPAR Liganden konnten 30% der aktiven Moleküle nach der Vorhersage von 10% Falsch-Positiven entdeckt. Nach 20% Falsch-Positiver wurden 46% der PPAR Liganden wieder gefunden. Weiterhin konnte mit den ligandenbasierten Informationen eines H4 Pseudorezeptors eine Justierung einer potentiellen Bindetasche des Histamin H4 Rezeptors aus einer molekularen Dynamiksimulation vorgenommen werden. Schließlich wurde in einem prospektiven virtuellen Screening nach Histamin H4 Liganden mit einem Pseudorezeptor zwei Strukturen mit unterschiedlichem Grundgerüst und einem Ki ~ 30 µM identifiziert.
Die Komplementarität der molekularen Oberflächen und der Pharmakophorpunkte ist ein verbreiteter Konzept im rechnergestützen Moleküldesign. Diesem Konzept folgend wurde die Software SQUIRREL neu entwickelt und in der Programmiersprache Java implemetiert. Die Software generiert die Vorschläge für den bioisosteren Ersatz von Molekülen und Molekülfragmenten. SQUIRREL kombiniert Oberflächen- und Pharmakophoreigenschaften bioaktiver Substanzen und kann im virtuellen Screening und fragment-basierten de novo Design eingesetzt werden. In einer prospektiven Studie wurde SQUIRREL verwendet, um neue selektive PPARalpha-Agonisten aus einer kommerziellen Moleküldatenbank zu identifizieren. Die Software lieferte eine potente Substanz (EC50 = 44 nM) mit über 100facher Selektivität gegenüber PPARgamma. In einer zweiten Studie wurde eine Leitstruktur de novo generiert und synthetisiert. Als Ausgangstruktur diente der bekannte PPARalpha-Agonist GW590735. Während des Designvorgangs wurden zwei Teilstrukturen, die für die Aktivität von GW590735 verantwortlich sind, durch bioisostere Gruppen ersetzt, die von SQUIRRELnovo vorgeschlagen wurden. Die neue Leitstruktur aktiviert PPARalpha in einem zellbasierten Reportergen-Testsystem bei einem EC50 von 0.51 µM.
This work investigated the applicability of global pairwise sequence alignment to the detection of functional analogues in virtual screening. This variant of sequence comparison was developed for the identification of homologue proteins based on amino acid or nucleotide sequences. Because of the significant differences between biopolymers and small molecules several aspects of this approach for sequence comparison had to be adapted. All proposed concepts were implemented as the ‘Pharmacophore Alignment Search Tool’ (PhAST) and evaluated in retrospective experiments on the COBRA dataset in version 6.1. The aim to identify functional analogues raised the necessity for identification and classification of functional properties in molecular structures. This was realized by fragment-based atom-typing, where one out of nine functional properties was assigned to each non-hydrogen atom in a structure. These properties were pre-assigned to atoms in the fragments. Whenever a fragment matched a substructure in a molecule, the assigned properties were transferred from fragment atoms to structure atoms. Each functional property was represented by exactly one symbol. Unlike amino acid or nucleotide sequences, small drug-like molecules contain branches and cycles. This was a major obstacle in the application of sequence alignment to virtual screening, since this technique can only be applied to linear sequences of symbols. The best linearization technique was shown to be Minimum Volume Embedding. To the best of knowledge, this work represents the first application of dimensionality reduction to graph linearization. Sequence alignment relies on a scoring system that rates symbol equivalences (matches) and differences (mismatches) based on functional properties that correspond to rated symbols. Existing scoring schemes are applicable only to amino acids and nucleotides. In this work, scoring schemes for functional properties in drug-like molecules were developed based on property frequencies and isofunctionality judged from chemical experience, pairwise sequence alignments, pairwise kernel-based assignments and stochastic optimization. The scoring system based on property frequencies and isofunctionality proved to be the most powerful (measured in enrichment capability). All developed scoring systems performed superior compared to simple scoring approaches that rate matches and mismatches uniformly. The frameworks proposed for score calculations can be used to guide modifications to the atom-typing in promising directions. The scoring system was further modified to allow for emphasis on particular symbols in a sequence. It was proven that the application of weights to symbols that correspond to key interaction points important to receptor-ligand-interaction significantly improves screening capabilities of PhAST. It was demonstrated that the systematic application of weights to all sequence positions in retrospective experiments can be used for pharmacophore elucidation. A scoring system based on structural instead of functional similarity was investigated and found to be suitable for similarity searches in shape-constrained datasets. Three methods for similarity assessment based on alignments were evaluated: Sequence identity, alignment score and significance. PhAST achieved significantly higher enrichment with alignment scores compared to sequence identity. p-values as significance estimates were calculated in a combination of Marcov Chain Monte Carlo Simulation and Importance Sampling. p-values were adapted to library size in a Bonferroni correction, yielding E-values. A significance threshold of an E-value of 1*10-5 was proposed for the application in prospective screenings. PhAST was compared to state-of-the-art methods for virtual screening. The unweighted version was shown to exhibit comparable enrichment capabilities. Compound rankings obtained with PhAST were proven to be complementary to those of other methods. The application to three-dimensional instead of two-dimensional molecular representations resulted in altered compound rankings without increased enrichment. PhAST was employed in two prospective applications. A screening for non-nucleoside analogue inhibitors of bacterial thymidin kinase yielded a hit with a distinct structural framework but only weak activity. The search for drugs not member of the NSAID (non-steroidal anti-inflammatory drug) class as modulators of gamma-secretase resulted in a potent modulator with clear structural distiction from the reference compound. The calculation of significance estimates, emphasizing on key interactions, the pharmacophore elucidation capabilities and the unique compound rannkings set PhAST apart from other screening techniques.
Development of a computational method for reaction-driven de novo design of druglike compounds
(2010)
A new method for computer-based de novo design of drug candidate structures is proposed. DOGS (Design of Genuine Structures) features a ligand-based strategy to suggest new molecular structures. The quality of designed compounds is assessed by a graph kernel method measuring the distance of designed molecules to a known reference ligand. Two graph representations of molecules (molecular graph and reduced graph) are implemented to feature different levels of abstraction from the molecular structure. A fully deterministic construction procedure explicitly designed to facilitate synthesizability of proposed structures is realized: DOGS uses readily available synthesis building blocks and established reaction schemes to assemble new molecules. This approach enables the software to propose not only the final compounds, but also to give suggestions for synthesis routes to generate them at the bench. The set of synthesis schemes comprises about 83 chemical reactions. Special focus was put on ring closure reactions forming drug-like substructures. The library of building blocks consists of about 25,000 readily available synthesis building blocks. DOGS builds up new structures in a stepwise process. Each virtual synthesis step adds a fragment to the growing molecule until a stop criterion (upper threshold for molecular mass or number of synthesis steps) is fulfilled. In a theoretical evaluation, a set of ~1,800 molecules proposed by DOGS is analyzed for critical properties of de novo designed compounds. The software is able to suggest drug-like molecules (79% violate less than two of Lipinski’s ‘rule of five’). In addition, a trained classifier for drug-likeness assigns a score >0.8 to 51% of the designed molecules (with 1.0 being the top score). In addition, most of the DOGS molecules are deemed to be synthesizable by a retro-synthesis descriptor (77% of molecules score in the top 10% of the decriptor’s value range). Calculated logP(o/w) values of constructed molecules resemble a unimodal distribution centred close to the mean of logP(o/w) values calculated for the reference compounds. A structural analysis of selected designs reveals that DOGS is capable of constructing molecules reflecting the overall topological arrangement of pharmacophoric features found in the reference ligands. At the same time, the DOGS designs represent innovative compounds being structurally distinct from the references. Synthesis routes for these examples are short and seem feasible in most cases. Some reaction steps might need modification by using protecting groups to avoid unwanted side reactions. Plausible bioisosters for known privileged fragments addressing the S1 pocket of trypsin were proposed by DOGS in a case study. Three of them can be found in known trypsin inhibitors as S1-adressing side chains. The software was also tested in two prospective case studies to design bioactive compounds. DOGS was applied to design ligands for human gamma-secretase and human histamine receptor subtype 4 (hH4R). Two selected designs for gamma-secretase were readily synthesizable as suggested by the software in one-step reactions. Both compounds represent inverse modulators of the target molecule. In a second case study, a ligand candidate selected for hH4R was synthesized exactly following the three-step synthesis plan suggested by DOGS. This compound showed low activity on the target structure. The concept of DOGS is able to deliver synthesizable and bioactive compounds. Suggested synthesis plans of selected compounds were readily pursuable. DOGS can therefore serve as a valuable idea generator for the design of new pharmacological active compounds.
This study focuses on structural features of a particular GPCR type, the family C GPCRs. Structure- and ligand-based approaches were adopted for prediction of novel mGluR5 binding ligand and their binding modes. The objectives of this study were: 1. An analysis of function and structural implication of amino acids in the TM region of family C GPCRs. 2. The prediction of the TM domain structure of mGluR5. 3. The discovery of novel selective allosteric modulators of mGluR5 by virtual screening. 4. The prediction of a ligand binding mode for the allosteric binding site in mGluR5. GPCRs are a super-family of structurally related proteins although their primary amino acid sequence can be diverse. Using sequence information a conservation analysis of family C GPCRs should be applied to reveal characteristic differences and similarities with respect function, folding and ligand binding. Using experimental data and conservation analysis the allosteric binding site of mGluR5 should be characterized regarding NAM and PAM and selective ligand binding. For further evaluation experimental knowledge about family A GPCRs as well as conservation between vertebrate rhodopsins was planned to be compared to results obtained for family C GPCRs (Section 4.1 Conservation analysis of family C GPCRs). Since no receptor structure is available for any family C GPCR, discussion of conserved sequence positions between family A and C GPCRs requires the prediction of a receptor structure for mGluR5 using a family A receptor as template. In order to predict the mGluR5 structure a sequence alignment to a GPCR template protein will have to be proposed and GPCR specific features considered in structure calculation (Section 4.1.4 Structure prediction of mGluR5). The obtained structure was intended to be involved in ligand binding mode prediction of newly discovered active molecules. For discovery of novel selective mGluR modulators several ligand-based virtual screening protocols were adapted and evaluated. Prediction models were derived for selection of possibly active molecules using a diverse collection of known mGluR binding ligands. For that purpose a data collection of known mGluR binding ligands should be established and this reference collection analyzed with respect to different ligand activity classes, NAM or PAM and selective modulators. The prediction of novel NAMs and PAMs using several combinations of 2D-, 3D-, pharmacophore or molecule shape encoding methods with machine learning techniques and similarity determining methods should be tested in a prospective manner (Section 4.2 Virtual screening for novel mGluR modulators). In collaboration with Merz Pharmaceuticals (Merz GmbH & Co. KGaA, Frankfurt am Main, Germany) the modulating effect of a few hundred molecules should be approved in a functional cell-based assay. With the objective to predict a binding mode of the discovered active molecules, molecule docking should be applied using the allosteric binding site of the modeled mGluR5 structure (Section 4.2.4 Modeling of binding modes). Predicted ligand binding modes are to be correlated to conservation profiles that had resulted from the sequence-based entropy analysis and information from mutation experiments, and shall be compared to known ligand binding poses from crystal structures of family A GPCRs.
Die Identifizierung neuartiger Verbindungsklassen für ein pharmakologisches Zielsystem ist eine fordernde Aufgabe für die frühe präklinische Forschung, insbesondere wenn bereits vorherige umfangreiche Studien durchgeführt und viele Leitstrukturserien gefunden wurden. In dieser Arbeit konnte gezeigt werden, dass Scaffold Hopping durch Methoden des Virtual Screenings auch für Systeme möglich ist, für die bereits eine Vielzahl von Referenzsubstanzen beschrieben ist und somit wenig freier chemischer Raum für Innovation zur Verfügung steht. Als Beispielsystem wurde die GlycinB-Bindungsstelle der NR1-Untereinheit des NMDA-Rezeptors betrachtet. Verschiedene zwei- und dreidimensionale Techniken des Virtual Screenings wurden einer umfangreichen retrospektiven Validierung unterworfen. Zur Durchführung der prospektiven Virtual-Screening-Studie wurde eine automatisierte in silico Plattform entwickelt, die 8,9 Millionen käufliche Substanzen aus 46 Substanzkatalogen von 33 verschiedenen Anbietern sammelte, um etwa 5 Millionen unterschiedliche Moleküle in zweidimensionaler Darstellung aufzuarbeiten. Diese Menge an Substanzen stellt den größten Teil der zurzeit kommerziell verfügbaren chemischen Verbindungen, also den „verfügbaren chemischen Raum“ dar. Anhand der retrospektiv validierten Virtual Screening Techniken konnten in einer prospektiven Suche 21 GlycinB-Antagonisten mit neuartigen, d.h. für GlycinB noch unbeschriebenen Scaffolds gefunden werden. Ausgehend von drei dieser Virtual Screening Hits wurden 53 weitere Verbindungen mit insgesamt fünf unterschiedlichen neuartigen Scaffolds und einem gemeinsamen Azo-Motiv identifiziert. Die Struktur-Wirkungsbeziehungen dieser fünf chemischen Serien wurden charakterisiert. Das Ergebnis dieser Arbeit zeigt eindeutig, dass es lohnend ist, alle vorhandenen Methoden auszuschöpfen, da sich die validierten Methoden komplementär zueinander verhielten und kein Virtual Screening Hit von mehr als einer Technik gefunden wurde. Die Flexibilität von Proteinen als Antwort auf die Bindung unterschiedlicher Liganden stellt ein bislang ungelöstes chemieinformatisches Problem dar, welches auch grundlegende pharmakologische Bedeutung hat. So verursachen z.B. bei NMDA/GlycinB agonistische Liganden eine Konformationsänderung des Rezeptors. Diese ruft dann eine direkte funktionale Antwort in Form der Öffnung des Ionenkanals hervor. Auch der Bindungsmodus der Antagonisten von GlycinB ist trotz Vorhandenseins von zwei Kristallstrukturen und mehreren Hundert zum Teil hochaffiner Referenzstrukturen zum großen Teil ungeklärt. Im zweiten Teil dieser Arbeit wurde ein auf Moleküldynamiksimulationen basierendes Verfahren entwickelt, welches flexible Aminosäurereste im Rezeptor und damit induzierbare Bewegungen des Proteinrückgrates bestimmt. Die so identifizierten Reste wurden dann in einem erweiterten Verfahren des Induced-Fit-Dockings als explizit flexibel betrachtet. Hierdurch war die Berechnung verschiedener Bindungsmodi von Antagonisten möglich, die aufgrund ihrer Form und Größe nicht in die verfügbaren Kristallstrukturen von GlycinB passten. Diese benötigten somit einen Induced-Fit-Effekt des Rezeptors, um eine Bindung einzugehen. Für die im ersten Teil dieser Arbeit identifizierten Azo-Liganden wurde auf Basis dieser Methode ein gemeinsamer Bindungsmodus vorgeschlagen. Ebenso konnte anhand der Methodik eine Aussage über die funktionale Auswirkung der Proteinflexibilität beim Übergang vom antagonistischen zum agonistischen Rezeptorzustand von GlycinB getroffen werden. Ein großes Problem aktueller Dockingverfahren ist die mangelnde Verfügbarkeit von Scoringfunktionen, welche die tatsächliche biologische Bindungsaffinität eines Liganden berechnen. Hier wurde ein Verfahren für das Zielsystem GlycinB gezeigt, welches aufgrund der Berechnung des thermodynamischen Entropie- und Enthalpiegewinns durch Verdrängung von hydrophob eingeschlossenen Wasser aus der Bindungsstelle durch den Liganden eine Aussage über dessen zu erwartende Bindungsaffinität trifft. Dieses neuartige Scoringsystem wurde auf die im Virtual Screening identifizierten Serie von Azo-Liganden angewandt und verfügte über eine im Vergleich zu klassischen Scoringfunktionen des Molecular Dockings verbesserte Vorhersagekraft der biologischen Bindungsaffinität.
Eine verzögerte und mitunter unvollständige Immunrekonstitution nach allogener Stammzelltransplantation (SZT) birgt ein erhöhtes Risiko für Infektionen und das Auftreten eines Rezidivs. Adoptive Immuntherapien können dazu beitragen, die Immunrekonstitution zu beschleunigen. Die Indikation hierzu ist jedoch streng geregelt, da eine zusätzliche Immuntherapie mit Risiken, wie z.B. dem Auftreten einer Graft-versus-Host-Disease (GvHD), verbunden ist. Im Mittelpunkt dieser Arbeit steht die Untersuchung der Immunrekonstitution im Hinblick auf das Auftreten von Komplikationen und das Überleben nach SZT. Dazu wurde ein multivariates Normwertmodell entwickelt, das die Beurteilung der Rekonstitution verschiedener Leukozytensubpopulationen ermöglicht. Der Einfluss der Regeneration spezifischer Immunzellen wie Cytomegalievirus-spezifischer T-Zellen (CMV-CTLs) und regulatorischer T-Zellen (Tregs) auf den Verlauf nach SZT wurde insbesondere hinsichtlich CMV-bedingter Komplikationen, GvHD und Rezidiv untersucht.
Ziel der Arbeit war die Analyse von langen eukaryotischen Signalpeptiden, mit einer Länge von mindestens 40 Aminosäuren, und ihre Diskriminierung zu kurzen SP. Signalpeptide sind notwendig, um die im Cytosol translatierten Proteine zum Ort ihrer Funktion zu dirigieren. Sie spielen dadurch eine fundamentale Rolle bei der Entwicklung von Zellen. Signalpeptide weisen keine Sequenzhomologie, aber einen typischen, in drei Regionen gegliederten Aufbau (n-, h-, c-Region) auf. In den letzten Jahren wurden zunehmend Beispiele von Signalpeptiden gefunden, die neben dem Targeting zum endoplasmatischen Retikulum weitere Post-Targeting-Funktionen aufweisen. Auffällig ist hier die besondere Länge der Signalpeptide. Für die Analyse dieser langen Signalpeptide standen bis jetzt keine gezielt entwickelten Vorhersageprogramme zur Verfügung. Im Rahmen dieser Arbeit wurde diese Gruppe langer Signalpeptide untersucht und ein Modell zu deren interner Organisation entwickelt. Das entwickelte „NtraC“-Modell erweitert etablierte sequenzbasierte Ansätze für kurze SP um eine Sekundärstruktur-motivierte Perspektive für lange Sinalpeptide. Zuerst wird dabei ein Übergangsbereich (transition area, N„tra“C), der potentiell β-Turn bildende Aminosäuren enthält, identifiziert. Dieser dient im Modell zur Zerlegung des SP in zwei hinsichtlich ihrer Funktion unabhängige Domänen: eine N-terminale N-Domäne (‚N’traC) und eine C-terminale C-Domäne (Ntra‚C’). Diese mit bekannten Vorhersageprogrammen nicht identifizierbaren „kryptischen“ Domänen innerhalb der Signalpeptid-Sequenz können unterschiedliche Targeting-Kapazitäten aufweisen und entsprechen für sich genommen eigenständigen Protein-Targeting-Signalen. Im Fall einer ER-Targeting Kapazität z.B. weist eine Domäne für sich genommen eine n-, h-, und c-Region auf. 63% aller Vertebrata-Signalpeptide entsprechen der in dieser Arbeit vorgeschlagenen NtraC-Organisation. Eine basierend auf dem NtraC-Modell vorgeschlagene Architektur für die langen Signalpeptide von shrew-1 (43 Aminosäuren), DCBD2 (66 Aminosäuren) und RGMA (47 Aminosäuren) wurde vom Autor selbst in vitro überprüft. Für alle drei Proteine wurden eine N-Domäne mit mitochondrialer Targeting-Funktion und eine C-Domäne mit Signalpeptid-Funktion vorhergesagt. Die langen Signalpeptide der Proteine wurden bisher als reine ER-Targeting-Signale betrachtet. Die vorliegende Studie zeigt jedoch, dass in diesen langen Signalpeptiden multiple Targetingsignale kodiert sind. Die ER-Targeting-Kapazität der C-Domänen wurde durch SEAP-Assays überprüft, die mTP-Funktion der N-Domäne durch biochemische Aufreinigung von Mitochondrien. Die in silico-Vorhersagen konnten in vollem Umfang für alle drei Proteine in vitro bestätigt werden. Eine Untersuchung der semantischen Wolke aller Proteine mit NtraC-organisiertem Signalpeptid zeigte, dass eine NtraC-Organisation in mehr als 50% der Fälle im Zusammenhang mit Typ-I Transmembranproteinen auftritt. Auch die Proteine der hier experimentell untersuchten Signalpeptide von shrew-1, DCBD2, RGMA sind Typ-I Transmembranproteine. Des Weiteren weisen 15% aller langen Vertebrata-Signalpeptide eine Domänen-Kombination analog zu shrew-1, DCBD2 und RGMA auf. Der gefundene analoge Aufbau der langen Signalpeptide könnte somit funktionelle Gruppen von Proteinen zusammenführen, die bisher anderweitig nicht gruppiert werden konnten. Es konnte weiterhin gezeigt werden, dass bakterielle Autotransporter Gram-negativer Bakterien in Variation ebenfalls eine NtraC-Organisation in ihren Signalpeptiden aufweisen. Gleiches konnte für Gruppen langer viraler Signalpeptide gezeigt werden. Das NtraC-Modell ist somit nicht auf Vertebrata-Signalpeptide beschränkt. In der vorliegenden Arbeit wurde ein Modell zur Domänen-Architektur langer Signalpeptide entwickelt und erfolgreich angewendet: das NtraC-Modell. Ein Vorhersage-Algorithmus zur in silico-Untersuchung langer Signalpeptide wurde implementiert und in einer webbasierten Benutzeroberfläche öffentlich zugänglich gemacht. Das Modell trifft auf 63% der annotierten langen Vertebrata-Signalpeptide zu. Des Weiteren wurden, basierend auf dem NtraC-Modell, für die langen Signalpeptide von drei Proteinen (shrew-1, DCBD2, RGMA) in vitro-Versuche durchgeführt. Die erhaltenen in vitro-Ergebnisse unterstützen klar die These, dass lange Signalpeptide eine aus definierten Domänen bestehende Organisation aufweisen können.