Refine
Year of publication
Document Type
- Doctoral Thesis (27)
Has Fulltext
- yes (27)
Is part of the Bibliography
- no (27)
Keywords
- Computational chemistry (5)
- Arzneimitteldesign (3)
- Bioinformatik (3)
- Screening (3)
- Virtual Screening (3)
- Docking (2)
- Drug design (2)
- In silico-Methode (2)
- Molekulare Bioinformatik (2)
- Neuronales Netz (2)
Institute
- Biowissenschaften (14)
- Biochemie und Chemie (6)
- Pharmazie (6)
- Medizin (1)
Die Identifizierung neuartiger Verbindungsklassen für ein pharmakologisches Zielsystem ist eine fordernde Aufgabe für die frühe präklinische Forschung, insbesondere wenn bereits vorherige umfangreiche Studien durchgeführt und viele Leitstrukturserien gefunden wurden. In dieser Arbeit konnte gezeigt werden, dass Scaffold Hopping durch Methoden des Virtual Screenings auch für Systeme möglich ist, für die bereits eine Vielzahl von Referenzsubstanzen beschrieben ist und somit wenig freier chemischer Raum für Innovation zur Verfügung steht. Als Beispielsystem wurde die GlycinB-Bindungsstelle der NR1-Untereinheit des NMDA-Rezeptors betrachtet. Verschiedene zwei- und dreidimensionale Techniken des Virtual Screenings wurden einer umfangreichen retrospektiven Validierung unterworfen. Zur Durchführung der prospektiven Virtual-Screening-Studie wurde eine automatisierte in silico Plattform entwickelt, die 8,9 Millionen käufliche Substanzen aus 46 Substanzkatalogen von 33 verschiedenen Anbietern sammelte, um etwa 5 Millionen unterschiedliche Moleküle in zweidimensionaler Darstellung aufzuarbeiten. Diese Menge an Substanzen stellt den größten Teil der zurzeit kommerziell verfügbaren chemischen Verbindungen, also den „verfügbaren chemischen Raum“ dar. Anhand der retrospektiv validierten Virtual Screening Techniken konnten in einer prospektiven Suche 21 GlycinB-Antagonisten mit neuartigen, d.h. für GlycinB noch unbeschriebenen Scaffolds gefunden werden. Ausgehend von drei dieser Virtual Screening Hits wurden 53 weitere Verbindungen mit insgesamt fünf unterschiedlichen neuartigen Scaffolds und einem gemeinsamen Azo-Motiv identifiziert. Die Struktur-Wirkungsbeziehungen dieser fünf chemischen Serien wurden charakterisiert. Das Ergebnis dieser Arbeit zeigt eindeutig, dass es lohnend ist, alle vorhandenen Methoden auszuschöpfen, da sich die validierten Methoden komplementär zueinander verhielten und kein Virtual Screening Hit von mehr als einer Technik gefunden wurde. Die Flexibilität von Proteinen als Antwort auf die Bindung unterschiedlicher Liganden stellt ein bislang ungelöstes chemieinformatisches Problem dar, welches auch grundlegende pharmakologische Bedeutung hat. So verursachen z.B. bei NMDA/GlycinB agonistische Liganden eine Konformationsänderung des Rezeptors. Diese ruft dann eine direkte funktionale Antwort in Form der Öffnung des Ionenkanals hervor. Auch der Bindungsmodus der Antagonisten von GlycinB ist trotz Vorhandenseins von zwei Kristallstrukturen und mehreren Hundert zum Teil hochaffiner Referenzstrukturen zum großen Teil ungeklärt. Im zweiten Teil dieser Arbeit wurde ein auf Moleküldynamiksimulationen basierendes Verfahren entwickelt, welches flexible Aminosäurereste im Rezeptor und damit induzierbare Bewegungen des Proteinrückgrates bestimmt. Die so identifizierten Reste wurden dann in einem erweiterten Verfahren des Induced-Fit-Dockings als explizit flexibel betrachtet. Hierdurch war die Berechnung verschiedener Bindungsmodi von Antagonisten möglich, die aufgrund ihrer Form und Größe nicht in die verfügbaren Kristallstrukturen von GlycinB passten. Diese benötigten somit einen Induced-Fit-Effekt des Rezeptors, um eine Bindung einzugehen. Für die im ersten Teil dieser Arbeit identifizierten Azo-Liganden wurde auf Basis dieser Methode ein gemeinsamer Bindungsmodus vorgeschlagen. Ebenso konnte anhand der Methodik eine Aussage über die funktionale Auswirkung der Proteinflexibilität beim Übergang vom antagonistischen zum agonistischen Rezeptorzustand von GlycinB getroffen werden. Ein großes Problem aktueller Dockingverfahren ist die mangelnde Verfügbarkeit von Scoringfunktionen, welche die tatsächliche biologische Bindungsaffinität eines Liganden berechnen. Hier wurde ein Verfahren für das Zielsystem GlycinB gezeigt, welches aufgrund der Berechnung des thermodynamischen Entropie- und Enthalpiegewinns durch Verdrängung von hydrophob eingeschlossenen Wasser aus der Bindungsstelle durch den Liganden eine Aussage über dessen zu erwartende Bindungsaffinität trifft. Dieses neuartige Scoringsystem wurde auf die im Virtual Screening identifizierten Serie von Azo-Liganden angewandt und verfügte über eine im Vergleich zu klassischen Scoringfunktionen des Molecular Dockings verbesserte Vorhersagekraft der biologischen Bindungsaffinität.
The aim of the thesis was to identify structure activity relationships (SAR) in the primary screening data of high-throughput screening (HTS) assays. The strategy was to perform a hierarchical clustering of the molecules, assign the primary screening data to the created clusters and derive models from the clusters. The models should serve to identify singletons, clusters enriched with actives, not confirmed hits and false-negatives. Two hierarchical clustering algorithms, NIPALSTREE and hierarchical k-means have been developed and adapted for this purpose, respectively. A graphical user interface (GUI) has been implemented to extract SAR from the clustering results. Retrospective and prospective applications of the clustering approach were performed. SAR models were created by combining the clustering results with different chemoinformatic methods. NIPALSTREE projects a data set onto one dimension using principle component analysis. The data set is sorted according to the scoring vector and split at the median position into two subsets. The algorithm is applied recursively onto the subsets. The hierarchical k-means recursively separates a data set into two clusters using the k-means algorithm. Both algorithms are capable of clustering large data sets with more than a million data points. They were validated and compared to each other on the basis of different structural classes. NIPALSTREE provided with the loading vectors first insights into SAR whereas the hierarchical k-means yielded superior results. A GUI was developed allowing the display of and the navigation in the clustering results. Functionalities were integrated to analyse the clusters in the dendrogram, molecules in a cluster, and physicochemical properties of a molecule. Measures were developed to identify clusters enriched with actives, to characterize singletons and to analyse selectivity and specificity. Different protease inhibitors of the COBRA database were examined using the hierarchical k-means algorithm. Supported by similarity searches and nearest neighbour analyses thrombin inhibitor singletons were quickly isolated and displayed in the dendrogram. By scaling enrichment factors to the logarithm of the dendrogram level, clusters enriched with different structural classes of factor Xa inhibitors were simultaneously identified. The observed co-clustering of other protease inhibitors provided a deeper insight into selectivity and specificity and shows the utility of the approach for constructing focussed screening libraries. Specificity was analyzed by extracting and clustering relative frequencies of the protease inhibitors from the clusters of dendrogram level 7. A unique ligand based point of view on the pocketome of the protease enzymes was obtained. To identify not confirmed hits and false-negatives in the primary screening data of HTS assays, three assays were retrospectively analysed with the hierarchical k-means algorithm. A rule catalogue was developed judging hits in terminal clusters based on the cluster size, the percent control values of the entries in a cluster, the overall hit rate, the hit rate in the cluster and the environment of a cluster in the dendrogram. It resulted in the identification of a high proportion of not confirmed hits and provided for each hit a rating in context of related non-hits. This allows prioritizing compounds for follow-up studies. Non-hits and hits were retrieved from terminal clusters containing hits. Molecules bearing false-negative scaffolds were co-extracted and enriched. To minimize the number of false-positives in the extracted lists, Bayesian regularized artificial neutral network classification models were trained with the data. Applying the models marked improvement of enrichment factors for the false-negatives was obtained. It proofs the scaffold-hopping potential of the approach. NIPALSTREE, the hierarchical k-means algorithm and self-organising maps were prospectively applied to identify novel lead candidates for dopamine D3 receptors. Compounds with novel scaffolds and low nanomolar binding affinity (65 nM, compound 42) were identified. To provide a deeper insight into the SAR of these molecules, different alternative computational methods were employed. Support vector-based regression and partial least squares were examined. Predictive models for dopamine D2 and D3 receptor binding affinity values were obtained. Important features explaining SAR were extracted from the models. The prospective application of the models to the diverse and novel virtual screening data was of limited success only. Docking studies were performed using a homology model of the dopamine D3 receptor. The visual inspection of the binding modes resulted in the hypothesis of two alternative binding pockets for the aryl moiety of dopamine D3 receptor antagonists. A pharmacophore model was created simultaneously requiring both aryl moieties. Virtual screening with the model identified a nanomolar hit (65 nM, compound 59) corroborating the hypothesis of the two binding pockets and providing a new lead structure for dopamine D3 receptors. The presented data shows that the combined approach of hierarchically clustering a data set in combination with the subsequent usage of the clusters for model generation is suited to extract SAR from screening data. The models are successful in identifying singletons, clusters enriched with actives, not confirmed hits and false-negative scaffolds.
Eine verzögerte und mitunter unvollständige Immunrekonstitution nach allogener Stammzelltransplantation (SZT) birgt ein erhöhtes Risiko für Infektionen und das Auftreten eines Rezidivs. Adoptive Immuntherapien können dazu beitragen, die Immunrekonstitution zu beschleunigen. Die Indikation hierzu ist jedoch streng geregelt, da eine zusätzliche Immuntherapie mit Risiken, wie z.B. dem Auftreten einer Graft-versus-Host-Disease (GvHD), verbunden ist. Im Mittelpunkt dieser Arbeit steht die Untersuchung der Immunrekonstitution im Hinblick auf das Auftreten von Komplikationen und das Überleben nach SZT. Dazu wurde ein multivariates Normwertmodell entwickelt, das die Beurteilung der Rekonstitution verschiedener Leukozytensubpopulationen ermöglicht. Der Einfluss der Regeneration spezifischer Immunzellen wie Cytomegalievirus-spezifischer T-Zellen (CMV-CTLs) und regulatorischer T-Zellen (Tregs) auf den Verlauf nach SZT wurde insbesondere hinsichtlich CMV-bedingter Komplikationen, GvHD und Rezidiv untersucht.
The goal of this thesis was to gain further insight into the binding behavior of ligands in the heptahelical domain (HD) of group I metabotropic glutamate receptors (mGluRs). This was realized by the establishment of strategies for the detection and optimization of molecules acting as non-competitive antagonists of group I mGluRs (mGluR1/5). These strategies should guarantee high diversity in the retrieved chemotypes of the detected compounds not resembling original reference molecules (“scaffold-hopping”). The detection of new scaffolds, in turn, was divided into two approaches: First the development of pharmacological assays to screen compounds at a certain target for bioactivity (here: affinity towards the allosteric recognition site of mGluR1 and mGluR5), and second the evaluation of computer assisted methods for the identification of virtual hits to be screened afterwards on the pharmacological assays established before. Promising molecules should be optimized with respect to activity/affinity and selectivity, their binding mode investigated and, finally, compared to existing lead compounds. Initially, membrane based binding assays for the HD of mGlu1 and mGlu5 receptors with enhanced throughput (shifting from 24-well plates to 96-well plates) were set up. For the mGluR1 assay the potent antagonist EMQMCM exhibited high affinity towards the binding site (Ki ~3nM), which is in accordance with published data from Mabire et al. (functional IC50 3nM). For mGluR5 the reference antagonist MPEP binds with high affinity to the receptor (binding IC50 13.8nM), which confirmed earlier findings from Anderson et al. (binding IC50 15nM). In another series of experiments the properties of rat cerebellar (mGluR1) and corticalmembranes (mGluR5) as well as of radiotracers were investigated by means of binding saturation studies and kinetic experiments. Furthermore, the influence of the solvent DMSO, necessary for compound screening of lipophilic substances, on positive and negative controls was evaluated. As the precise architecture of the HD of mGluR1 is still not known our efforts in identifying new ligands for this receptor focused on the ligand-based approach. All computer assisted methods that were applied to virtually screen large compound collections and to retrieve potential hits (“activity-enriched subsets”) acting at the heptahelical domain of mGluR1 relied on the existence of a valid dataset of reference molecules. This was realized by an initial compilation of a mGluR reference data collection comprising in total 357 entries predominantly negative but also some positive allosteric modulators for mGluR1 and mGluR5. In the next step a pharmacophore model for non-competitive mGluR1 antagonists was constructed. It was based upon six selective, potent and structurally diverse ligands. Prospective virtual screening was performed using the CATS atom-pair descriptor. The Asinex Gold-Collection was screened for each seed compound and some of the most similar compounds (according to the CATS descriptor) were ordered and tested forbinding affinity and functional activity at mGluR1. A high hit rate of approximately 26% (IC50 < 15 micro M) was yielded confirming the applicability of this method. One compound exerted functional activity below one micro molar (IC50-value of C-07:362nM ± 0.03). Moreover, non-linear principal component analysis was employed. Again the Asinex vendor database served as test database and was filtered by the pharmacophore model for mGluR1 established before. Test molecules that were adjacently located with mGluR1 antagonist references were selected. 15 compounds were tested on mGluR1 in binding and functional assays and three of them exhibited functional activity (IC50) below 15 micro M. The most potent molecule P-06 revealed an IC50-value of 1.11 micro M (± 0.41). The COBRA database comprising 5,376 structurally diverse bioactive molecules affecting various targets was encoded with the CATS descriptor and used for training two selforganizing maps (SOM). The encoded mGluR reference data collection was projected onto this map according to the SOM algorithm. This projection allowed to clearly distinguish between antagonists of mGluR1 and mGluR5 subtype. 28 compounds were ordered and tested on activity and affinity for mGluR1. They exhibited functional activity down to the sub-micro molar range (IC50-value of S-08: 744nM ± 0.29) yielding a final hit rate of 46% (<15 micro M). Then, the Asinex collection was screened using the SOM approach. For a predicted target panel including the muscarinic mACh (M1) receptor, the histamine H1-receptor and the dopamine D2/D3 receptors, the tested mGluR ligands exhibited the calculated binding pattern. This virtual screening concept might provide a basis for early recognition of potential sideeffects in lead discovery. We superimposed a set of 39 quinoline derivatives as non-competitive mGluR1 antagonists that were recently published by Mabire and co-workers. A CoMFA model (QSAR) was established and the influence of several side chains on functional activity was investigated. The coumarine derivative C-07 was obtained as a result of similarity searching. Starting from this compound a series of chemical derivatives was synthesized. This led to the discovery of potent (B-28, IC50: 58nM ± 0.008; Ki: 293nM ± 0.022) and selective (rmGluR5 IC50: 28.6 micro M) mGluR1 antagonists. From a homology model of mGluR1 we derived a potential binding mode for coumarines within the allosteric transmembrane region. Potential interacting patterns with amino acids were proposed considering the difference of the binding pockets between rat and human receptors. The proposed binding modes for quinolines (here:EMQMCM) and coumarines (here:B-04) were compared and discussed considering in particular the influence on activity of several side chains of quinolines obtained from the QSAR studies. The present studies demonstrated the applicability of ligand-based virtual screening for non-competitive antagonists of a G-protein coupled receptor, resulting in novel, potent and selective agents.
Analysis of coding principles in the olfactory system and their application in cheminformatics
(2007)
Unser Geruchssinn vermittelt uns die Wahrnehmung der chemischen Welt. Im Laufe der Evolution haben sich in unserem olfaktorischen System Mechanismen entwickelt, die wahrscheinlich optimal auf die Erfüllung dieser Aufgabe angepasst sind. Die Analyse dieser Verarbeitungsstrategien verspricht Einblicke in effiziente Algorithmen für die Kodierung und Verarbeitung chemischer Information, deren Entwicklung und Anwendung dem Kern der Chemieinformatik entspricht. In dieser Arbeit nähern wir uns der Entschlüsselung dieser Mechanismen durch die rechnerische Modellierung von funktionellen Einheiten des olfaktorischen Systems. Hierbei verfolgten wir einen interdisziplinären Ansatz, der die Gebiete der Chemie, der Neurobiologie und des maschinellen Lernens mit einbezieht.
Ziel der Arbeit war die Analyse von langen eukaryotischen Signalpeptiden, mit einer Länge von mindestens 40 Aminosäuren, und ihre Diskriminierung zu kurzen SP. Signalpeptide sind notwendig, um die im Cytosol translatierten Proteine zum Ort ihrer Funktion zu dirigieren. Sie spielen dadurch eine fundamentale Rolle bei der Entwicklung von Zellen. Signalpeptide weisen keine Sequenzhomologie, aber einen typischen, in drei Regionen gegliederten Aufbau (n-, h-, c-Region) auf. In den letzten Jahren wurden zunehmend Beispiele von Signalpeptiden gefunden, die neben dem Targeting zum endoplasmatischen Retikulum weitere Post-Targeting-Funktionen aufweisen. Auffällig ist hier die besondere Länge der Signalpeptide. Für die Analyse dieser langen Signalpeptide standen bis jetzt keine gezielt entwickelten Vorhersageprogramme zur Verfügung. Im Rahmen dieser Arbeit wurde diese Gruppe langer Signalpeptide untersucht und ein Modell zu deren interner Organisation entwickelt. Das entwickelte „NtraC“-Modell erweitert etablierte sequenzbasierte Ansätze für kurze SP um eine Sekundärstruktur-motivierte Perspektive für lange Sinalpeptide. Zuerst wird dabei ein Übergangsbereich (transition area, N„tra“C), der potentiell β-Turn bildende Aminosäuren enthält, identifiziert. Dieser dient im Modell zur Zerlegung des SP in zwei hinsichtlich ihrer Funktion unabhängige Domänen: eine N-terminale N-Domäne (‚N’traC) und eine C-terminale C-Domäne (Ntra‚C’). Diese mit bekannten Vorhersageprogrammen nicht identifizierbaren „kryptischen“ Domänen innerhalb der Signalpeptid-Sequenz können unterschiedliche Targeting-Kapazitäten aufweisen und entsprechen für sich genommen eigenständigen Protein-Targeting-Signalen. Im Fall einer ER-Targeting Kapazität z.B. weist eine Domäne für sich genommen eine n-, h-, und c-Region auf. 63% aller Vertebrata-Signalpeptide entsprechen der in dieser Arbeit vorgeschlagenen NtraC-Organisation. Eine basierend auf dem NtraC-Modell vorgeschlagene Architektur für die langen Signalpeptide von shrew-1 (43 Aminosäuren), DCBD2 (66 Aminosäuren) und RGMA (47 Aminosäuren) wurde vom Autor selbst in vitro überprüft. Für alle drei Proteine wurden eine N-Domäne mit mitochondrialer Targeting-Funktion und eine C-Domäne mit Signalpeptid-Funktion vorhergesagt. Die langen Signalpeptide der Proteine wurden bisher als reine ER-Targeting-Signale betrachtet. Die vorliegende Studie zeigt jedoch, dass in diesen langen Signalpeptiden multiple Targetingsignale kodiert sind. Die ER-Targeting-Kapazität der C-Domänen wurde durch SEAP-Assays überprüft, die mTP-Funktion der N-Domäne durch biochemische Aufreinigung von Mitochondrien. Die in silico-Vorhersagen konnten in vollem Umfang für alle drei Proteine in vitro bestätigt werden. Eine Untersuchung der semantischen Wolke aller Proteine mit NtraC-organisiertem Signalpeptid zeigte, dass eine NtraC-Organisation in mehr als 50% der Fälle im Zusammenhang mit Typ-I Transmembranproteinen auftritt. Auch die Proteine der hier experimentell untersuchten Signalpeptide von shrew-1, DCBD2, RGMA sind Typ-I Transmembranproteine. Des Weiteren weisen 15% aller langen Vertebrata-Signalpeptide eine Domänen-Kombination analog zu shrew-1, DCBD2 und RGMA auf. Der gefundene analoge Aufbau der langen Signalpeptide könnte somit funktionelle Gruppen von Proteinen zusammenführen, die bisher anderweitig nicht gruppiert werden konnten. Es konnte weiterhin gezeigt werden, dass bakterielle Autotransporter Gram-negativer Bakterien in Variation ebenfalls eine NtraC-Organisation in ihren Signalpeptiden aufweisen. Gleiches konnte für Gruppen langer viraler Signalpeptide gezeigt werden. Das NtraC-Modell ist somit nicht auf Vertebrata-Signalpeptide beschränkt. In der vorliegenden Arbeit wurde ein Modell zur Domänen-Architektur langer Signalpeptide entwickelt und erfolgreich angewendet: das NtraC-Modell. Ein Vorhersage-Algorithmus zur in silico-Untersuchung langer Signalpeptide wurde implementiert und in einer webbasierten Benutzeroberfläche öffentlich zugänglich gemacht. Das Modell trifft auf 63% der annotierten langen Vertebrata-Signalpeptide zu. Des Weiteren wurden, basierend auf dem NtraC-Modell, für die langen Signalpeptide von drei Proteinen (shrew-1, DCBD2, RGMA) in vitro-Versuche durchgeführt. Die erhaltenen in vitro-Ergebnisse unterstützen klar die These, dass lange Signalpeptide eine aus definierten Domänen bestehende Organisation aufweisen können.