Refine
Year of publication
- 2021 (2)
Document Type
- Doctoral Thesis (2)
Language
- English (2)
Has Fulltext
- yes (2)
Is part of the Bibliography
- no (2)
Institute
- Biochemie und Chemie (2) (remove)
The aim of this work was to establish a new way of predicting novel dual active compounds by combining classical fingerprint representation with state-of-the-art machine learning algorithms. Advantages and disadvantages of the applied 2D- and 3D-fingerprints were investigated. Further, the impact of various machine learning algorithms was analyzed. The new method developed in this work was used to predict compounds, which inhibit two different targets (LTA4H and sEH) involved in the same disease pattern (inflammation). The development of multitarget drugs has become more important in recent years. Many widespread diseases like metabolic syndrome, or cancer are of a multifactorial nature, which makes them hard to be treated effectively with a single drug. The new in silico method presented in this work can help to accelerate the design and development of multitarget drugs, saving time and efforts.
The nowadays readily available access to a large number of 3D-structures of biological targets and published activity data of millions of synthesized compounds enabled this study and was used as a starting point for this work. Four different data sets were compiled (crystalized ligands from the PDB, active and inactive compounds from ChEMBL23, newly designed compounds using a combinatorial library). Those data sets were collected and processed using an automated KNIME workflow. This automation has the advantage of allowing easy change and update of compound sources and adapted processing ways.
In a next step, the compounds from the compiled data sets were represented using a variety of well-established 2D- and 3D-fingerprints (PLIF, AtomPair, Morgan, FeatMorgan, MACCS). All those fingerprints share the same underlying bit string scheme but vary in the way they describe the molecular structure. Especially the difference between 2D- and 3D-fingerprints was investigated. 2D-fingerprints are solely based on ligand information. 3D-fingerprints, on the other hand, are based on X-ray structure information of protein-ligand complexes. One major difference between 2D- and 3D-fingerprints usage is the need for a 3D-conformation (pose) of the compound in the targets of interest when using 3D-fingerprints. This additional step is time-consuming and brings further uncertainties to the method.
Based on the calculated fingerprints state-of-the-art machine learning algorithms (SVC, RF, XGB and ADA) were used to predict novel dual active compounds. The models were evaluated by 10-fold cross validation and accuracy as the primary measure of model performance was maximized. Second, individual parameters of the four machine learning algorithms were optimized in a grid search to achieve maximal accuracy using the optimized partitioning scheme. Overall accuracies, regardless of fingerprint and machine learning algorithm, are slightly better for LTA4H than for sEH.
The goal to predict dual active compounds was realized by comparing the set of predicted to be active compounds for LTA4H and sEH. For the 3D-fingerprint PLIF the machine learning algorithm Random Forest was chosen, from which compounds for synthesis and testing were selected. Of 115 predicted to be active compounds, six compounds were cherry picked. Two compounds showed very good/moderate dual inhibitory activity. Of the 2D-fingerprints, the AtomPair fingerprint in combination with the machine learning algorithm Random Forest was chosen from which compounds were selected for synthesis and testing. 116 compounds were predicted to be dual active against LTA4H and sEH. One of those compounds showed good dual inhibitory activity.
In this work it was possible to show advantages and disadvantages of using 2D- and 3D-fingerprints in combination with machine learning algorithms. Both strategies (2D: ligand-based, 3D: structure-based) lead to the prediction of novel dual active compounds with moderate to very good inhibitory activity. The method developed in this work is able to predict dual active compounds with very good inhibitory activity and novel (previously unknown) scaffolds inhibiting the targets LTA4H and sEH. This contribution to in silico drug design is promising and can be used for the prediction of novel dual active compounds. Those compounds can further be optimized regarding binding affinity, solubility and further pharmacological and physicochemical properties.
Die Beteiligung an Schlüsselfunktionen in zellulären Signalwegen macht Kinasen zu einem vielversprechenden Ansatzpunkt in der Wirkstoffentwicklung bei verschiedenen menschlichen Erkrankungen wie z.B. Krebs oder auch Autoimmun- und Entzündungskrankheiten. Die Prävention von post-translationalen Modifikationen durch Phosphorylierung und somit die Regulierung der nachgeschalteten Signalwege ist das Ziel von Kinaseinhibitoren. Die katalytische Aktivität von Kinasen ist abhängig von ATP, welches im hochkonservierten aktiven Zentrum bindet. Bedingt durch diese kinomweite hohe Konservierung stellt die Entwicklung von hoch selektiven ATP-mimetischen Inhibitoren eine Herausforderung dar. Typische ATP-Mimetika sind flach und die oft hydrophoben Moleküle weisen meist eine große Zahl an frei rotierbaren Bindungen auf. Um das aus dieser Flexibilität hervorgehende Problem der teils mangelnden Selektivität zu umgehen, kann eine bioaktive Konformation des Inhibitors durch Makrozyklisierung fixiert werden. Als Konsequenz dieser konformationellen Einschränkung können die entropischen Kosten während des Bindens reduziert werden und folglich zu einer gesteigerten Affinität gegenüber der Kinase führen.
Der Grundstein dieser Arbeit war der makrozyklische Pyrazolo[1,5-a]pyrimidin basierte FLT3 Kinaseinhibitor ODS2004070 (37). Im Rahmen eines kinomweiten Screenings konnten hohe Affinitäten zu verschiedensten Kinasen detektiert werden, was 37 zu einer guten Leitstruktur für das Design von potenten und selektiven Kinaseinhibitoren machte. Im Rahmen dieser Arbeit blieb das literaturbekannte Pyrazolo[1,5-a]pyrimidin basierte ATP-mimetische Bindemotiv sowie das makrozyklische Grundgerüst 37 bis auf einige wenige Variation unverändert.
Strukturelle Optimierungen zur Fokussierung der Selektivität wurden am sekundären Amin zwischen Bindemotiv und Linker als auch über die freie Carbonsäure durchgeführt. Mit einer Anzahl von mehr als 430 identifizierten Phosphorylierungsstellen ist die pleiotropisch und konstitutiv aktive Casein Kinase 2 (CK2) an verschiedensten zellulären Prozessen wie dem Verlauf des Zellzyklus, der Apoptose oder der Transkription regulatorisch beteiligt. Die Fehlregulation von CK2 wird häufig mit der Pathologie von Krankheiten wie zum Beispiel Krebs assoziiert, was CK2 zu einem vielversprechenden Ziel klinischer Untersuchungen macht.
Im Rahmen des CK2-Projekts war es möglich, durch spezifische Modifikationen an 37, die hoch selektiven und potenten CK2-Inhibitoren 47 und 60 zu entwickeln. Ebenfalls gezeigt wurde, dass kleine strukturelle Veränderungen, wie z.B. Makrozyklisierung, einen signifikanten Effekt auf Selektivität und Potenz des Inhibitors haben kann.
Weiter Untersuchungen der Verbindungen lenkten den Fokus weiterer Arbeiten u.a. auf die Serin/Threonin Kinase 17A (STK17A) oder auch death-associated protein kinase-related apoptosis-inducing protein kinase 1 (DRAK1) genannt. Sie ist Teil der DAPK Familie und gehört zusammen mit anderen Kinasen zu den weniger erforschten Kinasen. Bis heute ist nicht viel über ihre zellulären Funktionen und die Beteiligung an pathophysiologischen Prozessen bekannt. Berichtet wurde jedoch eine Überexpression in verschiedenen Formen von Hirntumoren des zentralen Nervensystems (Gliom). Strukturelle Modifikationen, unter Erhalt des makrozyklischen Grundgerüsts 37, führten zu dem hoch selektiven und potenten DRAK1 Inhibitor 121, der alle Kriterien für eine chemical probe Verbindung erfüllt.
Ein weiteres Ziel dieser Arbeit war die AP-2-assoziierte Protein Kinase 1 (AAK1) aus der NAK Familie, bestehend aus AAK1, BIKE und GAK. Sie ist als potenzielles therapeutisches Ziel für viele verschieden Krankheiten wie z.B. neuropathische Schmerzen, Schizophrenie und Parkinson identifiziert. Durch die Regulierung der Clathrin-mediierten Endozytose ist AAK1 an intrazellulären Bewegungen verschiedener nicht zusammenhängenden RNS- und DNSViren, wie beispielsweise HCV, DENV oder EBOV, beteiligt. Ebenfalls berichtet wurde eine mögliche Assoziation mit dem SARS-CoV-2 Virus, was das Interesse an neuen selektiven AAK1 Inhibitoren verstärkte. Die Entwicklung der hochpotenten und selektiven AAK1 Inhibitoren 61 und 63 basierte ebenfalls auf dem makrozyklischen Grundgerüst 37, das bereits im CK2- und DRAK1-Projekt verwendet wurde.
Zusammenfassend lässt sich sagen, dass es im Rahmen dieser Arbeit gelungen ist, ausgehend von einem höchst unselektiven makrozyklischen Grundgerüst, hochpotente und selektive Kinaseinhibitoren für CK2, DRAK1 und AAK1 zu entwickeln und zu charakterisieren. Im Zuge von Untersuchungen verschiedener Struktur-Wirkungsbeziehungen wurde gezeigt, dass es durch geringfügige strukturelle Modifikationen möglich ist, die kinomweite Selektivität zu variieren und auf eine Kinase zu fokussieren. Diese Arbeit brachte nicht nur die erwähnten Inhibitoren hervor, sondern bildet auch die Grundlage für weitere Projekte zur Entwicklung von hoch potenten und selektiven Verbindungen als potenzielle chemische Werkzeuge für den Einsatz in der Forschung.