Datenbasierte Identifikation und Design von Liganden nukleärer Rezeptoren für Chemogenomik und Polypharmakologie
- Nukleäre Rezeptoren (NRs) sind eine Familie von 48 ligandengesteuerten Transkriptionsfaktoren, die in zahlreichen physiologischen und pathologischen Prozessen, wie Zellproliferation und -differenzierung, Metabolismus sowie Entzündungen, eine zentrale Rolle spielen. Bei ungefähr der Hälfte der NRs ist die Forschung fortgeschritten, dass ihre Funktionen und endogenen Liganden weitgehend bekannt sind und einige synthetische Liganden bereits als Arzneimittel zugelassen sind. Trotzdem bestehen weiterhin signifikante Forschungslücken, unter anderem auch bei der bereits umfangreich untersuchten NR1-Subfamilie, deren therapeutisches Potenzial bisher nur teilweise erschlossen ist. Diese Arbeit zielte darauf ab, durch den Einsatz von datenbasierten Methoden und maschinellem Lernen (ML) biologisch/pharmakologisch aktive Moleküle zu identifizieren und zu designen und mit der Anwendung in Chemogenomik (CG) und Polypharmakologie das therapeutische Potenzial der NR1-Proteine systematisch zu erweitern. Um eine hochqualitative Datengrundlage für diese Methoden zu erhalten, wurden zu Beginn fünf verschiedene öffentlich zugängliche Moleküldatenbanken (ChEMBL, PubChem, IUPHAR\-BPS, BindingDB und Probes & Drugs) analysiert. Diese Analyse wies erhebliche Unterschiede der Datenbanken hinsichtlich des Umfangs der enthaltenen Moleküle und deren Targets sowie ihrer Bioaktivitätsverteilung auf. Deshalb wurde ein Konsensdatensatz entwickelt, der Daten aus den verschiedenen Datenbanken kombinierte und zusätzliche Anmerkungen zu den eingesetzten Testsystemen sowie zur Verlässlichkeit von Bioaktivitäts- und molekularen Strukturinformationen bereitstellte. Der resultierende Konsensdatensatz umfasste Moleküle mit Bioaktivitäten für 5.613 humane Zielstrukturen, was einen verbesserten chemischen und bioaktiven Umfang im Vergleich zu den einzelnen Datenbanken ermöglichte. In Verbindung mit den zusätzlichen Informationen führte das zu einer gesteigerten Zuverlässigkeit der Daten und könnte somit eine teilautomatisierte Weiterverarbeitung ermöglichen und die Robustheit für ML- und CG-Methoden im Vergleich zu einzelnen Datenbanken erhöhen. Diese Eigenschaften verleihen dem Konsensdatensatz einen beträchtlichen Wert als Instrument für ML und andere datengesteuerte Anwendungen im Bereich des (de novo) Wirkstoffdesigns oder für die Auswahl der besten Substanzen für die Targetidentifizierung mittels CG. Auf Basis des generierten Konsensdatensatzes wurde eine chemogenomische Bibliothek (CGL) für die NR1-Subfamilie mit 69 Substanzen erstellt. Die Substanzen wurden mittels datengetriebener Methoden aus dem Konsensdatensatz identifiziert und nach ihrer chemischen Diversität, ihrer Modulationsart und kommerziellen Verfügbarkeit sowie nach komplementären Aktivitäts- und Selektivitätsprofilen ausgewählt. Anschließend wurden sie auf Reinheit, Toxizität, Selektivität und off-target-Aktivitäten validiert. Alle 19 NRs der Subfamilie wurden durch die CGL abgedeckt und die Substanzen wiesen meist eine gute Potenz, hohe chemische Diversität und alle bekannten NR1-Modulationsarten auf. Drei Proof-of-Concept-Anwendungen zeigten vielversprechende Ergebnisse der NR1-CGL zur Identifizierung von NR1-Targets in phänotypischen Experimenten. Potenzielle Targetfamilien für die Erzielung anti-neuroinflammatorischer Effekte, stellten die RARs (NR1B), RORs (NR1F) und RevERBs (NR1D) dar. Ebenso induzierten die RAR-Agonisten eine erhöhte und konstant verzögerte Autophagie, das auf einen genomischen Effekt hinwies. Daher könnten RAR-Rezeptoren eine potenzielle Rolle bei der Regulation der Autophagie spielen, die einen essentiellen zellulären Mechanismus zur Aufrechterhaltung der Homöostase darstellt und deren Dysregulation mit Krebs, Neurodegeneration und Stoffwechselstörungen in Verbindung gebracht wurde. In einer weiteren Anwendung hemmten LXR (NR1H)-Agonisten die Proliferation von A549-Lungenkrebszellen und HT29-Kolorektal-Adenokarzinomzellen und induzierten signifikant deren Zelltod. Die konsistenten phänotypischen Effekte der CGL-Gruppen für einzelne NR1-Unterfamilien deuteten also darauf hin, dass NR1-Rezeptoren an Autophagie, Neuroinflammation und Krebszelltod beteiligt sein könnten, was weitere Untersuchungen benötigt. Diese Proof-of-Concept-Anwendungen bestätigten das Potenzial und die Eignung der CGL zur Identifizierung von NR1-Targets in phänotypischen Experimenten. Die vollständig annotierte, validierte und öffentlich verfügbare NR1-CGL kann somit die Erforschung dieser wichtigen Proteinfamilie vorantreiben und bislang unentdeckte therapeutische Möglichkeiten aufzeigen.
- Nuclear receptors (NRs) are a family of 48 ligand-regulated transcription factors that play a central role in numerous physiological and pathological processes, such as cell proliferation and differentiation, metabolism and inflammation.For about half of the NRs, research is so advanced that their functions and endogenous ligands are largely known and some synthetic ligands are already approved as drugs.Nevertheless, there are still significant research gaps, including the already extensively studied NR1 subfamily, whose therapeutic potential has so far only been partially realised. The aim of this work was to use data-driven methods and machine learning (ML) to identify and design biologically/pharmacologically active molecules for application in chemogenomics (CG) and polypharmacology in order to systematically expand the therapeutic potential of NR1 proteins. In order to obtain a high-quality data basis for these methods, five different publicly accessible molecule databases (ChEMBL,246 PubChem,247 IUPHAR/BPS,248 BindingDB249 und Probes & Drugs250) were analyzed at the beginning of the work. This analysis revealed considerable differences between the databases in terms of the number of molecules contained and their targets as well as their bioactivity distribution. Therefore, a consensus dataset was developed that combined data from the different databases and provided additional comments on the test systems used and the reliability of bioactivity and molecular structure information. The resulting consensus dataset comprised molecules with bioactivities for human targets, providing an improved chemical and bioactivity coverage compared to the individual databases. Combined with the additional information, this led to increased reliability of the data and could therefore enable semi-automated processing and increase robustness for ML and CG methods compared to the individual source databases. These features give the consensus dataset considerable value as a tool for ML and other data-driven applications in the field of (de novo) drug design or chemogenomics for target identification in phenotypic experiments. Based on the generated consensus dataset, a chemogenomic library (CGL) for the NR1 subfamily of 69 compounds was created. The compounds were identified using data-driven methods and selected according to their chemical diversity, mode of action and commercial availability, as well as complementary activity and selectivity profiles and subjected to a thorough review of the associated literature. They were then validated for purity, identity, toxicity, selectivity and off-target activities. All 19 NRs of the subfamily were covered by the CGL and the compounds mostly showed good potency, high chemical diversity and all possible modes of action. Three proof-of-concept applications showed promising results of NR1-CGL for the identification of NR1 targets in phenotypic experiments. Potential target families for achieving anti-neuroinflammatory effects were the RARs (NR1B), RORs (NR1F) and RevERBs (NR1D). Similarly, RAR agonists induced increased and consistently delayed autophagy, indicating a genomic effect. Therefore, RAR receptors may play a potential role in the regulation of autophagy, which is an essential cellular mechanism for maintaining homeostasis and its dysregulation has been associated with cancer, neurodegeneration and metabolic disorders. In another application, LXR (NR1H) agonists inhibited the proliferation of A549 lung cancer cells and HT29 colorectal adenocarcinoma cells and significantly enhanced cell death. The consistent phenotypic effects of CGL groups for individual NR1 subfamilies suggest that NR1 receptors may be involved in autophagy, neuroinflammation and cancer cell death and warrant further investigation. These proof-of-concept applications confirmed the potential and suitability of the CGL to identify NR1 targets in phenotypic experiments. The fully annotated, validated and publicly available NR1-CGL can thus advance research into this important protein family and reveal previously undiscovered therapeutic opportunities.
Author: | Laura IsigkeitORCiDGND |
---|---|
URN: | urn:nbn:de:hebis:30:3-881793 |
DOI: | https://doi.org/10.21248/gups.88179 |
Place of publication: | Frankfurt am Main |
Referee: | Daniel MerkORCiDGND, Eugen ProschakORCiDGND, Thierry LangerORCiDGND |
Advisor: | Daniel Merk |
Document Type: | Doctoral Thesis |
Language: | German |
Date of Publication (online): | 2025/01/09 |
Year of first Publication: | 2024 |
Publishing Institution: | Universitätsbibliothek Johann Christian Senckenberg |
Granting Institution: | Johann Wolfgang Goethe-Universität |
Date of final exam: | 2024/12/09 |
Release Date: | 2025/01/09 |
Page Number: | 246 |
Note: | Kumulative Dissertation – enthält die Verlagsversionen (Versions of Record) der folgenden Artikel: Isigkeit, Laura; Chaikuad, Apirat; Merk, Daniel (2022): A Consensus Compound/Bioactivity Dataset for Data-Driven Drug Design and Chemogenomics. Molecules 2022, 27(8), 2513. ISSN 1420-3049. DOI 10.3390/molecules27082513 Isigkeit, Laura; Schallmayer, Espen; Busch, Romy; Brunello, Lorene; Menge, Amelie; Elson, Lewis; Müller, Susanne; Knapp, Stefan, Stolz, Alexandra; Marschner, Julian A.; Merk, Daniel (2023): Chemogenomics for NR1 nuclear hormone receptors. Nature Communications 2024, 15, 5201. ISSN 2041-1723. DOI 10.1038/s41467-024-49493-6 Isigkeit, Laura; Hörmann, Tim; Schallmayer, Espen, Scholz, Katharina; Lillich, Felix F.; Ehrler, Johanna H.M.; Hufnagel, Benedikt; Büchner, Jasmin; Marschner, Julian A.; Pabel, Jörg; Proschak, Ewgenij; Merk, Daniel (2024):Automated design of multi-target ligands by generative deep learning. Nature Communications 2024, 15, 7946. ISSN 2041-1723. DOI 10.1038/s41467-024-52060-8 |
HeBIS-PPN: | 525166084 |
Institutes: | Biochemie, Chemie und Pharmazie |
Dewey Decimal Classification: | 5 Naturwissenschaften und Mathematik / 54 Chemie / 540 Chemie und zugeordnete Wissenschaften |
Sammlungen: | Universitätspublikationen |
Licence (German): | Deutsches Urheberrecht |