Refine
Year of publication
- 2021 (4) (remove)
Document Type
- Article (3)
- Doctoral Thesis (1)
Language
- English (4)
Has Fulltext
- yes (4)
Is part of the Bibliography
- no (4)
Keywords
- NMR (4) (remove)
NMR structure calculation using NOE-derived distance restraints requires a considerable number of assignments of both backbone and sidechains resonances, often difficult or impossible to get for large or complex proteins. Pseudocontact shifts (PCSs) also play a well-established role in NMR protein structure calculation, usually to augment existing structural, mostly NOE-derived, information. Existing refinement protocols using PCSs usually either require a sizeable number of sidechain assignments or are complemented by other experimental restraints. Here, we present an automated iterative procedure to perform backbone protein structure refinements requiring only a limited amount of backbone amide PCSs. Already known structural features from a starting homology model, in this case modules of repeat proteins, are framed into a scaffold that is subsequently refined by experimental PCSs. The method produces reliable indicators that can be monitored to judge about the performance. We applied it to a system in which sidechain assignments are hardly possible, designed Armadillo repeat proteins (dArmRPs), and we calculated the solution NMR structure of YM4A, a dArmRP containing four sequence-identical internal modules, obtaining high convergence to a single structure. We suggest that this approach is particularly useful when approximate folds are known from other techniques, such as X-ray crystallography, while avoiding inherent artefacts due to, for instance, crystal packing.
Die vorliegende Arbeit Zeitaufgelöste NMR-spektroskopische Untersuchung konformationeller Dynamiken in DNA G-Quadruplexen befasst sich mit der detaillierten biophysikalischen Untersuchung wichtiger strukturdynamischer Eigenschaften von nicht-kanonischen Nukleinsäure Sekundärstrukturelementen.
Im Genom aller eukaryotischer Lebewesen, insbesondere dem menschlichen Genom finden sich DNA-Sequenzabschnitte, die überdurchschnittlich Guanosin (G)-reich sind. Diese poly-G Abschnitte sind nicht zufällig im Genom verteilt, sondern häufen sich vermehrt in Genabschnitten, die besonders wichtig für die Regulation der Genexpression sind. G-reiche DNA-Sequenzen können unter geeigneten Umständen alternative Sekundärstrukturen ausbilden, die von der doppelsträngigen, kanonischen Watson-Crick Konformation abweichen. In Anwesenheit monovalenter Kationen können sich G-Nukleotide in einer Tetrade über Hoogsteen Interaktionen anlagern. Diese Tetraden können sich stapeln und dadurch sogenannte G-Quadruplexe (G4) ausbilden. Das menschliche cMYC Gen wird typischerweise als proto-Onkogen bezeichnet. Es kodiert für einen unspezifischen Transkriptionsfaktor, der bei einer Vielzahl von systematischen und soliden Tumorerkrankungen stark überexprimiert wird. Die zelluläre Konzentration des Genprodukts kann zu 90% über ein G4 cis-Element in der Promotorregion reguliert werden. Der cMYC G4 hat die Möglichkeit verschiedene Konformationen einzunehmen. Im Falle des cMYC G4 kann man zusätzliche, nicht-konventionelle Formen der konformationellen Isomerie finden. Zum einen gibt es die Möglichkeit, dass bei einem G4, der aus drei Tetraden und vier intramolekularen Strangabschnitten (dreistöckiger G4) besteht, einzelne Strangabschnitte mehr als drei konsekutive G-Nukleotide besitzen. Dadurch können sich Faltungs-Isomere bilden, die sich durch Verschieben des Strangs relativ zum verbleibenden dreistöckigen Tetradengerüst ergeben. Man spricht von G-Register Isomeren. Eine zweite Möglichkeit der Strukturisomerie ergibt sich, wenn in einer Nukleotidsequenz mehr als vier G-reiche Strangabschnitte aufeinander folgen. Jeweils vier dieser Strangabschnitte können in unterschiedlicher Weise kombiniert werden, um ein G4 Isomer auszubilden. In jedem dieser so zustande gekommenen G4 verbleibt ein (oder mehrere) G-reicher Strangabschnitt, der im konkreten Isomer nicht zur Faltung verwendet wird. Diese zusätzlichen G-Stränge werden daher auch Ersatzräder (engl. spare-tires) genannt; man erhält spare-tire Isomere.
Obwohl diese Formen des Polymorphismus, deren biologischer Kontext und die biophysikalischen Konsequenzen in Arbeiten von C. Burrows (2015) und A. Mittermaier (2016) erstmals umfassend beschrieben wurden, gab es bis zum Ausgangspunkt dieser Arbeit keine Kenntnisse über deren strukturelle Dynamik, den Faltungswegen und den zugrundeliegenden molekularen Mechanismen. Zeitaufgelöste Kernspinresonanz (engl. nuclear magnetic resonance, NMR) Spektroskopie ist eine bestens geeignete Methode, um die Dynamik von Biomakromolekülen mit atomarer Auflösung zu studieren. Um solche Experimente durchführen zu können, braucht es geeignete Herangehensweisen für die Präparation eines Nicht-Gleichgewichtszustands. In dieser Arbeit wird eine neu erarbeitete Strategie vorgestellt, die es erlaubt, Einblick in die Faltungs- und Umfaltungskinetiken eines dynamischen Konformations-Ensembles nicht-konventioneller Strukturisomere der cMYC G4 DNA-Sequenz zu erhalten.
Hierzu wurden photolabile Schutzgruppen (engl. Photocages) positionsspezifisch an bestimmten G-Nukleobasen (O6-(R)-NPE) angebracht. Die Schutzgruppen blockieren die Basenpaar-Interaktionen des Nukleotids, wodurch dieses sich nicht mehr an einer Tetradenbildung beteiligen kann. Die Photocages wurden jeweils an den Nukleotiden eingeführt, die nur in jeweils einem der G-Register Isomere an der Tetradenbildung beteiligt sind. Durch diese gezielte Destabilisierung konnten die Isomere getrennt und im gefalteten Zustand isoliert werden. Die so erhaltenen Konformationen wurden umfassend spektroskopisch charakterisiert. Der Ansatz, das konformationelle Gleichgewicht durch Photocages transient zu stören, wurde daraufhin weiterentwickelt. Mehrere Photocages wurden an Nukleobasen in zentraler Position einzelner G-Strangabschnitte angebracht. Dadurch konnte eine ausreichende Destabilisierung erreicht werden, die die Faltung jedweder G4 Strukturen unterbindet. Somit wurde ein ungefalteter Zustand erzeugt, der unter ansonsten frei wählbaren, physiologischen Bedingungen besteht. Durch in situ Photolyse der Schutzgruppen konnte so die Licht-induzierte G4 Faltung unter konstanten Puffer- und Temperaturbedingungen untersucht werden. Dieser Ansatz wurde auf die Untersuchung der Faltungswege, die zu verschiedenen spare-tire Isomeren führen, fokussiert.
Zusammenfassend kann festgestellt werden, dass es insgesamt erstmalig gelungen ist, die Kinetiken der wesentlichen Faltungs- und Umfaltungswege entlang der konformationellen Energielandschaft des cMYC G4 Elements zu untersuchen. Das komplexe, dynamische Zusammenspiel aller relevanten, nicht-konventionellen isomeren G4 Strukturen konnte entworren und umfassend experimentell beschrieben werden. Der dafür weiterentwickelte Ansatz über konformationelle Selektion mit Hilfe photolabiler Schutzgruppen hat dabei experimentelle Einblicke erlaubt, die bislang nicht zugänglich waren. Die Strukturen und Faltungszustämde, die mit den chemisch modifizierten Oligonukleotiden erhalten und isoliert wurden, sind umfassend spektroskopisch untersucht worden. Die Anwendung verschiedener spektroskopischer Ansätze und deren Kombination mit weiteren biophysikalischen Methoden hat eine Methoden-unabhängige Validierung der erhaltenen kinetischen und thermodynamischen Daten ermöglicht.
Ubiquitin fold modifier 1 (UFM1) is a member of the ubiquitin-like protein family. UFM1 undergoes a cascade of enzymatic reactions including activation by UBA5 (E1), transfer to UFC1 (E2) and selective conjugation to a number of target proteins via UFL1 (E3) enzymes. Despite the importance of ufmylation in a variety of cellular processes and its role in the pathogenicity of many human diseases, the molecular mechanisms of the ufmylation cascade remains unclear. In this study we focused on the biophysical and biochemical characterization of the interaction between UBA5 and UFC1. We explored the hypothesis that the unstructured C-terminal region of UBA5 serves as a regulatory region, controlling cellular localization of the elements of the ufmylation cascade and effective interaction between them. We found that the last 20 residues in UBA5 are pivotal for binding to UFC1 and can accelerate the transfer of UFM1 to UFC1. We solved the structure of a complex of UFC1 and a peptide spanning the last 20 residues of UBA5 by NMR spectroscopy. This structure in combination with additional NMR titration and isothermal titration calorimetry experiments revealed the mechanism of interaction and confirmed the importance of the C-terminal unstructured region in UBA5 for the ufmylation cascade.
An automated NMR chemical shift assignment algorithm was developed using multi-objective optimization techniques. The problem is modeled as a combinatorial optimization problem and its objective parameters are defined separately in different score functions. Some of the heuristic approaches of evolutionary optimization are employed in this problem model. Both, a conventional genetic algorithm and multi-objective methods, i.e., the non-dominated sorting genetic algorithms II and III (NSGA2 and NSGA3), are applied to the problem. The multi-objective approaches consider each objective parameter separately, whereas the genetic algorithm followed a conventional way, where all objectives are combined in one score function. Several improvement steps and repetitions on these algorithms are performed and their combinations are also created as a hyper-heuristic approach to the problem. Additionally, a hill-climbing algorithm is also applied after the evolutionary algorithm steps. The algorithms are tested on several different datasets with a set of 11 commonly used spectra. The test results showed that our algorithm could assign both sidechain and backbone atoms fully automatically without any manual interactions. Our approaches could provide around a 65% success rate and could assign some of the atoms that could not be assigned by other methods.