Refine
Document Type
- Doctoral Thesis (4)
Has Fulltext
- yes (4)
Is part of the Bibliography
- no (4)
Keywords
Institute
- Biochemie und Chemie (4) (remove)
Specific functions of biological systems often require conformational transitions of macromolecules. Thus, being able to describe and predict conformational changes of biological macromolecules is not only important for understanding their impact on biological function, but will also have implications for the modelling of (macro)molecular complex formation and in structure-based drug design approaches. The “conformational selection model” provides the foundation for computational investigations of conformational fluctuations of the unbound protein state. These fluctuations may reveal conformational states adopted by the bound proteins. The aim of this work is to incorporate directional information in a geometry-based approach, in order to sample biologically relevant conformational space extensively. Interestingly, coarse-grained normal mode (CGNM) approaches, e.g., the elastic network model (ENM) and rigid cluster normal mode analysis (RCNMA), have emerged recently and provide directions of intrinsic motions in terms of harmonic modes (also called normal modes). In my previous work and in other studies it has been shown that conformational changes upon ligand binding occur along a few low-energy modes of unbound proteins and can be efficiently calculated by CGNM approaches. In order to explore the validity and the applicability of CGNM approaches, a large-scale comparison of essential dynamics (ED) modes from molecular dynamics (MD) simulations and normal modes from CGNM was performed over a dataset of 335 proteins. Despite high coarse-graining, low frequency normal modes from CGNM correlate very well with ED modes in terms of directions of motions (average maximal overlap is 0.65) and relative amplitudes of motions (average maximal overlap is 0.73). In order to exploit the potential of CGNM approaches, I have developed a three-step approach for efficient exploration of intrinsic motions of proteins. The first two steps are based on recent developments in rigidity and elastic network theory. Initially, static properties of the protein are determined by decomposing the protein into rigid clusters using the graph-theoretical approach FIRST at an all-atom representation of the protein. In a second step, dynamic properties of the molecule are revealed by the rotations-translations of blocks approach (RTB) using an elastic network model representation of the coarse-grained protein. In the final step, the recently introduced idea of constrained geometric simulations of diffusive motions in proteins is extended for efficient sampling of conformational space. Here, the low-energy (frequency) normal modes provided by the RCNMA approach are used to guide the backbone motions. The NMSim approach was validated on hen egg white lysozyme by comparing it to previously mentioned simulation methods in terms of residue fluctuations, conformational space explorations, essential dynamics, sampling of side-chain rotamers, and structural quality. Residue fluctuations in NMSim generated ensemble is found to be in good agreement with MD fluctuations with a correlation coefficient of around 0.79. A comparison of different geometry-based simulation approaches shows that FRODA is restricted in sampling the backbone conformational space. CONCOORD is restricted in sampling the side-chain conformational space. NMSim sufficiently samples both the backbone and the side-chain conformations taking experimental structures and conformations from the state of the art MD simulation as reference. The NMSim approach is also applied to a dataset of proteins where conformational changes have been observed experimentally, either in domain or functionally important loop regions. The NMSim simulations starting from the unbound structures are able to reach conformations similar to ligand bound conformations (RMSD < 2.4 Å) in 4 out of 5 cases of domain moving proteins. In these four cases, good correlation coefficients (R > 0.7) between the RMS fluctuations derived from NMSim generated structures and two experimental structures are observed. Furthermore, intrinsic fluctuations in NMSim simulation correlate with the region of loop conformational changes observed upon ligand binding in 2 out of 3 cases. The NMSim generated pathway of conformational change from the unbound structure to the ligand bound structure of adenylate kinase is validated by a comparison to experimental structures reflecting different states of the pathway as proposed by previous studies. Interestingly, the generated pathway confirms that the LID domain closure precedes the closing of the NMPbind domain, even if no target conformation is provided in NMSim. Hence, the results in this study show that, incorporating directional information in the geometry-based approach NMSim improves the sampling of biologically relevant conformational space and provides a computationally efficient alternative to state of the art MD simulations.
Das Ziel dieser Arbeit war es, RNA-Strukturen als potentielle Zielstrukturen für die Medikamentenentwicklung zu untersuchen. Hierbei ging es im Speziellen um die Anwendung Virtueller Screening Verfahren für die RNA-Liganden-Vorhersage. Hierzu wurde die als TAR-Motiv (transactivating response element) bekannte RNA-Struktur der mRNAs des HI-Virus ausgewählt. Diese Struktur wurde gewählt, da mit den vier PDB-Einträgen 1ANR, 1ARJ, 1LVJ und 1QD3 bereits experimentell motivierte Strukturmodelle zum Beginn der Untersuchung vorlagen. Ausschlaggebend war hierbei auch das Vorhandensein eines Tat-TAR-FRET-Assays im Rahmen des SFB 579, in welchem diese Arbeit angefertigt wurde. Die Aufmerksamkeit, welche dem HI-Virus im Rahmen der Bekämpfung der Immunschwächekrankheit bereits zukam, führte bei dem gewählten Testmodell ebenfalls zu einem, wenn auch immer noch überschaubaren Datensatz bereits getesteter Substanzen, der als Grundlage für einen Liganden-basierten Ansatz als erste Basis dienen konnte. Basierend auf diesen Voruntersuchungen ergaben sich die weiteren Schritte dieser Arbeit. Die Arbeit lässt sich zusammenfassend in vier zum Teil parallel verlaufende Phasen einteilen: Phase 1:Bestandsaufnahme bekannter Informationen über die Zielstruktur · experimentell bestimmte Zielstrukturen · experimentell bestimmte Liganden/Nichtliganden der Zielstruktur Phase 2: Ableiten eines ligandenbasierten Ansatzes zur Vorhersage von potentiellen Bindern der Zielstruktur aus Substanzbibliotheken, der nicht auf Strukturdaten der Zielstruktur beruht. Phase 3: Analyse der bekannten Konformere der Zielstruktur auf konstante Angriffspunkte für ein spezielles Liganden-Design. Phase 4: Einbinden der bekannten Strukturinformationen der Zielstruktur zur weiteren Verfeinerung der Auswahlverfahren neuer Kandidaten für die weitere experimentelle Bestimmung des Bindeverhaltens. Im Rahmen dieser Arbeit konnten mittels der Anwendung von künstlichen neuronalen Netzen in einem ligandenbasierten Ansatz durch virtuelles Screening der Chemikalien-Datenbanken verschiedener Lieferanten fünf neue potentielle TAR-RNA-Liganden identifiziert werden (drei davon mit einem Methylenaminoguanidyl-Substrukturmotiv), sowie als „Spin-Off“ durch die Anwendung der ursprünglich nur für den Tat-TAR-FRET-Assay vorgesehenen Testsubstanzen in einem Kooperationsprojekt (mittels CFivTT-Assay) zwei neue potentiell antibakterielle Verbindungen identifiziert werden. Die Beschäftigung mit der offensichtlichen Flexibilität der TAR-RNA und damit einer nicht eindeutig zu definierenden Referenz-Zielstruktur für das Liganden-Docking führte zur Erstellung eines Software-Pakets, mit dem flexible Zielstrukturen – basierend auf den Konformer-Datensätzen von MD-Simulationen – auf konstante Angriffspunkte untersucht werden können. Hierbei wurde ausgehend von der Integration eines Taschenvorhersage-Programms (PocketPicker) eine Reihe von Filtern implementiert, die auf den hierzu in einer MySQL-Datenbank abgelegten Strukturinformationen eine Einschränkung des möglichen Taschenraums für das zukünftige Liganden-Design automatisiert vornehmen können. Des Weiteren ermöglicht dieser Ansatz einen einfachen Zugriff auf die einzelnen Konformere und die Möglichkeit Annotationen zu den Konformeren und den daraus abgeleiteten Tascheninformationen hinzuzufügen, so dass diese Informationen für die Erstellung von Liganden-Docking-Versuchen verwendet werden können. Ferner wurden im Rahmen dieser Arbeit ein neuer Deskriptor für die Beschreibung von Taschenoberflächen eingeführt: der auf der „Skalierungs-Index-Methode“ basierende molekulare SIMPrint. Die Beschäftigung mit der Verteilung der potentiellen Bindetaschen auf der Oberfläche der Konformerensemble führte ferner zur Definition der Taschenoberflächenbildungswahrscheinlichkeit (Pocket Surface Generation Probability – PSGP) für einzelne Atome einer Zielstruktur, die tendenziell für die Einschätzung der Ausbildung einer potentiell langlebigen Interaktion eines Liganden mit der Zielstruktur herangezogen werden kann, um beispielsweise Docking-Posen zu bewerten.
This work presents a contribution to the literature on methods in search of lowdimensional models that yield insight into the equilibrium and kinetic behavior of peptides and small proteins. A deep understanding of various methods for projecting the sampled configurations of molecular dynamics simulations to obtain a low-dimensional free energy landscape is acquired. Furthermore low-dimensional dynamic models for the conformational dynamics of biomolecules in reduced dimensionality are presented. As exemplary systems, mainly short alanine chains are studied. Due to their size they allow for performing long simulations. They are simple, yet nontrivial systems, as due to their flexibility they are rapidly interconverting conformers. Understanding these polypeptide chains in great detail is of considerable interest for getting insight in the process of protein folding. For example, K. Dill et al. conclude in their review [28] about the protein folding problem that "the once intractable Levinthal puzzle now seems to have a very simple answer: a protein can fold quickly and solve its large global optimization puzzle simply through piecewise solutions of smaller component puzzles".
Für das Verständnis der Proteinfaltung ist es von Interesse, die phi,psi-Torsionswinkelverteilung und deren Abhängigkeiten innerhalb einer Polypeptidkette zu kennen. Mit der in dieser Arbeit verwendeten Kombination aus MD-Simulation und NMR-Spektroskopie wird die Abhängigkeit der Konformationsverteilung kurzer alaninbasierter Modellpeptide mit einer Genauigkeit von 5 % bestimmt. Die Berechnung der thermischen Populationen der einzelnen Konformationen beruht auf einer Minimierung der Differenz aus experimentellen und berechneten skalaren Kopplungskonstanten. Trialanin populiert überwiegend den Bereich der Polyprolin Typ II Helix (~ 90 %) und daneben den beta-Faltblattbereich mit ca. 10%, jedoch nicht den alphaR-helicalen Bereich. Diese Konformationsverteilung ändert sich nicht signifikant mit zunehmender Kettenlänge in der Peptidreihe Ala3 bis Ala7. Das in der Seitenkette verzweigte Trivalin populiert dagegen alle drei Konformationsbereiche signifikant. Aufgrund der Periodizität der Torsionswinkel populiert Triglycin einen zusammenhängenden Bereich, der sich an den vier Ecken des Ramachandran-Diagramms befindet. Zudem befindet es sich in einem langsamen konformationellen Gleichgewicht zwischen der cis- und trans-Konformation der Peptidbindung. Die Temperaturabhängigkeit der Konformationsverteilung wird am Beispiel von Trialanin untersucht. Die 3J(HN,Ha) Kopplungskonstanten nehmen linear mit der Temperatur zu. Dies ist auf eine Zunahme des beta-Faltblattanteils zurückzuführen und kann theoretisch beschrieben werden. Die Konformationsverteilung der Trialaninsequenz innerhalb einer heteropolymeren Aminosäuresequenz ist von der Kettenlänge der an dem N- und C-Terminus angefügten heteropolymeren Aminosäuresequenz abhängig. Dies wird an zwei Peptiden, abgeleitet von der Sequenz des Proteins Lysozym aus Hühnereiweiß, gezeigt. Das kürzere Peptid hat an beiden Enden jeweils drei Aminosäurereste angefügt, das längere jeweils acht Aminosäurereste. Die Konformationsverteilung der Trialanisequenz des kürzeren Peptids entspricht nahezu der in der Peptidreihe Ala3 bis Ala7. Die Verteilung des längeren Peptids ist dagegen deutlich verschieden (~ 35% alphaR-helicaler Anteil). Die 1HN und 15N chemischen Verschiebungen der Trialaninsequenz des längeren Peptids sind mit denen des entfalteten Lysozym-Proteins identisch und demzufolge aller wahrscheinlichkeit nach auch die Konformationsverteilung. Kurze homopolymere Peptide eignen sich deshalb nicht als Modell für Aminosäuresequenzen in längeren heteropolymeren Peptiden.