Refine
Document Type
- Doctoral Thesis (6)
Language
- English (6)
Has Fulltext
- yes (6)
Is part of the Bibliography
- no (6)
Institute
In this thesis, molecular dynamics (MD) simulations are used to study the interaction of different proteins with lipid bilayers. MD simulations can be used as a “computational microscope” to gain atomistic insights into the interactions between proteins and lipids that can barely be accessed in such detail by experimental methods. The different chapters of this thesis address the lipid sensing functionality of amphipathic helices (AHs) when bound to membranes, the folding of AHs at lipid-water interfaces as well as the conformational dynamics of the HIV-1 Env glycoproteins in viral-like and experimental bilayers. In the last chapter the possibilities to enhance the performance of MD simulations are explored, leading to a more efficient usage of computational resources.
Die Kommunikation von Zellen mit ihrer Umgebung wird durch Rezeptorproteine arrangiert, die sich in der Plasmamembran befinden. Membranrezeptoren werden durch die Bindung von extrazellulären Liganden, Pathogenen oder Zell-Zell-Interaktionen aktiviert, wodurch die Bildung eines aktiven Zustands gefördert wird, der eine intrazelluläre Reaktion einleitet. Eine Beschreibung auf molekularer Ebene, wie sich Membranrezeptoren in Proteinanordnungen organisieren und wie diese Proteinanordnungen eine spezifische funktionelle Aufgabe ausführen, ist der Ausgangspunkt für das Verständnis der molekularen Mechanismen, die Gesundheit und Krankheit zugrunde liegen.
Die Fluoreszenzmikroskopie gibt Aufschluss über die Lage von Proteinen in Zellen, und mit der Einführung der höchstauflösenden Mikroskopie wurde der Nachweis einzelner Proteingruppierungen möglich. Eine Einschränkung der meisten Methoden der höchstauflösenden Mikroskopie ist, dass einzelne Komponenten einer Proteingruppierung optisch nicht aufgelöst werden können, was an der geringen Größe und dichten Packung der Bestandteile im Vergleich zur erreichbaren räumlichen Auflösung liegt. Eine Lösung, die für Einzelmolekül-Lokalisierungsmethoden gezeigt wurde, besteht darin, zusätzliche experimentelle Informationen in die Analyse zu implementieren, also „die Aufl sungsgrenze der höchstauflösenden Mikroskopie zu umgehen". Bei der Einzelmolekül-Bildgebung kann diese zusätzliche Information zum Beispiel die Kinetik von mehrfachen und wiederkehrenden
Emissionsereignissen sein, die bei einzelnen Fluorophoren beobachtet werden, was als "Blinken" bezeichnet wird. Das Ziel dieser Arbeit war die Entwicklung einer höchstauflösenden Fluoreszenzmikroskopiemethode zur Detektion von Proteinmonomeren und -dimeren in der Plasmamembran von Zellen durch die Verwendung der kinetischen Information.
Im ersten Teil dieser Arbeit wurden photoschaltbare fluoreszierende Proteine als Reporter verwendet, deren photoschaltbare Kinetik mit kinetischen Gleichungen analysiert wurden.
Synthetische, genetische und zelluläre Referenzproteine wurden konstruiert und dienten als Kalibrierungsreferenzen für monomere und dimere Proteine.
Im zweiten Teil dieser Arbeit wurde das kinetische Modell, das zur Annäherung des Häufigkeitshistogramms von Blinkereignissen einzelner Fluorophore verwendet wird, auf Oligomere höherer Ordnung erweitert. Ein Vergleich mit einem zuvor entwickelten Modell zeigte, dass das erweiterte Modell genauere Ergebnisse für Oligomere höherer Ordnung und Mischungen verschiedener Oligomere liefert. Zusätzlich wird die Anwesenheit von unerkannten Oligomeren berücksichtigt. Die erweiterte Theorie bietet somit die Grundlage, um größere Oligomere und Mischungen unterschiedlicher Stöchiometrie mit besserer Genauigkeit zu untersuchen.
Im dritten Teil dieser Arbeit wurde eine Methode zur stöchiometrischen endogenen Markierung von Proteinen verwendet, um zwei Rezeptortyrosinkinasen, MET und EGFR, mit einem photoschaltbaren fluoreszierenden Protein zu markieren. Das Vorkommen von monomerem und dimerem MET-Rezeptor wurde auf der Plasmamembran von HEK293T- Zellen mittels quantitativer höchstauflösender Mikroskopie bestimmt. Der Diffusionskoeffizient und der Diffusionsmodus des MET-Rezeptors in lebenden HEK293T-Zellen wurden mit
Einzelpartikelverfolgung gemessen. Dieser Teil der Arbeit zeigte, dass die Kombination von CRISPR/Cas12a-gestützter endogener Markierung und Einzelmolekül-Lokalisierungsmikroskopie ein leistungsfähiges Werkzeug zur Untersuchung der molekularen Organisation und Dynamik von Membranproteinen ist.
Im vierten Teil dieser Arbeit wurde die Einzelmoleküldatenanalyse durch ein Softwaretool beschleunigt, das eine automatisierte und unvoreingenommene Detektion von Einzelmolekül-Emissionsereignissen ermöglicht. Der Anteil von Monomeren und Dimeren von fluoreszierenden Reportern wurde durch die Implementierung eines neuronalen Netzwerks bestimmt (die Software wurde von Alon Saguy geschrieben; Gruppe von Prof. Yoav Shechtman, Technion, Israel). Der oligomere Zustand der monomeren und dimeren Referenzproteine CD86 und CTLA-4 wurde erfolgreich bestimmt. Die automatisierte Detektion einzelner Proteingruppierungen ermöglichte die Analyse von MET-mEos4b in einzelnen Zellen, wodurch die Heterogenität zwischen den Zellen bestimmt und das Expressionsniveau des Rezeptors mit der Dimerisierung korreliert werden konnte.
Zusammenfassend wurden in dieser Arbeit Ergebnisse zu elementaren Aspekten hin zu einer molekularen Quantifizierung von Proteinzahlen mittels Einzelmolekül-
Lokalisationsmikroskopie generiert, die fluoreszierende Reporter, stöchiometrische Markierung von zellulären Proteinen und Bildanalyse umfassen. Das Potential dieser
Entwicklungen wurde anhand der Beobachtung der Liganden-induzierten Verschiebung von monomeren zu dimeren MET-Rezeptoren in einzelnen HEK293T-Zellen gezeigt.
The diffusive behavior of macromolecules in solution is a key factor in the kinetics of macromolecular binding and assembly, and in the theoretical description of many experiments. Experiments on high-density protein solutions have found that a slow down of the diffusion dynamics is larger than expected from colloidal theory for non-interaction hard-spheres. It has also been shown that the rotational diffusion anisotropy in high-density protein solutions is larger than in dilute ones. High-density protein solutions are a complex fluid that is different from the neat fluid assumption used in the hydrodynamic theory. It is therefore important to have methods to accurately calculate the translational and rotational diffusion tensor from simulations as well as simulation algorithms to explore high-density solutions.
Simulations provide a powerful tool to study diffusion in complex fluids. They can be used to study the macroscopic and microscopic effects of complex fluids on the diffusive behavior. There has been already a lot of work done to accurately simulate diffusion and to determine the diffusion coefficients from simulations.
The translational diffusion of molecules in simple and complex liquids can be determined with high accuracy from simulations. This is not yet the case for rotational diffusion. Existing algorithms to calculate the rotational diffusion coefficients from simulations make assumptions about the shape of the protein or only work at short times. For the simulation of diffusive behavior of macromolecules two options exist today. An all-atom integrator with explicit solvent molecules or coarse-grained (CG) simulations with an implicit solvent. CG simulations of dynamic behavior with implicit solvent are also called Brownian dynamics (BD) simulations. For the CG simulations the Ermak-McCammon algorithm is often used to solve the underlying Langevin equation. The algorithm is an extension of the Euler-Maruyama integrator to include translation and rotation in three dimensions. This algorithm only correctly reproduces the equilibrium probability for short time-steps and the error depends linearly on the time-step. It has been shown that Monte Carlo based algorithms can produce BD for translational dynamics, when appropriately parametrized. The advantage of Monte Carlo based algorithm is that they will reproduce the correct equilibrium distribution independent of the chosen time-step. This in return allows choosing larger time-steps in simulations. The aim of this thesis is to develop novel´methods to accurately determine the rotational diffusion coefficient from simulations and extend existing Monte Carlo algorithms to include rotational dynamics.
The first project addresses the question of how to accurately determine the rotational diffusion coefficients from simulations. We develop a quaternion based method to calculate the rotational diffusion tensor from simulations and a theory for the effects of periodic boundary conditions (PBC) on the rotational diffusion coefficient in simulations.
Our method for calculating rotational diffusion coefficients is based on the quaternion covariances from Favro for a freely rotating rigid molecule. The covariances as formulated by Favro are only valid in the principal coordinate system (PCS) of the rotation diffusion tensor. The covariances can be generalized for an arbitrary reference coordinate system (RCS), i.e., a simulation, given the principle axes of the rotational diffusion tensor in the RCS. We show that no prior knowledge of the diffusion tensor and its principal axes is required to calculate the generalized covariances from simulations using common root-mean-square distance (RMSD) procedures. We develop two methods to fit the covariances calculated from simulations to our generalized equations to fit the rotational diffusion tensor. In the first method we minimize the sum of the squared error deviations between model and simulation data. For this six dimensional optimization we use a simulated annealing algorithm. Alternatively the rotational diffusion tensor can also be determined from a eigenvalue decomposition of covariance after integration. To minimize the effects of sampling noise in the integration we first apply a Laplace-transformation to smooth the covariances at large times. For ideal sampling the resulting rotational diffusion coefficient should be independent of the value of the Laplace variable. In practice, however, the best results are achieved using a value close to the inverse autocorrelation time of the rotational motion.
...
Die Plasmamembran eukaryotischer Zellen dient als Barriere zwischen dem Inneren einer Zelle und ihrer Umgebung. Eine wichtige Aufgabe von Proteinen, die sich in der Plasmamembran befinden, besteht in der Erkennung der Umgebung, der Übermittlung dieser Informationen über die Plasmamembran in das Innere einer Zelle und der Einleitung einer zellulären Antwort. Membranrezeptoren binden Liganden, was zu ihrer Aktivierung und der Rekrutierung von intrazellulären Proteinen führt. Funktionelle Signalkomplexe werden gebildet und leiten einen Informationstransfer durch die Zellmembran ein, so dass die Expression bestimmter Gene stimuliert oder unterdrückt wird. Eine Störung der Signalinitiierung und -übertragung tritt bei vielen Krankheiten auf, so dass Membranproteine ein wichtiges Ziel in der Medikamentenentwicklung sind.
In dieser Arbeit wird die Fragestellung bearbeitet, wie der Tumornekrosefaktor-Rezeptor 1 (TNFR1) in funktionelle Komplexe in der Plasmamembran einer intakten Zelle organisiert ist. TNFR1 besitzt vier cysteinreiche Domänen (CRDs) in seiner extrazellulären Region. Die erste und von der Plasmamembran am weitesten entfernte CRD ist die Pre-Ligand Assembly Domain (PLAD). Kristallstrukturen zeigten, dass sich in einem TNFR1-Dimer zwei PLAD in unmittelbarer Nähe befinden. Crosslinking-Experimente berichteten über mehrere oligomere Zustände von TNFR1; die Ergebnisse unterschieden sich nach Art und Konzentration des Crosslinkers. In der nativen Umgebung einer intakten Zelle wurde der oligomere Zustand von TNFR1 bisher nicht bestimmt. Der kanonische Ligand für TNFR1 ist der Tumornekrosefaktor alpha (TNF), ein Homotrimer, welches in löslicher oder membrangebundener Form vorliegt. Nach der Bindung von TNF an TNFR1 bilden sich Rezeptortrimere. Diese Proteinkomplexe rekrutieren intrazellulär Proteine und bilden einen funktionellen Membrankomplex, der intrazelluläre Signalkaskaden aktiviert. Die kanonische Signalweiterleitung erfolgt durch den nuclear factor kappa-light-chain-enhancer of activated B-cells (NF-B), welcher Zellteilung oder Entzündung induziert. TNFR1 kann auch andere Signalwege wie beispielsweise Apoptose durch einen zytosolischen Komplex und die Procaspase-8, oder Nekroptose durch das Nekrosom und die mixed lineage kinase domain-like (MLKL)-Domäne einleiten. Die Dysregulation von TNFR1 ist bei einer Vielzahl von Krankheiten zu finden. Erhöhte TNFR1-Expressiosraten treten bei acquired immune deficiency syndrome (AIDS), multipler Sklerose und verschiedenen Krebsarten auf.
In einem zweiten Projekt wurde in Zusammenarbeit mit Prof. Dr. Michael Lanzer (Heidelberg, Germany) der Expressionsgrad des Proteins VAR2CSA in membranassoziierten knobs bestimmt, welche in Erythrozyten vorkommen, die mit dem Parasiten Plasmodium falciparum infizierten wurden. VAR2CSA gehört zur Proteinfamilie des Plasmodium falciparum erythrocyte membrane protein 1 (pfEMP1). Nach einer Infektion wird VAR2CSA zur Wirtszellmembran transportiert und in knobs eingelagert. Patienten, die Sichelzellenanämie-Erythrozyten (HbAS) aufweisen, sind im Gegensatz zu Patienten mit gesunden Erythrozyten (HbAA) immun gegen Malaria. Während die beiden Erythrozytentypen eine unterschiedliche Morphologie der knobs aufweisen, blieb ihre Zusammensetzung in Bezug auf VAR2CSA bisher ungeklärt.
Das Verständnis der Proteinfunktion erfordert eine Beschreibung der molekularen Organisation funktioneller Einheiten in der zellulären Umgebung. Hierfür ist die Fluoreszenzmikroskopie eine geeignete Methode, da sie eine gezielte Markierung von Zielproteinen ermöglicht. Die hohe Sensitivität ermöglicht die Visualisierung einzelner Proteine. Eine Einschränkung in der konventionellen Fluoreszenzmikroskopie ist die Auflösungsgrenze. Strukturelle Elemente, die kleiner als etwa die halbe Anregungswellenlänge sind (für die meisten Anwendungen 200 bis 300 nm) können nicht aufgelöst werden. Die Entwicklung der hochauflösenden Fluoreszenzmikroskopie ermöglichte es, diese Auflösungsgrenze zu umgehen und eine räumliche Auflösung von wenigen Nanometern zu erreichen, was die Visualisierung und Charakterisierung einzelner Proteinkomplexe ermöglichte. Eine Art der hochauflösenden Fluoreszenzmikroskopie ist die single-molecule localization microscopy (SMLM), die auf der Detektion einzelner Fluorophore, einer genauen Bestimmung ihrer Position (Lokalisation) und der Erzeugung eines rekonstruierten Bildes unterhalb der optischen Auflösungsgrenze basiert. Da die meisten Proben in der Fluoreszenzmikroskopie eine zu hohe räumliche Dichte an Fluorophoren aufweisen, um den Nachweis von einzelnen Fluorophoren zu ermöglichen, werden Verfahren zur Kontrolle der Emission von Fluorophoren eingesetzt. Eine Möglichkeit ist der Einsatz von Fluorophoren, die optisch zwischen einem nicht-fluoreszierenden und einem fluoreszierenden Zustand geschaltet werden können, z.B. photoschaltbare fluoreszierende Proteine in photoactivated localization microscopy (PALM) oder organische Farbstoffe in (direct) stochastic optical reconstruction microscopy ((d)STORM). SMLM erreicht eine räumliche Auflösung von 20 nm, was in den meisten Fällen ausreicht, um einzelne Proteinkomplexe in einer Zelle aufzulösen. Diese räumliche Auflösung ist jedoch nicht ausreichend, um Untereinheiten innerhalb eines Proteinkomplexes zu visualisieren. Zu diesem Zweck wurde SMLM erweitert und die verfügbare kinetische Information genutzt, die bei der Detektion einzelner Fluorophore ausgelesen wird. Viele Fluorophore weisen metastabile Dunkelzustände auf, die eine Lebensdauer von bis zu Sekunden aufweisen. Diese Übergänge erscheinen als "Blinken" der Fluoreszenzemission. In Kombination mit kinetischen Modellen kann aus der Anzahl an Blink-Ereignissen die Anzahl der Fluorophore ermittelt werden. Angewendet auf hochaufgelöste Proteinkomplexe kann die Auflösungsgrenze von hochauflösender Mikroskopie umgangen werden, und die Anzahl der Protein-Untereinheiten in einem hochaufgelösten Proteincluster ermittelt werden. Hierzu wird beispielsweise das photoschaltbare fluoreszierende Protein mEos2 an ein Zielprotein funsioniert (quantitative PALM (qPALM)).
...
Die Lebensfunktion der Zelle beruht unter anderem auf der Funktion und Wechselwirkung der Nukleinsäuren DNA (2’-Desoxyribonukleinsäure) und RNA (Ribonukleinsäure). Mit Hilfe von PDS (engl. ’pulsed dipolare spectroscopy’)-Techniken, basierend auf der EPR (engl. ’electron paramagnetic resonance’)-Spektroskopie, können Abstände in einem Bereich von 2-10 nm zwischen zwei markierten Positionen einer Nukleinsäure bestimmt werden. Daneben kann mit der Abstandsverteilung auf die Flexibilität des Moleküls geschlossen werden. Durch PDS-Messungen eröffnet sich die Möglichkeit, Bewegungen und Zustandsänderungen zu untersuchen. Die Messungen beruhen auf der dipolaren Kopplung von Radikalen (Spinlabel). Da die gemessenen dipolaren Kopplungen eine anisotrope Wechselwirkung sind, können an starren Systemen neben den Abstandsinformationen auch die Orientierungen der beiden Spinlabel zueinander bestimmt werden. Diese zusätzliche Information ermöglicht es, mittels orientierungsselektiver PDS-Messungen noch genauer die Geometrie und Flexibilität des Systems zu untersuchen. Klassischerweise werden alle Messungen mit der Doppelfrequenztechnik PELDOR (engl. ’pulsed electron-electron double resonance’) durchgeführt. Einzelfrequenzmethoden basieren dagegen auf Breitbandanregung, die mit den technischen Gegebenheiten l nge nicht möglich war. Eine solche Sequenz ist 2D-SIFTER.ImmRahmen dieser Arbeit von PELDOR ausgehende, weiterentwickelte Simulationsprozedur etabliert. Eine große Herausforderung ist die eindeutige Interpretation der sensitiven orientierungsselektiven PELDOR-Messungen. Sie mittels MD (Moleküldynamik)-Simulationen zu beschreiben war bisher nur qualitativ möglich. Allerdings wurden mehrere neue Kraftfelder publiziert. Mit einem quantitativen Vergleich mit orientierungsselektiven PELDOR-Daten kann sichergestellt werden, dass die Flexibilität des Systems durch Kraftfelder richtig beschrieben ist. PELDOR-Zeitspuren, gemessen bei Raumtemperatur und 50 K, unterscheiden sich besonders in ihrer Dämpfung. Der physikalische Unterschied beider Messungen konnte durch MD-Simulationen qualitativ nachvollzogen worden. Eine Schwierigkeit für speziell orientierungsselektive PELDOR-Messungen ist die aufwendige Synthese von mit dem starren Ç-Label markierten Nukleinsäuren. Als Alternative wurde in der Sigurdsson-Gruppe das halbstarre IMU-Label entwickelt. Die Analyse der orientierungsselektiven Daten ergab ein klares Bild der Dynamik dieses Labels. Ein weiterer interessanter Spinlabel ist der `G. Dieser Label ist nicht kovalent gebunden, sondern interkaliert in eine Stelle der Nukleinsäure, in der eine Guanin- Base fehlt. MD-Simulationen im quantitativen Vergleich mit orientierungsselektiven PELDOR-Messungen an verschiedenen Magnetfeldern haben eine hohe Übereinstimmung. Dabei konnte gezeigt werden, dass der Label, interkaliert in eine dsDNA, flippen kann, was zu einer Ausmittelung der Anisotropie führt, allerdings zu keiner Verbreiterung der Abstandsverteilung. Dagegen wird in der dsRNA dieses Flippen um die Einfachbindung sterisch gehindert, so dass neben dem Abstand auch die Orientierung des Labels bestimmt werden kann. Kurze dsRNA-Bausteine tendieren dazu, Oligomere zu bilden, was zu Multispineffekten führte. Zusätzlich beeinflusst diese Aggregation die Dynamik der einzelnen RNAs. Daher musste dieses ’end-to-end’-Stacking verhindert werden. Eine Nukleobasean einem Ende der dsRNA führt zu einer Dimerisierung, während eine Nukleobase an beiden Seiten dieses Stacking vollständig verhindert. Messungen mit unterschiedlichen Salzkonzentrationen konnten zusätzlich zeigen, dass die Interaktion zweier dsRNAs bei höheren Salzkonzentrationen zunimmt.
Simulations of conformational changes and enzyme-substrate interactions in protein drug targets
(2022)
Finding new drugs is a difficult, time-consuming, and costly challenge, with only a small success rate along the drug discovery pipeline of far less than 10%. The high failure rate of drug discovery projects motivates the integration of computational tools throughout the whole drug discovery pipeline, from target identification to clinical trials. Target identification is the first step in the process. A biological target, e.g., a protein that plays a role in disease, is identified and its molecular mechanism in the disease is studied. Further, a potential binding site on the target, where therapeutic molecules can bind and modulate the target’s activity, needs to be characterized. Computational tools can contribute to improving the initial molecular target elucidation and assessment.
In this thesis, I use computational, physics-based approaches to characterize binding sites of drug targets and to decipher enzyme-substrate interactions, which play a role in disease mechanisms. Molecular dynamics (MD) simulations were applied to study the dynamics of molecules in solution at high temporal and spatial resolution. The method generates time-resolved trajectories of the particles in a system of interest by integrating Newton’s equations of motion numerically, starting from a set of coordinates and velocities. In MD simulations, all atoms of a chosen system, including solvent, are represented explicitly. Atomistic simulations are especially well-suited to study detailed interactions that depend on intermolecular interactions, such as hydration effects, hydrogen bonding, hydrophobic interactions, or subtle chemical differences. System properties are inferred from the trajectories, provided that the force fields, describing the interactions between the particles in the system, have a high accuracy. The bonded and non-bonded interactions are parametrized on experimental and quantum chemical data. The purpose of MD simulations can be to gain insight into the behavior of complex biological systems at molecular level, which often cannot be observed in experiments at the same resolution. With recent advances in computer hardware and simulation software, molecular systems of increasing size and simulation length can be investigated.
In the first part of the thesis, I investigated the conformational ensemble of various protein drug targets. Proteins are dynamic biomacromolecules that can have diverse and nearly isoenergetic conformational states. Ligand binding can shift the equilibrium of this conformational ensemble and can uncover binding sites, called cryptic sites. Cryptic sites only emerge upon small molecule binding and are often flat and featureless, and thus not easily recognized in crystal structures without bound ligands. If new binding sites including cryptic sites are detected, they can potentially be exploited for binding to ligands and enable a druggable target. Druggability is the ability of a protein to bind small, drug-like molecules, which is the basis for rational drug design. In this thesis, I used state-of-the-art physics-based, computational approaches to investigate the conformational ensembles of binding sites. In all studied systems, it is known from experiment that a specific group of ligands can induce conformational changes. The aim is to sample the conformational space made accessible upon ligand binding, yet without using the specific ligand structures or details about their interactions. We are interested in sampling the
pocket conformational states and identifying the respective pocket opening mechanism. For some cases, I additionally assessed whether the observed flexibility is a feature of the protein family, or specific to the protein under consideration.
The first studied system is factor VIIa (FVIIa). FVIIa is an essential part of the coagulation cascade and hence a potential drug target for thrombotic diseases. In addition, I investigated various other trypsin-like serine proteases from the same protein family. The binding pocket of trypsin-like serine proteases is called S1 pocket. An X-ray crystal structure solved by our collaborators reveals that a b-sheet structure in the S1 pocket is distorted by a bound ligand. I resolved the conformational change with MD simulations, starting from the unbound protein structure solvated in water and ions. I observed multiple spontaneous transition events. In 7 out of 22 simulations with the b-sheet as starting structure, the S1 pocket eventually rearranged into a distorted loop structure. These transitions occurred spontaneously and were mediated by water molecules probing the backbone hydrogen bonds. The conformational change studied here controls the onset of substrate binding and catalysis. Furthermore, I used metadynamics simulation, an enhanced-sampling method, to estimate the free energy barrier of this conformational change..