Entwicklung eines rechnerischen Verfahrens zur Simulation der thermischen Entfaltung von Proteinen und zur Untersuchung ihrer Thermostabilität

Development of a computational method for simulating the thermal unfolding of proteins and predicting their thermostability

  • In dieser Arbeit wurde ein Verfahren entwickelt, mit dem die Entfaltung von Proteinen simuliert werden kann. Anhand der Simulation kann die Schmelztemperatur bestimmt und damit die Thermostabilität einer Struktur untersucht werden. Außerdem ist die Untersuchung struktureller Veränderungen möglich, die während der Entfaltung auftreten und letztendlich zum globalen Zerfall der Struktur führen. Die Bereiche, von denen der globale Zerfall der Struktur ausgeht, können bestimmt werden. Es wurde untersucht, inwieweit diese Entfaltungsregionen Strukturbereiche darstellen, deren Mutation die thermische Stabilität der Struktur beeinflusst. Das entwickelte Verfahren basiert auf der Anwendung von Methoden aus der Rigiditätstheorie. Die thermische Entfaltung der Strukturen wird über das sukzessive Aufbrechen nichtkovalenter Wechselwirkungen in den Netzwerken simuliert. An-sätze aus der Perkolations- und Netzwerktheorie werden verwendet, um die Rigidität und Flexibilität in den Netzwerken während der Entfaltung zu untersuchen. Diese unter dem Begriff der Analyse statischer Netzwerke (constraint network analysis, CNA) zusammengefassten Methoden wurden im ersten Teil dieser Arbeit auf einen Datensatz homologer meso- und thermophiler Proteine angewendet. Dabei wurde untersucht, ob die thermophile Anpassung tatsächlich über eine Rigidisierung der Struktur erfolgt. Außerdem wurde die Theorie der korrespondierenden Zustände getestet, die besagt, dass bei der thermophilen Anpassung trotz globaler Rigidisierung für die Bioaktivität wichtige flexible Bereiche konserviert sind. Mit Hilfe der CNA wurden Entfaltungsregionen der Proteine aus dem Datensatz bestimmt und mit Strukturbereichen verglichen, in die thermostabilisierende Mutationen eingeführt wurden. Außerdem wurde untersucht, inwieweit vorhergesagt werden kann, ob eine möglicherweise thermostabilisierende Mutation die Aktivität negativ beeinflusst. Für zwei Drittel der thermophilen Proteine aus dem Datensatz konnte eine höhere Thermostabilität vorhergesagt werden als für das entsprechende mesophile Protein. Es konnte zudem gezeigt werden, dass die thermophile Anpassung dieser Proteine tatsächlich über eine Rigidisierung der Struktur erfolgt. Offensichtlich werden bei der Anwendung der CNA implizit alle möglichen Mechanismen der thermophilen Anpassung berücksichtigt. Die für zwei Paare meso- und thermophiler Proteine vorhergesagten Entfaltungsregionen stimmten sehr gut mit Bereichen überein, in die thermostabilisierende Mutationen eingeführt wurden. Damit wurde gezeigt, dass die CNA hilfreich zur Unterstützung des Protein Engineering ist, da die thermische Stabilität einer Struktur abgeschätzt werden kann, andererseits Hinweise darauf gegeben werden, in welchen Bereichen der Struktur thermostabilisierende Mutationen eingeführt werden können. Anhand des Vergleichs mikroskopischer Stabilitäten homologer Proteine konnte gezeigt werden, dass die CNA ein Abschätzen des Effekts einer thermostabilisierenden Mutation auf die Aktivität erlaubt, was wiederum für den Einsatz der CNA zur Unterstützung des Protein Engineering spricht. Im zweiten Teil dieser Arbeit wurde die CNA auf eine Serie von Phytasen unterschiedlicher Thermostabilitäten angewendet. Da es sich bei den Phytase-Strukturen um Homologie-modelle handelte, die nicht direkt mit der Analyse statischer Netzwerke untersucht werden konnten, wurde eine ensemblebasierte CNA etabliert. Dazu wurden kurze MD-Simulationen zur Verbesserung der homologiemodellierten Strukturen durchgeführt, aus denen dann ein konformationelles Strukturensemble extrahiert wurde. Aus den konformationellen Ensembles werden Thermostabilitäten vorhergesagt. Bei der Vorhersage der Thermostabilitäten ergab sich eine bemerkenswert gute Übereinstimmung mit experimentell bestimmten relativen Halbwertszeittemperaturen. Bereiche mit hoher Entfaltungsregionwahrscheinlichkeit stimmen gut mit Regionen überein, in denen thermostabilisierende Mutationen experimentell eingeführt wurden. Diese Ergebnisse offenbaren, dass mit der Entwicklung der ensemblebasierten CNA die methodischen Grundlagen für den Einsatz des Verfahrens zur Unterstützung des Protein Engineering von Phytasen geschaffen wurden.
  • A computational method has been developed for simulating the thermal unfolding of proteins. From the unfolding simulation, a melting temperature can be obtained. Thereby, the thermostability of proteins can be predicted. Moreover, the approach allows for identifying structural features from which a destabilization of the structure originates upon thermal unfolding, i.e., unfolding nuclei. The approach is referred to as constraint network analysis (CNA) and is based on a graph-theoretical method that determines rigidity and flexibility within a protein structure in atomic resolution. Thermal unfolding of the protein structure can now be simulated by gradually removing non-covalent bond constraints from the constraint network. The method is applied to a data set of 19 pairs of homologous proteins from meso- and thermophilic organisms. By comparing microscopic stability features of homologues, it is shown that adaptive mutations in enzymes from thermophilic organisms maintain the balance between overall rigidity, important for thermostability, and local flexibility, important for activ-ity, at the appropriate temperature at which the protein functions. Thermophilic adaptation in general leads to an increase of structural rigidity but conserves the distribution of functionally important flexible regions between homologues from meso- and thermophilic organisms. This finding provides direct evidence for the hypothesis of corresponding states. CNA thereby im-plicitly captures and unifies many different mechanisms that contribute to increased thermostability and to activity at high temperatures. Changes in the flexibility of active site regions, induced either by a temperature change or by the introduction of mutations, are related to ex-perimentally observed losses of the enzyme function. From an application point of view, the results demonstrate that exploiting the principle of corresponding states not only allows for successful thermostability optimization but also for guiding experiments in order to improve enzyme activity in protein engineering. CNA is also applied to a data set of phytases. In this case, an ensemble-based approach was pursued in which conformations extracted from a trajectory, which was generated by a mo-lecular dynamics simulation, are individually subjected to CNA. Then, the results from the thermal unfolding simulations are averaged over the whole ensemble. As a further advantage over analyzing a single structure, this approach allows to determine the statistical significance of the results of the CNA. The wildtype phytase of Yersinia mollaretii was used for the identification of unfolding nuclei. Three main unfolding nuclei were identified. At two of the identified unfolding nuclei, saturation mutagenesis was performed, and the thermal stability of a mutant enzyme was determined. The results demonstrate as a proof of concept that mutations.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Sebastian Radestock
URN:urn:nbn:de:hebis:30-89243
Referee:Holger Gohlke
Document Type:Doctoral Thesis
Language:German
Date of Publication (online):2011/02/04
Year of first Publication:2010
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2010/11/22
Release Date:2011/02/04
Tag:Rigiditätstheorie; Thermostabilität
Computer simulation; Enzyme; Flexibility; Network; Protein engineering; Rigidity; Rigidity theory; Thermostability
GND Keyword:Temperaturbeständigkeit; Flexibilität; Rigidität; Computersimulation; Enzym; Proteindesign; Netzwerk
HeBIS-PPN:23083096X
Institutes:Biowissenschaften / Biowissenschaften
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 57 Biowissenschaften; Biologie / 570 Biowissenschaften; Biologie
Licence (German):License LogoDeutsches Urheberrecht