Doctoral Thesis
Refine
Year of publication
Document Type
- Doctoral Thesis (282) (remove)
Language
- English (282) (remove)
Has Fulltext
- yes (282)
Is part of the Bibliography
- no (282)
Keywords
- Membranproteine (6)
- NMR-Spektroskopie (5)
- RNA (4)
- ABC-Transporter (3)
- Biochemie (3)
- Crystallography (3)
- Kristallographie (3)
- Photosynthese (3)
- Proteinfaltung (3)
- Biochemistry (2)
Institute
- Biochemie und Chemie (282) (remove)
Human epidermal-type fatty acid binding protein (E-FABP) belongs to a family of intracellular non-enzymatic 14-15 kDa lipid binding proteins (LBP) that specifically bind and facilitate the transport of fatty acids, bile acids or retinoids. Their functions have also been associated with fatty acid signalling, cell growth, regulation and differentiation. As a contribution to better understand the structure-function relationship of this protein, the features of its solution structure determined by NMR spectroscopy are reported here. Both unlabeled and 15N-enriched samples of recombinant human E-FABP were used for multidimensional high-resolution NMR. The sequential backbone as well as side-chain resonance assignments have been completed. They are reported here and are also available at the BioMagResBank under the accession number BMRB-5083. The presence of six cysteines in the amino acid sequence of human E-FABP is highly unusual for LBPs. Four of the six cysteines are unique to the E-FABPs: C43, C47, C67 and C87. In the three-dimensional structure of E-FABP, two cysteine pairs (C67/C87 and C120/C127) were identified by X-ray analysis to be close enough to allow disulfide bridge formation, but a S-S bond was actually found only between C120 and C127 [Hohoff et al., 1999]. Since the exclusion of a disulfide bridge between C67 and C87 improved the Rfree factor of the crystallographic model, the existence of a covalent bond between these two side- chains was considered unlikely. This agrees with the NMR data, where SCH resonances have been observed for the cysteine residues C43, C67 (tentative assignment) and C87, thus excluding the possibility of a second disulfide bridge in solution. Based on the NOE and hydrogen exchange data, an ensemble of 20 energy-minimized conformers representing the solution structure of human E-FABP complexed with stearic acid has been obtained. The analysis of homonuclear 2D NOESY and 15N-edited 3D NOESY spectra led to a total of 2926 NOE-derived distance constraints. Furthermore, 37 slow- exchanging backbone amide protons were identified to be part of the hydrogen-bonding network in the >-sheet and subsequently converted into 74 additional distance constraints. Finally, the disulfide bridge between C120 and C127 was defined by 3 upper and 3 lower distance bounds. The structure calculation program DYANA regarded 998 of these constraints as irrelevant, i.e., they did not restrict the distance between two protons. Out of the remaining 2008 non-trivial distance constraints, 371 were intraresidual (i = j), 508 sequential (|i - j| = 1), 233 medium-range (1 < |i - j| £ 4), and 896 long-range (|i - j| > 4) NOEs. The protein mainly consists of 10 antiparallel -strands forming a >-barrel structure with a large internal cavity. The three-dimensional solution structure of human E-FABP has been determined with a root-mean-square deviation of 0.92 ± 0.11 Å and 1.46 ± 0.10 Å for the backbone and heavy atoms, respectively, excluding the terminal residues. Without the portal region (i.e., for residues 4-26, 40-56, 63-75 and 83-134; the portal region apparently represents the only opening in the protein surface through which the fatty acid ligand can enter and exit the internal binding cavity), an average backbone RMSD of 0.85 ± 0.10 Å was obtained, thus reflecting the higher conformational dispersion in the portal region. Superposition with the X-ray structure of human E-FABP (excluding the terminal residues) yielded average backbone RMSD values of 1.00 ± 0.07 Å for the entire residue range and 0.98 ± 0.06 Å without the portal region. This indicates a close similarity of the crystallographic and the solution structures. The structure coordinates have been deposited at the RCSB data bank under PDB ID code 1JJJ. The measurement of 15N relaxation experiments (T1, T2 and heteronuclear NOE) at three different fields (500, 600 and 800 MHz) provided information on the internal dynamics of the protein backbone. Nearly all non-terminal backbone amide groups showed order parameters S2 > 0.8, with an average value of 0.88 ± 0.04, suggesting a uniformly low backbone mobility in the nanosecond-to-picosecond time range throughout the entire protein sequence. Moreover, hydrogen/deuterium exchange experiments indicated a direct correlation between the stability of the hydrogen-bonding network in the >-sheet structure and the conformational exchange (Rex) in the millisecond-to-microsecond time range. The features of E-FABP backbone dynamics elaborated here differ from those of the phylogenetically closely related heart-type FABP and the more distantly related ileal lipid binding protein. The results on protein dynamics obtained in this work allow to conclude that the different LBP family members E-FABP, H-FABP and ILBP are characterized by varying stabilities in the protein backbone structures. Hydrogen/deuterium exchange experiments displayed significant differences in the chemical exchange with the solvent for the backbone amide protons belonging to the hydrogen-bonding network in the >-sheets. The >-barrel structure of H- FABP appears to be the most rigid, with exchange processes presumably slower than the millisecond-to-microsecond time range. ILBP, on the other hand, shows the fastest hydrogen exchange as well as a significant number of exchange parameters (Rex), implying a decreased stability in the >-sheet structure. E-FABP, finally, appears to rank between these two proteins based on the hydrogen/deuterium exchange, with Rex terms in the >-strands indicating millisecond-to-microsecond exchange processes like in ILBP.
In der vorliegenden Arbeit werden Verfahren der Mathematik und Informatik entwickelt und eingesetzt, um Struktur, Dynamik und biologische Aktivität aus NMR spektroskopischen und empirischen Parametern zu bestimmen. Dolastatin 10 und Epothilon A sind potentielle Wirkstoffe gegen Krebs, da sie durch Wechselwirkung mit Tubulin die Zellteilung unterbinden. Die 3D Struktur beider Wirkstoffe in Lösung und die Struktur von an Tubulin gebundenem Epothilon A wird aus NMR spektroskopischen Parametern bestimmt. Dolastatin 10 liegt in einem konformationellen Gleichgewicht zwischen der cis -- und trans -- Konformation in der ungewöhnlichen Aminosäure DAP vor. Beide Konformationen des flexiblen Pentapeptids können bestimmt werden mit RMSD = 1.423 Å für das cis -- Konformer und RMSD = 1.488 Å für das trans -- Konformer. Während das trans -- Konformer gestreckt vorliegt, faltet das cis -- Konformer am DAP zurück. Epothilone A ist durch einen Makrozyklus weniger flexibel und sowohl die an Tubulin gebundene Struktur (RMSD = 0.537 Å) als auch freie Form (RMSD = 0.497 Å) kann mit geringen RMSD -- Werten bestimmt werden. Die Struktur der freien Form, welche in Lösung hauptsächlich vorliegt, ist mit der Röntgenstruktur weitgehend identisch. In der an Tubulin gebundenen Form wird eine essentielle Umorientierung der Seitenkette beobachtet, die für die Wechselwirkung mit Tubulin entscheidend ist. Dipolare Kopplungen eines Proteins sind geeignet, eine 3D Homologiesuche in der PDB durchzuführen, da die relative Orientierung von Sekundärstrukturelementen und Domänen durch sie beschrieben wird 85 . Die frühe Erkennung 3D homologer Proteinfaltungen eröffnet die Möglichkeit, die Bestimmung von Proteinstrukturen zu beschleunigen. Eine Homolgiesuche unter Nutzung dipolarer Kopplungen ist in der Lage, Proteine oder zumindest Fragmente mit ähnlicher 3D Struktur zu finden, auch wenn die Primärsequenzhomologie gering ist. Darüber hinaus wird eine Transformation für experimentelle dipolare Kopplungen entwickelt, die die indirekte Orientierungsinformation eines Vektors relativ zu einem externen Tensor in den möglichen Bereich für den Projektionswinkel zwischen zwei Vektoren und somit in eine intramolekulare Strukturinformation übersetzt. Diese Einschränkungen können in der Strukturbestimmung von Proteinen mittels Molekulardynamik genutzt werden 92 . Im Gegensatz zu allen existierenden Implementierungen wird die Konvergenz der Rechnung durch die auf diese Weise eingeführten dipolare Kopplungsinformation kaum beeinflusst. Die dipolaren Kopplungen werden trotzdem von den errechneten Strukturen erfüllt. Auch ohne die Nutzung bereits bekannter Protein oder Fragmentstrukturen kann so ein erheblicher Teil der NOE -- Information substituiert werden. Die Dynamik des Vektors, der die beiden wechselwirkenden Dipole verbindet, beeinflusst den Messwert der dipolaren Kopplung. Dadurch wird Information über die Dynamik von Molekülen auf der µsZeitskala zugänglich, die bisher nur schwer untersucht werden konnte. Die Messung dipolarer Kopplungen für einen Vektor in verschiedenen Orientierungen erlaubt die Analyse seiner Bewegung 89 . Im besonderen ist die Ableitung eines modellfreien Ordnungsparameters 2 S möglich. Weiterhin lassen sich ebenso modellfrei eine mittlere Orientierung des Vektors, axialsymmetrische Anteile und nichtaxialsymmetrische Anteile der Dynamik ableiten und auswerten. Die Anwendung der so entwickelten Protokolle auf experimentelle Daten 90 lässt Proteine deutlich dynamischer erscheinen als auf der Zeitskala der Relaxationsexperimente zu erkennen ist. Der mittlere Ordnungsparameter sinkt von 0.8 auf 0.6. Dies entspricht einer Erhöhung des Öffnungswinkels der Bewegung von ca. 22 ° auf ca. 33°. Die Bewegungen weichen teilweise bis zu 40% und im Mittel 15% von der Axialsymmetrie ab. Neuronale Netze erlauben eine schnelle (ca. 5000 chemische Verschiebungen pro Sekunde) und exakte (mittleren Abweichung von 1.6 ppm) Berechnung der 13 C NMR chemischen Verschiebung 115 . Dabei kombinieren sie die Vorteile bisher bekannter Datenbankabschätzungen (hohe Genauigkeit) und Inkrementverfahren (hohe Geschwindigkeit). Das 13 C NMR Spektrum einer organischen Verbindung stellt eine detaillierte Beschreibung seiner Struktur dar. Resultate des Strukturgenerators COCON können durch den Vergleich des experimentellen mit den berechneten 13 C NMR Spektren auf ca. 1 o/oo der vorgeschlagenen Strukturen eingeschränkt werden, die eine geringe Abweichung zum experimentellen Spektrum haben 122 . Die Kombination mit einer Substrukturanalyse erlaubt weiterhin die Erkennung wahrscheinlicher, geschlossener Ringsysteme und gibt einen Überblick über die Struktur des generierten Konstitutionssubraumes. Genetische Algorithmen können die Struktur organischer Moleküle ausgehend von derer Summenformel auf eine Übereinstimmung mit dem experimentellen 13 C NMR Spektrum optimieren. Die Konstitution von Molekülen wird dafür durch einen Vektor der Bindungszustände zwischen allen Atom -- Atom Paaren beschrieben. Selbige Vektoren sind geeignet, in einem genetischen Algorithmus als genetischer Code von Konstitutionen betrachtet zu werden. Diese Methode erlaubt die automatisierte Bestimmung der Konstitution von Molekülen mit 10 bis 20 Nichtwasserstoffatomen 123 . Symmetrische neuronale Netze können fünf bzw. sieben dimensionale, heterogene Parameterrepräsentationen der 20 proteinogenen Aminosäuren unter Erhalt der wesentlichen Information in den dreidimensionalen Raum projizieren 134 . Die niederdimensionalen Projektionen ermöglichen eine Visualisierung der Beziehungen der Aminosäuren untereinander. Die reduzierten Parameterrepräsentationen sind geeignet, als Eingabe für ein neuronales Netz zu dienen, welches die Sekundärstruktur eines Proteins mit einer Genauigkeit von 66 % im Q 3 -- Wert berechnet. Neuronale Netzte sind aufgrund ihrer flexiblen Struktur besonders geeignet, quantitative Beziehungen zwischen Struktur und Aktivität zu beschreiben, da hier hochgradig nichtlineare, komplexe Zusammenhänge vorliegen. Eine numerische Codierung der über 200 in der Literatur beschriebenen Epothilonderivate erlaubt es, Modelle zur Berechnung der Induktion der Tubulin Polymerisation (R = 0.73) und der Inhibierung des Krebszellenwachstums (R = 0.94) zu erstellen 136 . Die trainierten neuronalen Netze können in einer Sensitivitätsanalyse genutzt werden, um die Bindungsstellen des Moleküls zu identifizieren. Aus der Berechnung der Aktivität für alle Moleküle des durch die Parameter definierten Strukturraums ergeben sich Vorschläge für Epothilonderivate, die bis zu 1 000 mal aktiver als die bisher synthetisierten sein könnten.