Method establishment for the analysis of complex biological samples using nLC-MALDI MS/MS

Methoden-Entwicklung für die Analyse von komplexen biologischen Proben mittels nLC-MALDI MS/MS

  • Top-down and bottom-up approaches are the general methods used to analyse proteomic samples today, however, the bottom-up approach has been dominant in the last decade. Establishing a bottom-up method involves not only the choice of adequate instruments and the optimisation of the experimental parameters, but also choosing the right experimental conditions and sample preparation steps. LC-ESI MS/MS has widely been used in this field due to its advanced automation. The primary objective of the present study was to establish a sensitive high-throughput nLC-MALDI MS/MS method for the identification and characterisation of proteins in biological samples. The method establishment included optimisation and validation of parameters such as the capillaries in the HPLC systems, gradient slopes, column temperature, spotting frequencies or the MS and MS/MS acquisition methods. The optimisation was performed using two HPLC-systems (Agilent 1100 series and Proxeon Easy nLC system), three spotters and the 4800 MALDI-TOF/TOF analyzer. Furthermore, samples preparation protocols were modified to fit to the established nLCMALDI- TOF/TOF-platform. The potentials of this method was demonstrated by the successful analysis of complex protein samples isolated from lipid particles, pre-adipocytes/adipocytes tissues, membrane proteins and proteins pulled-down from protein-proteins interaction studies. Despite the small amount of proteins in the lipid particles or oil bodies, and the challenges encountered in studying such proteins, 41(6 novel + 14 mammal specific + 21 visceral specific) proteins were added to the already existing proteins of the secretome of human subcutaneous (pre)adipocytes and 6 novel proteins localised in the yeast lipid particles. Protein-protein interaction studies present another area of application. Here the analytical challenges are mostly due to the loss of binding partner upon sample clean-up and to differentiate from non-specific background. Novel interaction partners for AF4•MLL and AF4 protein complex were identified. Furthermore, a novel sample protocol for the analysis of membrane proteins, based on the less specific protease, elastase, was established. Compared to trypsin, a higher sequence coverage and higher coverage of the transmembrane domains were achieved. The use of this enzyme in proteomics has been limited because of its non specific cleavage. However, from the results obtained in these studies, elastase was found to cleave preferentially at the C-terminal site of the amino acids AVLIST. The advantage of the established protocol over conventional protocols is that the same enzyme can be used for shaving of the soluble dormains of intact proteins in membranes and the digestion of the hydrophobic domain after solubilisation. Furthermore, the solvents used are compatible with the nLC-MALDI method setup. In addition, it was also shown that for less specific enzymes, a higher mass accuracy is required to reduce the rate of false positive identifications, since current search engines are not perfectly adapted for these types of enzymes. A brief statistical analysis of the MS/MS data obtained from the LC-MALDI TOF/TOF system showed that for less specific enzymes, under high-energy collision conditions, approximately 43 % of the fragment ions could not be matched to the known y- b type ions and their resultant internal fragments. This limitation greatly influenced the search results. However, this limitation can be overcome by modifying the N-terminal amino acids with basic moieties such as TMT. The use of elastase as a digestion enzyme in proteomic workflow further increased the complexity of the sample. Therefore, orthogonal multidimensional separation was necessary. Offgel-IEF was used as the separation technique for the first dimension. Here peptides are separated according to the pI. However, the acquired samples could not be loaded to the nLC due to the high viscosity of the concentrated samples when using the standard protocol. In order to achieve compatibility of the Offgel-IEF to the nLC-MALDI-TOF/TOF-platform, the separation protocol of the Offgel-IEF was modified by omitting the glycerol, which was the cause of the viscous solution. The novel glycerol free protocol is advantageous over the conventional method because the samples could directly be picked-up and loaded onto the pre-column without resulting in an increase in back pressure or a subsequent pre-column clogging. The glycerol free protocol was then assessed using purple membrane and membrane fraction of C. glutamicum. The results obtained were comparable to those applied in published reports. Therefore, the absence of glycerol did not affect the separation efficiency of the Offgel-IEF. In addition the applicability of elastase and the glycerol free Offgel-IEF for quantitation of membrane proteins was assessed. Most of the unique peptides identified were in the acidic region and 85 % were focused only into one fraction and approximately 95 % in only two fractions. These results are in accordance with previously published results (Lengqvist et al., 2007). When compared with theoretical digests of the proteins identified in this study, it can be concluded that basic moiety (TMT) on the peptide backbone, did not affect the separation efficiency of the Offgel-IEF. In an applied study, changes in the protein content of yeast strain grown in two different media were relatively quantified. For example, prominent proteins, such as the hexose tranporter proteins responsible for transporting glucose accross the membrane, were successfully quantified. Last but not least, the nLC-MALDI-TOF/TOF platform also served as a basis for the development of a high-throughput method for the identification of protein phosphorylation. The establishment of such a method using MALDI has been challenging due to the lack of sensitive matrices, such as CHCA for non-modified peptides, which exhibit a homogenous crystallisation and thus yield stable signal intensity over a long period of time in an automated setup. The first step of this method was the establishment of a matrix/matrix mixture with better crystal morphology and higher analyte signal intensity than the matrix of choice, i.e. DHB. From MS and MS/MS measurements of standard phosphopeptides, a combination of FCCA and CHAC in a 3:1 ratio and 3 mM NH4H2PO4 facilitated high analyte signal intensities and good fragmentation behaviour. Combining a custom-packed biphasic column for the enrichment of phosphopeptides, the applicability of the matrix mixture was assessed in anautomated phosphopeptide analysis using standard phosphopeptides spiked to a 20-fold excess BSA digest. These analyses showed that this method is reproducibile and both flow throughs can be analysed. Applying the method to the analysis of 2 standard phosphoproteins, alpha/beta-casein, and a leukemia related protein, ENL, 13 phosphopeptides from both alpha/beta-Casein and 13 phosphopeptides with 6 phosphorylation sites from the ENL were identified. As a general conclusion, it can be stated that the nLC-MALDI-TOF/TOF method established here in various modifications for different analytical purposes is a robust platform for proteomic analyses.
  • Der Begriff Proteom wurde 1994 vom Australier Marc R. Wilkins in Anlehnung an die Begriffe Genom und Transkriptom beschrieben. Später wurde das Gebiet der Proteomicsdurch Patterson & Aebersold als "systematische Erforschung der zahlreichen undunterschiedlichsten Eigenschaften von Proteinen in paralleler Weise mit der Zielsetzung einerdetaillierten Beschreibung der Struktur, Funktion und Steuerung biologischer Systeme imgesunden und krankhaften Zustand" definiert (Patterson et al., 2003). Somit nimmt diesesThemengebiet eine wichtige Position in der Biologie ein und übt einen erheblichen Einflussauf verwandte Bereiche der Biowissenschaften aus. Mit Hilfe der Massenspektrometrie undder weichen Ionisierungstechniken Matrix-unterstützte Laser-Desorption/Ionisation (engl. Matrix assisted laser desorption/ ionization,MALDI) und Elektrospray ionization (ESI) war die Ausbreitung dieses Forschungsgebiets in vielen Laboratorien nicht mehr aufzuhalten. Für die massenspektrometrische Bestimmung von Proteinen werden meist zwei Identifizierungswege – Top-down und Bottom-up – verwendet. Beim Top-down-Verfahrenwerden die getrennten Proteine direkt gemessen, während beim Bottom-up-Verfahren die Proteine zuvor entweder enzymatisch oder chemisch gespalten und die so entstandenen Peptide analysiert werden. Letzteres wird häufiger für Proteomics-Experimente angewandt, da mehrere Proteine nebeneinander bestimmt werden können. Trotz dessen ist die “Large-Scale“- Proteomanalyse von komplexen biologischen Proben in vielerlei Hinsicht erschwert, da eine hohe Massengenauigkeit, Trennleistung bei den LC-Läufen und hochauflösende Massenspektrometrie erforderlich ist. Diese Arbeit befasst sich mit der Etablierung einer nLC-MALDI-TOF/TOF Methode, basierend auf reversed phase-Chromatographie, zur Identifizierung von Proteinen aus komplexen biologischen Proben. Dabei wurde die Probe an zwei nanoLC-Anlagen, die jeweils mit einem automatischen Spotter versehen waren, getrennt. Die anschließende massenspektrometrische Messung fand an einem MALDI-TOF/TOF Gerät statt. Zuerst wurde die Methode mit Hilfe von Standardpeptiden und Standardproteinen optimiert. Dabei wurde u.a. untersucht, welchen Einfluss verschiedene Parameter, wie der Fließmittelgradient, die Säulentemperatur oder die verwendete Matrixkonzentration auf die Trennung und anschließende Identifizierung haben. Aufgrund der großen Anzahl von Spektren, die bei Bottom-up-Proteomic generiert werden, ist eine manuelle Interpretation nicht möglich. Aus diesem Grund ist eine hohe Qualität der Spektren notwendig, um die richtige Peptidsequenz zu identifizieren. Daher wurde neben der chromatographischen Trennung auch die massenspektrometrische Methode optimiert. Es zeigte sich, dass die besten MS/MS-Ergebnisse mit 1 kV Fragmentierungsmethode erzeugt wurden. Während der Optimierung wurde außerdem festgestellt, dass Matrixkonzentrationen (alpha- cyano-4-hydroxyzimtsäure) über 3,5 mg/ml zu einer Peak-Verbreiterung führten. Vermutlich kommt es aufgrund der Kristallbildung an der Nadelspitze des Spotter zu Verschleppungen des Analyten und dadurch zu der Peak-Verbreiterung. Um die optimale Säulentemperatur zu bestimmen, wurde die Trennung bei 25, 30, 40 und 60 °C durchgeführt. Die erhöhte Säulentemperatur führte zu einer Druckverminderung während der LC-Trennung. Durch die Verringerung des Drucks ist der Einsatz von längeren Trennsäulen oder höheren Flussraten möglich. Ferner zeigte sich, dass bei 40°C Säulentemperatur die beste Auftrennung und damit verbunden deutlich mehr Peptide identifiziert werden konnten. Bei 60 °C nahm die Menge der identifizierten Peptide als Folge des Abbaus von Säulenmaterial ab. Nach der Optimierung wurde die Robustheit der Methode und nLC-Anlage durch Analyse verschiedener biologischer Proben überprüft. Dabei wurden Proteine aus Saccharomyces-Lipidpartikeln und aus humanen Adipocyten untersucht. Die Herausforderung für die Analytik dieser Proben war zum einen die niedrige Proteinkonzentration und zum anderen der hohe Lipidanteil der Partikel (> 90 %), der nach dem Verdau anfangs zu einem Verstopfen der Vorsäule führte. Um eine Analyse der Proben mittels nLC zu ermöglichen, mussten daher die Lipide zuvor mit Diethylether extrahiert werden. Dank der verbesserten Methode konnten neben bereits bekannten jeweils sechs neue Proteine identifiziert werden. Insgesamt wurden 41 Proteine aus humanen subkutanen Steatoblasten, bzw. Adipozyten identifiziert, davon neben den sechs neuen Proteinen, 14 säugetierspezifische und 21 viszeral-spezifische Proteine. Weiterhin wurde die Methode zur Analytik von Proteinkomplexen verwendet. Die Untersuchung von Protein-Protein-Wechselwirkung gibt Aufschlüsse über Zellmechanismen und über das Entstehen bestimmter Krankheiten, wie etwa Leukämien, woraus sich Therapieansätze und -maßnahmen ableiten lassen. Das mixed-lineage leukemia (MLL-Gen) auf Chromosom 11 Bande q23 ist in zahlreiche, reziproke chromosomale Translokationen verwickelt. Bei der akuten Leukämie t(4;11), häufig anzutreffen bei Säuglingen und Kleinkindern, sind das MLL-Gen auf Chromosom 11 und das AF4-Gen auf Chromosom 4 beteiligt. Durch die Translokation entstehen zwei neue Derivatchromosomen – (MLL•AF4) und (AF4•MLL). Chromosomale Translokationen des MLL-Gens werden auf Grund ihrer sehr schlechten Prognose und Therapierbarkeit als Hochrisiko-Leukämien eingestuft. Bis heute konnten 64 Translokations-Partnergene identifiziert werden, wobei das AF4-Gen mit 42 % bei allen untersuchten Leukämien und mit ca. 66 % bei der akuten lymphatischen Leukämie (ALL) den größten Prozentsatz ausmacht. Dabei war das Ziel dieser Anwendung die Identifizierung neuer Interaktionspartner mit den Fusionsproteinen MLL•AF4 und AF4•MLL. Hierfür wurden die Strep-Elutionen von AF4, AF4•MLL, ENL und die Negativkontrolle in Lösung verdaut, getrennt und analysiert. Insgesamt wurden 17 bekannte Interaktionspartner, deren Funktion und Rolle in der Leukämogenese eindeutig in zahlreichen Studien nachgewiesen ist, aus AF4- und AF4•MLLKomplexen identifiziert; daneben auch neue Fusionsproteine des AF4-Proteins (DDX6, NPM1, NFkB, BRD4, CARM1, NSD1) und des AF4•MLL-Fusionsprotein-Komplexes (DDX6, NPM1, NFkB, HEXIM1, CARM1, DOT1L). Leider konnten bei der ENL keine Fusionsproteine von bekannten Interaktionspartnern nachgewiesen werden. Trotz der Identifizierung bekannter und neuer Interaktionspartner aus den AF4- und AF4•MLL- Proteinkomplexen gibt es weitere Herausforderungen, wie bei der Zellzucht oder der Probenvorbereitung zu bewältigen. Viele Interaktionen von Proteinen sind leider nicht von Dauer, oder die Interaktionspartner sind in zu geringen Mengen vorhanden, sodass die Analyse schwierig ist. Als weiterer Anwendungsbereich wurde die nLC-MALDI-TOF/TOF-Methode zur Identifizierung von Membranproteinen verwendet. Membranproteine sind aufgrund ihrer hydrophoben Eigenschaften in wässrigen Puffersystemen schlecht löslich und somit im Vergleich zu hydrophilen Proteinen analytisch schwer zugänglich. Weiterhin besitzen sie weniger tryptische Schnittstellen, weshalb die Verwendung von Trypsin zur Hydrolyse der Proteine nur zu mäßigen Ergebnissen führt. Weniger spezifische Enzyme bilden überlappende Fragmentcluster, da sie Proteine an mehr Aminosäuren als Trypsin spalten. Wegen seiner unspezifischen Spaltung ist die Verwendung von Elastase im Bereich Proteomik bisher eingeschränkt. Es stellte sich allerdings heraus, dass nach dem Verdau von Membranproteinen aus Halobacterium salinarium und Corynebacterium glutamicum eine, im Vergleich zu Trypsin, höhere Sequenzabdeckung des gesamten Proteins sowie der Transmembrandomänen erreicht wurde. Insgesamt konnten bei der Analyse der Membranfraktion 379 Proteine identifiziert werden. Davon waren 44 % integrale Membranproteine. Zum Vergleich wurde mit Trypsinverdau lediglich weniger als 44 % integrale Membranproteine identifiziert Diese Ergebnisse zeigen, dass der Einsatz von weniger spezifischen Enzymen bei Membranproteinen zu einer höheren Sequenzabdeckung führen kann. Ein Problem, das sich nach dem Verdau mit Elastase stellte, war die Auswertung der erzeugten MS/MS-Daten. Etwa 43 % der Fragmentionen gehörten nicht zu den bekannten y- oder b-Ionen und konnten daher nicht den internen Fragmenten zugeordnet werden. Ein Grund dafür ist vermutlich die fehlende Lokalisierung der positiven Ladung an den C und N- termini der entstandenen Peptide. Eine Erhöhung der internen Fragmentionenbildung führte zu Schwierigkeiten bei der Interpretation der Spektren. Die Fragmentierung konnte wiederum durch Derivatisierung mit einem basischen Rest (z.B. TMT) verbessert werden. Durch Verwendung von TMT konnten mehr als 50 % der Fragmentionen wieder zugeordnet werden (Bäumlisberger et al., 2010). Selbst die verbesserte Trennleistung der entwickelten nLC-Methode war für sehr komplexe biologische Proben, wie z.B. Zelllysate, nicht ausreichend. Diese Problematik wurde durch Kombination mit der Offgel-IEF-Trennung verbessert. Diese Technik trennt die Proteine/Peptide der komplexen Probe anhand des isoelektrischen Punkt in verschiedene Fraktionen auf. Die erhaltenen Fraktionen wurden anschließend einzeln auf der nLC getrennt. Nach Optimierung des Methodenprotokolls war es möglich die vorfraktionierten Proben mittels nLC weiter aufzutrennen und anschließend mittels MALDI-TOF/TOF zu identifizieren. Es zeigte sich, dass durch die optimierte Offgel-IEF Methode ca. 90-95 % aller Peptide in einer oder zwei Fraktionen vorlagen. Ferner wurde überprüft, ob die optimierte Methode für eine relative Quantifizierungstechnik geeignet ist. Hierfür wurden mit TMT markierte Peptide mittels IEF und anschließend nLC getrennt. Bei der Überprüfung der Trennleistung wurde kein negativer Einfluss des basischen TMT auf die Trennung festgestellt. Auch mit TMT lagen 95 % der identifizierten Peptide in nur einer oder zwei Fraktionen vor. Generell induziert TMT eine geringe Verschiebung des isoelektrischen Punktes, der bei Verwendung von IPG-Streifen mit großen pH-Bereich (pH 3- 10) aber vernachlässigbar ist. Trotz der effizienten Trennung, ist die Fokussierung im Bereich von neutralen und alkalischen pI´s bei Weitem noch nicht optimal. Dies ist durch die allgemein schlechtere Fokussierung von neutralen Peptiden zu erklären, da aliphatische Peptide ohne polare Seitenketten im pH-Intervall zwischen 2,4 und 9,6 keine Nettoladung aufweisen. Vorgeschlagene Strategien zur Verbesserung der Trennleistung sind durch die verwendeten Zusätze wie Sorbit oder Methylcellulose leider nicht mit der nLC kompatibel. Der letzte Teil dieser Arbeit befasst sich mit der Etablierung einer automatisierten Methode zur Identifizierung und Charakterisierung von Phosphopeptiden. Die Analyse von phosphorylierten Aminosäuren gestaltet sich trotz ständiger instrumenteller Verbesserungen immer noch als schwierig. Dies liegt vor allem daran, dass in der Regel nur ein geringer Prozentsatz eines potentiellen Phosphoproteins tatsächlich phosphoryliert vorliegt und zudem noch reversibel modifiziert ist. Die Identifizierung und Charakterisierung von Phosphopeptiden wird meistens mittels ESI-MS durchgeführt. Der Grund dafür sind unter anderem die fortgeschrittenen Fragmentierungstechniken, wie z.B. der Einsatz der Elektronentransferdissoziation (ETD). Des Weiteren ermöglicht die direkte Kopplung mit der HPLC eine schnelle Identifizierung von komplexen Proteingemischen. MALDI hingegen wird meistens nur für manuelle Messungen von nicht komplexen Proben verwendet. Die üblicherweise für Phosphopeptidanalysen verwendete MALDI-Matrix DHB weist eine geringe Analytensensivität und eine inhomogene Kristallisation auf. Dies macht eine automatische Messung nahezu unmöglich. Zuerst musste eine für die Phosphopeptidanalysen besser geeignete Matrix gefunden werden. Dazu wurden vier verschiedene Matrizes (4-Chlor-alpha-cyano-zimtsäure [ClCCA], 4-Hydroxy- alpha-cyano-zimtsäure [CHCA], 2,5-Dihydroxybenzoesäure [DHB] und Di-2,4-Difluor-alpha-cyanozimtsäure [diFCCA]), sowie Mischungen daraus getestet. Die besten Ergebnisse wurden durch Verwendung eines 3:1-Gemisches aus diFCCA und CHCA mit 3 mM NH4H2PO4- Lösung erzielt. Neben der Optimierung der Matrix und Probenpräparation wurde eine Anreicherung und Trennung der Phosphopeptide mittels einer 2-phasigen Vorsäule (TiO2/C18) erzielt. Bei pH < 4 bleiben die Phosphopeptide auf dem TiO2 Material und die nicht phosphorylierten Peptide auf dem C18 Material haften. Danach konnten die nicht phosphorylierten Peptide mit einem steigenden ACN/0,1 % TFA-Gradient getrennt werden, während die phosphorylierten Peptide auf die TiO2-material haften blieben. Durch Änderung des pH-Wertes mittels Ammoniumhydrogencarbonat (pH 10) wurden die Phosphospeptide in den C18-Teil der Vorsäule eluiert und konnten dann mit einem weiteren LC-Lauf aufgetrennt werden. Mit dieser Methode können Phosphopeptide einer Probe separat von den nicht phosphorylierten Peptiden analysiert werden. Dies bewirkt bei der anschließenden massenspektrometrischen Detektion eine deutlich einfachere Identifizierung der Peptide. Der Vorteil ist, dass die Reproduzierbarkeit durch die Automatisierung steigt und die Vorsäule mehrmals verwendet werden kann. Die Methode wurde erfolgreich sowohl mit Standardphosphoproteinen, als auch mit ENL-Proteinkomplexen validiert. Abschließend lässt sich sagen, dass die massenspektrometrische Identifikation und Charakterisierung von PTMs immer noch eine außerordentlich schwierige Aufgabe darstellt, da das standardmäßige Erreichen von 100 % Sequenzabdeckung bis jetzt noch nicht möglich ist. Diese Arbeit zeigt, dass durch Verwendung der nLC auch in Kombination mit anderen Trennverfahren, eine erheblichen Verbesserung der Identifizierung der Identifizierung von Proteine mittels MALDI-TOF/TOF erreicht werden konnte.

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Tabiwang Ndipanquang Arrey
URN:urn:nbn:de:hebis:30-93009
Referee:Michael KarasGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2011/03/22
Year of first Publication:2010
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2011/02/17
Release Date:2011/03/22
Tag:Chromatography; Electrospray ionisation (ESI); Matrix assisted laser desorption/ionisation (MALDI); Proteomics
GND Keyword:Matrix-unterstützte Laser-Desorption (MALDI); Elektrospray-Ionisation (ESI)
HeBIS-PPN:233093923
Institutes:Biochemie, Chemie und Pharmazie / Pharmazie
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 54 Chemie / 540 Chemie und zugeordnete Wissenschaften
PACS-Classification:80.00.00 INTERDISCIPLINARY PHYSICS AND RELATED AREAS OF SCIENCE AND TECHNOLOGY / 82.00.00 Physical chemistry and chemical physics; Electronic structure theory of atoms and molecules, see 31.15.-p; Electronic structure theory of condensed matter, see section 71; Electronic structure theory for biomolecules, see 87.10.-e; Electronic structure of / 82.80.-d Chemical analysis and related physical methods of analysis (for related instrumentation, see section 07; for spectroscopic techniques in biological physics, see 87.64.-t) / 82.80.Bg Chromatography
80.00.00 INTERDISCIPLINARY PHYSICS AND RELATED AREAS OF SCIENCE AND TECHNOLOGY / 82.00.00 Physical chemistry and chemical physics; Electronic structure theory of atoms and molecules, see 31.15.-p; Electronic structure theory of condensed matter, see section 71; Electronic structure theory for biomolecules, see 87.10.-e; Electronic structure of / 82.80.-d Chemical analysis and related physical methods of analysis (for related instrumentation, see section 07; for spectroscopic techniques in biological physics, see 87.64.-t) / 82.80.Rt Time of flight mass spectrometry
80.00.00 INTERDISCIPLINARY PHYSICS AND RELATED AREAS OF SCIENCE AND TECHNOLOGY / 87.00.00 Biological and medical physics / 87.18.-h Biological complexity (see also 82.39.Rt Reactions in complex biological systems in physical chemistry) / 87.18.Xr Proteomics
Sammlungen:Universitätspublikationen
Licence (German):License LogoDeutsches Urheberrecht