Computational studies on RNA processing in higher eukaryotes

  • Most cellular processes are regulated by RNA-binding proteins (RBPs). These RBPs usually use defined binding sites to recognize and directly interact with their target RNA molecule. Individual-nucleotide resolution UV crosslinking and immunoprecipitation (iCLIP) experiments are an important tool to de- scribe such interactions in cell cultures in-vivo. This experimental protocol yields millions of individual sequencing reads from which the binding spec- trum of the RBP under study can be deduced. In this PhD thesis I studied how RNA processing is driven from RBP binding by analyzing iCLIP-derived sequencing datasets. First, I described a complete data analysis pipeline to detect RBP binding sites from iCLIP sequencing reads. This workflow covers all essential process- ing steps, from the first quality control to the final annotation of binding sites. I described the accurate integration of biological iCLIP replicates to boost the initial peak calling step while ensuring high specificity through replicate re- producibility analysis. Further I proposed a routine to level binding site width to streamline downstream analysis processes. This was exemplified in the re- analysis of the binding spectrum of the U2 small nuclear RNA auxiliary factor 2 (U2AF2, U2AF65). I recaptured the known dominance of U2AF65 to bind to intronic sequences of protein-coding genes, where it likely recognizes the polypyrimidine tract as part of the core spliceosome machinery. In the second part of my thesis, I analyzed the binding spectrum of the serine and arginine rich splicing factor 6 (SRSF6) in the context of diabetes. In pancreatic beta-cells, the expression of SRSF6 is regulated by the transcription factor GLIS3, which encodes for a diabetes susceptibility gene. It is known that SRSF6 promotes beta-cell death through the splicing dysregulation of genes essential to beta-cell function and survival. However, the exact mechanism of how these RNAs are targeted by SRSF6 remains poorly understood. Here, I applied the defined iCLIP processing pipeline to describe the binding landscape of the splicing factor SRSF6 in the human pancreatic beta-cell line EndoC-H1. The initial binding sites definition revealed a predominant binding to coding sequences (CDS) of protein-coding genes. This was followed up by extensive motif analysis which revealed a so far, in human, unknown purine-rich binding motif. SRSF6 seemed to specifically recognize repetitions of the triplet GAA. I also showed that the number of contiguous triplets correlated with increasing binding site strength. I further integrated RNA-sequencing data from the same cell type, with SRSF6 in KD and in basal conditions, to analyze SRSF6- related splicing changes. I showed that the exact positioning of SRSF6 on alternatively spliced exons regulates the produced transcript isoforms. This mechanism seemed to control exons in several known susceptibility genes for diabetes. In summary, in my PhD thesis, I presented a comprehensive workflow for the processing of iCLIP-derived sequencing data. I applied this pipeline on a dataset from pancreatic beta-cells to unveil the impact of SRSF6-mediated splicing changes. Thus, my analysis provides novel insights into the regulation of diabetes susceptibility genes.
  • Das Transkriptom eukaryotischer Zellen befindet sich in einem dynamischen, sich stetig verändernden Prozess. Viele regulatorische Mechanismen werden dabei von so genannten RNA-bindenden Proteinen (RBPs) kontrolliert. Diese interagieren mit spezifischen Bindestellen auf der RNA. Eine wichtige Methode zur Analyse des Bindeverhaltens von RBPs ist ”individual-nucleotide resolution UV crosslinking and immunoprecipitation“ (iCLIP). Dabei werden die Protein-RNA-Kontakte in der Zelle mit Hilfe von UV-Strahlen fixiert. Anschließend kann ein bestimmtes RBP durch einen Antikörper extrahiert, und die daran gebunden RNA-Moleküle sequenziert werden. Dabei entstehen Millionen kleiner Sequenzstucke (”reads“), welche dann zum Beispiel gegen das menschliche Genom aligniert werden können, um Ruckschlüsse auf die Position des RBPs auf der RNA zuzulassen. Ziel meiner Arbeit war es, durch die Auswertung von iCLIP-Daten die RBP-getriebene RNA-Prozessierung in Eukaryoten besser zu verstehen. Die hier vorgelegte Arbeit lässt sich in zwei Abschnitte unterteilen. Im ersten Teil wird eine Verfahrensweise zur computergestutzten Auswertung von ¨iCLIP-Daten beschrieben. Es existieren zwar bereits andere Verfahrensweisen, diese sind allerdings entweder unvollständig oder beschreiben eine Nischenlösung für eine bestimmte Fragestellung. Dabei wird in der Regel für das ¨jeweils zu untersuchende RBP und das verwendete experimentelle Setup eine speziell angepasste Art der Datenauswertung verwendet. Dadurch sind die Ergebnisse verschiedener RBPs nur schwer miteinander zu vergleichen. Dies ist aber gerade bei komplexeren Fragestellungen zwingend erforderlich. Unter der Verwendung bereits publizierter iCLIP-Daten des Spleißfaktor ”U2 small nuclear RNA auxiliary factor 2“ (U2AF2/ U2AF65) wurde deshalb eine standardisierte Verfahrensweise zur iCLIP-Datenauswertung entwickelt. Im zweiten Abschnitt der Arbeit wird das Bindeverhalten des RBPs "serine and arginine rich splicing factor 6" (SRSF6) im Kontext von Diabetes analysiert, indem die im ersten Teil definierte Verfahrensweise Anwendung findet. Es ist bereits bekannt, dass die Expression von SRSF6 in Pankreas-Zellen durch das Gen ”GLI-similar 3“ (GLIS3 ) reguliert wird. In Typ-1- und Typ-2-Diabetes (T1D, T2D) ist die Expression von GLIS3 gestört, was die Expression von SRSF6 beeinflusst. SRSF6 fungiert in der Zelle als ein Spleißfaktor, sodass eine Veränderung des Expressiosniveaus das gesamte Transkriptom beeinflussen kann. Ziel dieses Teils der Arbeit ist es, die SRSF6-abhängigen Veränderungen im Transkriptom von Beta-Zellen zu beschreiben, um daraus Ruckschlüsse über dessen Regulierung und den Einfluss auf Diabetes zu gewinnen. Dazu wurden sowohl iCLIP- als auch RNA-Seq-Daten aus der menschlichen Pankreas-Ziellinie EndoC-βH1 analysiert. ....

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Mirko BrüggemannORCiDGND
URN:urn:nbn:de:hebis:30:3-613842
DOI:https://doi.org/10.21248/gups.61384
Place of publication:Frankfurt am Main
Referee:Katharina ZarnackORCiDGND, Ingo EbersbergerORCiDGND
Advisor:Katharina Zarnack, Ingo Ebersberger
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2021/06/28
Year of first Publication:2021
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2021/06/22
Release Date:2021/10/06
Page Number:189
HeBIS-PPN:486065138
Institutes:Biowissenschaften
Dewey Decimal Classification:5 Naturwissenschaften und Mathematik / 57 Biowissenschaften; Biologie / 570 Biowissenschaften; Biologie
Sammlungen:Universitätspublikationen
Sammlung Biologie / Biologische Hochschulschriften (Goethe-Universität)
Licence (German):License LogoDeutsches Urheberrecht