Annotation und Klassifikation nuklearer Domänen
- Im Rahmen dieser Doktorarbeit wurde der Großteil aller nuklearen Proteine annotiert und klassifiziert. Aus Literatur, Proteinsequenz- und Domänendatenbanken wurden bekannte nukleare Domänen ermittelt, ihre Grenzen unter Zuhilfenahme von Tertiärstrukturen oder Sekundärstrukturvorhersagen bestimmt und multiple Sequenzalignments erstellt. Die handgerfertigten Aligments wurden zur Anfertigung von Hidden Markov Models herangezogen und in das Domänenvorhersageprogramm Simple Modular Architecture Research Tool (Schultz et al. 1998, Schultz et al. 2000) (http://smart.embl-heidelberg.de/) implementiert. Hier sind umfassend Informationen über Literatur, phylogentische Verteilung, Anzahl beteiligter Proteine und Funktion für 164 Domänen (118 entstammen dieser Arbeit) mehr als 35000 Proteine abdeckend zusammengefasst. Aufbauend auf der vollständigen Kollektion nuklearer Proteine wurden ausgewählte nukleare und nicht-nukleare Proteine auf der Grundlage homologiebasierender Sequenzanalyseverfahren untersucht. Die Arbeit führte zur Entdeckung von vier biologisch relevanten neuen Domänen: - L27, eine neue Hetero-Dimer bildende Domäne in den Rezeptor-Targeting-Proteins Lin-2 and Lin-7 (Doerks et al. 2000) - GRAM, eine neue Domäne in Glucosyltransferasen, Myotubularinen und anderen Membran-assoziierten Proteinen (Doerks et al. 2000) - DDT, eine neue DNA-bindende Domäne in unterschiedlichen Transkriptionsfaktoren, Chromosom-assoziierten und anderen nuklearen Proteinen (Doerks et al. 2001) - BSD, eine neue putativ DNA-bindende Domäne in Transkriptionsfaktoren, Synapsen-assozierten und anderen hypothetischen Proteinen (Doerks et al. submitted) Abschliessend erfolgte die automatische Analyse von 24000 nuklearen Proteinen, aus denen 550 hypothetisch neue Domänen hervorgingen. Die intensive Aufarbeitung dieser 550 konservierten Sequenzbereiche erbrachte die Entdeckung von 28 neuen nuklearen oder teilweise nuklearen Domänen unterschiedlicher Speziesverbreitung, Funktion und biologischer Relevanz (Doerks et al. accepted).