Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-65299
URL: http://www.freidok.uni-freiburg.de/volltexte/6529/


Pudimat, Rainer

Probabilistische Modelle zur Beschreibung und Vorhersage regulativer DNA-Sequenzen

Probabilistic models for describing and predicting regulatory DNA sequences

Dokument1.pdf (2.371 KB) (md5sum: 12dcffefb2fdf53bc7a9800d9adbb446)

Kurzfassung in Deutsch

Die Funktionsweise eines Proteins wird nicht nur durch eine enzymatische
Wirkung definiert, sondern auch durch die Dynamik seines Auftretens in verschiedenen
Zelltypen oder -stadien und verschiedenen physiologischen Situationen.
Die Rate, mit der ein bestimmtes Protein produziert wird, bzw. die Aktivität des dazu-
gehörigen Gens unterliegt einem vielschichtigen Regulationsapparat. Die bedeutendste
Stufe dieses Apparats ist die transkriptionelle Genregulation. Diese wird durch Tran-
skriptionsfaktoren ausgeübt, speziellen Proteinen, die auf der DNA binden können und
Einfluss auf die Aktivität von bestimmten Genen nehmen können. Transkriptionsfak-
toren binden bevorzugt eine für sie charakteristische Bindungssequenz (TFBS), einer
kurzen Nukleotidfolge von ungefähr zehn bis zwanzig Basenpaaren. Abweichungen von
dieser optimalen Sequenz werden je nach Transkriptionsfaktor mehr oder weniger stark
toleriert. In komplexeren Lebewesen kooperieren häufig mehrere Transkriptionsfaktoren
und wirken als funktionale Einheit auf die Genexpression. Zu wissen, welche Transkripti-
onsfaktoren welche Gene regulieren, wäre ein Fortschritt bei der Aufklärung der Funktion
von Proteinen.
Diese Arbeit beschäftigt sich mit der rechnergestützten Analyse von regulativen DNA-
Sequenzen, jenen DNA-Bereichen also, die durch Transkriptionsfaktoren gebunden wer-
den. In drei Teilen werden drei verschiedene Aspekte dieses Forschungsgebiets bearbeitet:
1.) die stochastische Modellierung und Erkennung einzelner TFBS, 2.) die stochastische
Modellierung von funktionell zusammenhängenden Gruppen benachbarter TFBS und
3.) das unüberwachte Lernen unbekannter Sequenzmotive.


Kurzfassung in Englisch

The function of a protein is defined by its enzymatic impact but also by the dynamics of its
precence in different cell tissues, and in different physiological circumstances.
The expression rate of a protein-coding gene is regulated by several mechanisms. One important layer
of regulation is the transcriptional gene regulation. Particular proteins, transcription factors,
which are able to bind on short, characteristic DNA sequences and to influence the work of the RNA
polymerase II complex are the actors of transcriptional regulation. Transcription factors
tolerate some degree of variation of their prefered DNA binding sequence. Further, multiple
transcription factors constitute functional units to trigger the regulatory effect.
In order to understand the regulation of a gene it is important to know which transcription factors
are able to bind the regulatory sequences of this gene.
This thesis deals with the computational analysis of regulatory DNA sequences. In three parts
the thesis describes my research results in three different disciplines of this research field:
1.) the probabilistic modeling and prediction of single transcription factor binding sites, 2.) the stochastic
modeling of groups of functional related transcription factor binding sites, and 3.) unsupervised learning algorithms
of unknown sequence patterns.


SWD-Schlagwörter: DNS-Bindungsproteine , DNS-Bindung , DNS-Krümmung , DNS , Bioinformatik , Mustererkennung , Musteranalyse , Automatische Klassifikation , Bayes-Netz ,
Freie Schlagwörter (englisch): DNA binding proteins , promoters , pattern recognition , bayesian networks , hidden markov models
MSC Klassifikation 60J22 , 62Fxx
Institut: Institut für Informatik
Fakultät: Technische Fakultät (bisher: Fak. f. Angew. Wiss.)
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Erstgutachter: Backofen, Rolf (Prof. Dr.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 08.12.2008
Erstellungsjahr: 2008
Publikationsdatum: 29.06.2009
Indexliste