Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-27710
URL: http://www.freidok.uni-freiburg.de/volltexte/2771/


Siebert, Sven

Common sequence structure properties and stable regions in RNA secondary structures

Sequenz-/Struktureigenschaften und stabile Regionen in RNA Sekundärstrukturen

Dokument1.pdf (1.251 KB) (md5sum: 1d6e2a451b0fefa993e6d457cddc1b59)

Kurzfassung in Englisch

Many RNAs conserve a secondary structure of base-pairing interactions more than they conserve their sequence. This makes RNA analysis more complicated and difficult than protein or DNA analysis. RNA structures can be responsible for catalytic or regulatory tasks in the cell. The UGA codon is responsible for the incorporation of selenocysteine in the presence of a SECIS element. The SECIS motif satisfies both sequence- and structure constraints. Thus, it is wrong to consider sequence properties or structure properties solely. A combination of both has to be taken into account. The comparison of multiple, homologous RNAs may detect similarities of sequence structure properties. They are mostly reflected in a consensus sequence and/or consensus structure. Based on this, we give a short overview of the major issues in this thesis.

Objectives of this Thesis

This thesis is aimed at devising methods and algorithms in RNA structure analysis. Beside the comparison and integration of known techniques, the following points are the main contributions to this thesis. They have been devised theoretically and implemented as algorithms.

- A multiple alignment of RNAs taking into consideration both the primary sequences and the secondary structures of RNAs, called MARNA.

- A fast pattern matching algorithm that detects common pattern between two RNA secondary structures.

- An efficient algorithm for detecting locally stable regions.

The first two points operate mainly on sequence structure properties, whereas the last point covers the theory of thermodynamic properties.


Kurzfassung in Deutsch

Ribonukleotidsequenzen (RNA) sind einzelsträngige Sequenzen, die Strukturen unter Beachtung der Basenpaarregeln (A-U, C-G, G-U) ausprägen. Die Sekundärstruktur einer RNA ist definiert als eine Menge von Basenpaaren, welche die Einbettungseigenschaft erfüllt: für je zwei Basenpaare (i,j) und (h,l) mit i<h, gilt entweder i<h<l<j oder i<j<h<l. Viele RNAs konservieren eine Struktur von Basenpaarinteraktionen besser als ihre eigentliche Sequenz. Dies verkompliziert die Analyse von RNAs und ist schwieriger zu handhaben als die der Protein und DNA Analyse. RNAs sind nicht nur Träger von Erbinformationen, sondern sind auch für katalytische und regulatorische Funktionen in der Zelle verantwortlich. Diese werden meist durch spezifische Sequenz- und Struktureigenschaften hervorgerufen. Als Beispiel sei hier das SECIS Element erwähnt, das eine stem-loop Struktur aufweist. Ist dieses Element in der unmittelbaren Umgebung im nicht translatierten Bereich (UTR) eines UGA Kodons vorhanden, so wird der eigentliche Translationsstop, der normalerweise vom UGA Kodon hervorgerufen wird, verhindert und dafür die Aminosäure Selenocystein eingebaut.

Die Erkennung und Beschreibung solcher Sequenz-/ Struktureigenschaften (wie z.B. SECIS Elemente) hat sich in der Vergangenheit als eine manuelle und zugleich ermüdende Arbeit herausgestellt. Hier ist eine automatische Analyse in Form eines multiplen Alignments unter Beachtung von Sequenz- und Struktureigenschaften wünschenswert, so wie es sie schon bei multiplen Sequenzalignments gibt.

Ein anderer wichtiger Aspekt ist die Erkennung von interessanten Sequenz/ Strukturregionen zwischen zwei gegebenen RNA Sekundärstrukturen. RNA Sequenzen können zwar mithilfe des Mfold-Programms in ihre energetisch günstige Konformation gefaltet werden, diese sichert aber noch nicht die tatsächlich biologisch relevante Konformation zu. Unter der Annahme, dass lokale Regionen höchstwahrscheinlich richtig gefaltet sind, so wie sie auch in vielen anderen suboptimalen Strukturen auftreten, gilt es, diese dann noch zu erkennen. Hierbei spielt neben der Sequenz und Struktur, eine dritte Eigenschaft eine grosse Rolle, nämlich die der thermodynamischen Stabilität einer RNA. Energetisch günstige Konformationen werden wahrscheinlicher von einer RNA angenommen als energetisch ungünstige.

Diese Arbeit hat als Ziel, Methoden und Algorithmen bezüglich der RNA Analyse zu erarbeiten. Neben dem Vergleich und Integration von bereits vorhandenen Methoden, sind die folgenden Punkte der eigene Beitrag zur Dissertation:

Eigener Beitrag: Die Arbeit besteht aus hauptsächlich drei selbstständig entwickelten Methoden, die sowohl theoretisch als auch praktisch in Form von Programmen oder Web-Server erarbeitet und entwickelt worden. Die ersten beiden Punkte lassen sich in den Bereich der Sequenz-Struktur Analyse einordnen, d.h. die Sequenz einer RNA und die Sekundärstruktur einer RNA werden nicht unabhängig betrachtet, sondern in Kombination miteinander. Der dritte Punkt betrachtet die Stabilität aufgrund von thermodynamischen Parametern einer RNA:

- Multiples Alignment von RNAs: MARNA ist ein Web-Server, der als Eingabe eine Menge von RNA Sequenzen erwartet, und diese unter Beachtung von Primärsequenzen und Sekundärstrukturen aligniert. MARNA beinhaltet eine Technik, die erstmals gute Ergebnisse ohne weitere Eingaben liefert.

- Schnelle Erkennung von exakten Mustern in RNA Sekundärstrukturen: Hier entwickeln wir ein schnelles Verfahren mit Laufzeit O(nm) und gleicher Speicherkomplexität zur Erkennung von Mustern zwischen zwei gegebenen Sekundärstrukturen. Die Ausgabe sind alle nichtüberlappenden Muster.

- Thermodynamischen Stabilitäten von RNAs werden mithilfe von thermodynamischen Parametern im Nächste-Nachbar Modell berechnet. Während die mfe (minimum free energy) Struktur von Zuker in vernünftiger Zeit berechnet werden kann, haben wir eine lokale, modifizierte Version entwickelt, die stabile Teilstrukturen in gegebenen als auch in nicht gegebenen vollständigen Strukturen vorhersagt.

Diese Arbeit untergliedert sich in zwei Haupfelder. Das erste Feld deckt die Analyse von RNAs aufgrund von Sequenz- und Struktureigenschaften ab. Das zweite Feld betrachtet thermodynamische Stabilitäten von RNAs.


SWD-Schlagwörter: RNS , Strukturanalyse , Thermodynamische Stabilität
Freie Schlagwörter (englisch): Multiple Alignment
Institut: Institut für Informatik
Fakultät: Technische Fakultät (bisher: Fak. f. Angew. Wiss.)
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Erstgutachter: Backofen, Rolf (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 04.12.2006
Erstellungsjahr: 2006
Publikationsdatum: 11.12.2006
Indexliste