Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-20451
URL: http://www.freidok.uni-freiburg.de/volltexte/2045/


Hench, Jürgen Christian Hans

A combined threading and genetic algorithm based approach to predict protein structure

Eine kombinierte Methode aus Sequenz-Struktur-Datenbankvergleich und genetischem Algorithmus zur Vorhersage von Proteinstrukturen

Dokument1.pdf (715 KB) (md5sum: acf89d26ff404b6f5984945285425f11)
Dokument2.htm (6 KB) (md5sum: 1800af970d5b310e2cee2db4683067db)
Dokument1.zip (184 KB) (md5sum: e060f73044725108cadc9d685d16040c)
Dokument1.zip (1,390 KB) (md5sum: b99e3283efad5f7ce5e098aadfe7d3b7)

Kurzfassung in Englisch

We present new approaches and programs in our study of protein tertiary structure prediction based on the genetic algorithm (GA), applying also knowledge guided and database guided methods. Common desktop computers are able to run our new software which makes its application possible in the laboratory and in student teaching.

We introduce a new fitness function weight estimate for the genetic algorithm based on similarity of predicted secondary element content to known x-ray crystal structures from the Brookhaven Protein Database. In analogy to existing strategies we call this principle "threading-GA". This allows us to assist previous folding routines with a more natural approach. The evaluation routines are included within the application software so that future crystal structures may be easily included later and directly by the user.

As examples we show the simulation for several proteins. Some of them, like small toxin proteins, are of medical importance and should underline the need of prediction software in this research field. In times where protein sequence information is growing daily, tools are needed to derive structure predictions from it. Our software may be directly used for ab initio prediction of protein structure from sequence. In addition, the user may add specific information on the protein in question. This increases the quality of the resulting model.

We show further that a GA may have the potential to serve in prediction of structures for helical transmembrane proteins. Here we combine a systematic plot of the Ramachandran protein conformation map with our existing application. This setting allows us to generate models with correct membrane topology. However, further investigation will be necessary on that challenging topic.

The core GA has been optimized for the specific task of protein structure prediction. The program is now able to simulate small protein structures in less than a minute. Our software is completely written in ANSI C programming language. A system independent interface allows our application to run on the major operating systems.


Kurzfassung in Deutsch

Wir stellen neue Ansätze und Programme im Rahmen unserer Forschung zur Vorhersage von Proteinstrukturen vor. Dabei wenden wir neben dem genetischen Algorithmus (GA) auch Methoden an, die auf vorhandenen Informationen beruhen und durch eine Datenbank unterstützt werden. Herkömmliche Heimcomputer können unsere neue Software ausführen, was ihre Verwendung im Labor und beim Studentenunterricht ermöglicht.

Wir führen eine neue Abschätzung der Gewichtung für Fitnessfunktionen des GA ein, die auf Ähnlichkeiten beruhen zwischen den vorhergesagtem Strukturelementen und durch Röntgenkristallstrukturanalyse bekannten Strukturen aus der Brookhaven-Proteindatenbank. In Analogie zu existierenden Strategien nennen wir dieses Prinzip "threading-GA" (threading = Sequenz-Struktur-Datenbankvergleich). Dies erlaubt eine Unterstützung der früheren Faltungsroutinen mit einem naturnahen Datenbankansatz. Die Auswertungsroutinen sind Teil der Software, so dass zukünftige Kristallstrukturen später durch den Anwender mitverwendet werden können.

Als Beispiele zeigen wir die Simulation einiger Proteine. Einige davon, wie kleine Toxin-Proteine, sind von medizinischer Relevanz. In Zeiten, wo die Sequenzinformationen über Proteine täglich zunehmen, sind Werkzeuge wichtig, die möglichst viele Strukturdaten daraus ableiten. Unsere Software kann direkt zur ab initio Vorhersage von Proteinstrukturen aus der Sequenz verwendet werden. Zusätzlich kann der Anwender spezifische Informationen zu der fraglichen Proteinstruktur angeben, was die Qualität des Modells verbessert.

Wir zeigen weiterhin, daß ein GA das Potential aufweisen kann, Strukturen für helikale transmembranäre Proteine vorherzusagen. Dieser Ansatz erlaubt uns die Erzeugung von Modellen mit korrekter Membrantopologie. Dennoch ist auf diesem anspruchsvollen Gebiet der Strukturvorhersage noch weitere Entwicklung erforderlich.

Der GA-Kern wurde für die spezifische Aufgabe der Proteinstrukturvorhersage optimiert und kann kleine Proteinstrukturen in weniger als einer Minute simulieren. Unsere Software ist vollständig in der Programmiersprache ANSI C geschrieben. Mit seiner systemunabhängigen Schnittstelle läuft unser Programm direkt auf den wichtigsten Betriebssystemen.


SWD-Schlagwörter: Proteine , Struktur , Prognose , Genetischer Algorithmus , Sequenz , Datenbank
Freie Schlagwörter (deutsch): Proteinstruktur , Vorhersage , GA , genetischer , Algorithmus
Freie Schlagwörter (englisch): protein , structure , prediction , genetic , algorithm
NASA Thesaurus Computer Applications
Institut: Inst. für Molekulare Medizin und Zellforschung
Fakultät: Medizinische Fakultät / Universitätsklinikum
DDC-Sachgruppe: Medizin und Gesundheit
Dokumentart: Dissertation
Erstgutachter: Dandekar, Thomas (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 02.07.2004
Erstellungsjahr: 2005
Publikationsdatum: 04.10.2005
Bemerkung: The PDF document may be perfectly printed in grayscale as well as with colors.
Indexliste