Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-8100
URL: http://www.freidok.uni-freiburg.de/volltexte/810/


Franz, Pius

Morphembasierte automatische Indexierung und Klassifikation von Diagnosenbezeichnungen

Morpheme based automatical indexing and classifikation of diagnostic expressions

Dokument1.pdf (2.139 KB) (md5sum: 2254b47d259998ac0259de889fdab631)

Kurzfassung in Deutsch

Im Rahmen der vorliegenden Arbeit wird ein morphembasierter Algorithmus zur Indexierung und Klassifikation von Diagnosenbezeichnungen entwickelt und analysiert.

Einleitung: In drei Abschnitten werden die gesetzlichen Verpflichtungen bezüglich der Dokumentation von Diagnosen und Prozeduren, die Qualität aktuell klinisch eingesetzter Verfahren der Codierung sowie die grundlegenden Methoden zur DV-gestützten Klassifikation von Diagnosen dargestellt.

Methoden: Ausgehend von einem früheren Ansatz wird eine Methode zur Vorverarbeitung, morphologischen Analyse und SNOMED-Indexierung von Diagnosentexten erläutert und weiterentwickelt. Aufbauend auf dieser syntaktisch motivierten Indexierung schließt sich ein neuartiges Retrieval-Verfahren zur ICD- und OPS-301-Codierung an, das semantische Konzepte wie begriffliche Kategorien und eine Hierarchiebildung berücksichtigt.

Realisierung: Einzelne Aspekte der praktischen Umsetzung des Verfahrens werden näher erläutert. Das Wachstumsverhalten eines Morphemlexikons in Relation zum Umfang des analysierbaren Wortschatzes wird in einer eigenständigen Studie untersucht.

Ergebnisse: Zur Evaluation von Indexierung und Retrieval wird ein qualitativer Test, der verbleibende Fehlerquellen katalogisiert, sowie ein quantitatives Experiment zum Vergleich der Leistungsfähigkeit eines klassischen Ansatzes mit dem präsentierten Verfahren durchgeführt, bei dem sich eine Übereinstimmung mit dem 'gold standard' in 42,7 (klassischer Ansatz) gegenüber 50,5 der Fälle ergibt.

Diskussion: Typische Fehlerquellen bei der automatischen Klassifikation können identifiziert werden. Für die Überlegenheit des präsentierten Verfahrens gegenüber dem konventionellen Ansatz ist nicht die Indexierungsmethode, sondern das Retrieval verantwortlich. Dies spiegelt die wachsende Bedeutung semantischer Konzepte gegenüber vornehmend syntaktischen Ansätzen wider und gibt die Grundrichtung für weitere Forschungsmöglichkeiten vor.


Kurzfassung in Englisch

In the present dissertation, a morpheme-based algorithm is developed and analyzed for the indexing and classification of diagnostic expressions.

Introduction: The legal obligations concerning the documentation of diagnoses and procedures, the quality of up-to-date clinically assigned procedures of coding as well as the fundamental methods of data processing-supported classification of diagnoses are represented in three sections.

Methods: On the basis of a previous approach, a method for preprocessing, morphologic analysis and SNOMED indexing of diagnostic expressions is described and developed further. Based on this syntactically motivated indexing system, a new retrieval procedure for the ICD and OPS-301 coding follows, which manages to consider semantic concepts like conceptual categories and a hierarchical relation of certain medical expressions.

Implementation: Aspects of the implementation of the algorithm are described in more detail. The growth behavior of a morpheme lexicon in relation to the range of analyzable vocabulary is examined in a separate study.

Results: For the evaluation of the indexing and retrieval method, a qualitative test is used, which lists remaining sources of error, as well as a quantitative experiment for the comparison of the efficiency of a standard method with the presented procedure. A correspondence with the gold standard is reached in 42,7 (classical method) and 50,5 (morpheme based method) of the cases respectively.

Discussion: Typical sources of error of the automatic classification can be identified. The superiority of the presented procedure compared with the standard one is a result rather of the retrieval than the indexing method. This reflects the increasing meaning semantic concepts have come to represent in comparison with purely syntactic methods, indicating an opportunity for further research.


SWD-Schlagwörter: Automatische Indexierung , Automatische Klassifikation , SNOMED , ICD , Diagnosenschlüssel
Institut: Inst. für Medizin. Biometrie und Medizin. Informatik (IMBI)
Fakultät: Medizinische Fakultät / Universitätsklinikum (bis Sept. 2002)
DDC-Sachgruppe: Medizin und Gesundheit
Dokumentart: Dissertation
Erstgutachter: Klar, Rüdiger (Prof. Dr. rer. nat.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 30.04.2002
Erstellungsjahr: 2003
Publikationsdatum: 05.09.2003
Indexliste