Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-83997
URL: http://www.freidok.uni-freiburg.de/volltexte/8399/


Alexandris, Nikos

Burned area mapping via non-centered PCA using Public Domain Data and Free Open Source Software

Kartierung abgebrannter Flächen durch nicht-zentrierte Hauptkomponentenanalyse bei Benutzung von Public Domain Dateien und Free Open Source Software

Dokument1.pdf (17.357 KB) (md5sum: 161a20389f851ffbb84002d2e9e7036c)
Dokument2.pdf (84.236 KB) (md5sum: 6d003f82a0e4f0dfceee81a7327ef75b)

Kurzfassung in Englisch

Principal Components Analysis (PCA) is useful in projecting the spectral profile of remotely sensed burned areas in fewer dimensions than present in original multi-spectral datasets.
Hence, it enables a more precise classification of fire-affected surfaces. In its classical form, PCA is based on the eigenvector decomposition (EVD).

The eigenanalysis on the covariance matrix (non-standardised PCA) of a multi-dimensional data matrix, generates the transformation coefficients with which new dimensions, called principal components, are created. Mean-centering the data matrix prior to the eigenanalysis ensures that the first principal component is proportional to the maximum variance of the multidimensional data. Alternatively, using the correlation instead of the covariance matrix (also known or standardised PCA) forces equal contribution of all input dimensions during the analysis–an option also known as scaling.

An essentially equivalent algorithm to EVD, but one numerically more robust, is the singular value decomposition (SVD). In fact, centered data subjected to SVD yield transformation coefficients identical to the conventional PCA. While mean-centering is treated as an integral part of PCA prior to EVD, it is optional in SVD. Avoiding to center the data matrix results in a more general first component that mainly reflects the mean of the data.

This study focuses on SVD and treats the combinations of entering, non-centering, scaling, and non-scaling prior to the actual transformation as four different versions of PCA. Using both unitemporal and bi-temporal data sets of both moderate and high spatial resolution (MODIS and Landsat5 TM products respectively), all four PCA versions are experimented while aiming to increase the spectral separability of burned areas. The results indicate that an uncentered PCA may increase more than a centered-PCA, the separability of burned areas in some of the higher order components. Nonetheless, PCA is a highly data dependent method and therefore all versions should be examined thoroughly in order to identify the most efficient one.

Additionally, the analysis considers an empirically normalised MODIS data set. The normalisation, based on a linear regression, aims to reduce the pre- and post-fire inter-acquisition variations in the reflectance. While the normalised uncentered-unscaled data
set increases the overall classification accuracy, the normalised centered-scaled data sets, however, derive identical results as the non-normalised centered-scaled data.

The comparison of the four PCA versions concerns the classification of burned areas in Peloponnese, Greece 2007. Burned samples of various sizes were extracted from MODIS-based classifications. Their thematic accuracy was assessed by means of the Pareto criterion using higher resolution Landsat7 ETM+ (SLC-off) post-fire data as a reference. The results highlight individual omission/commission pairs of errors (Oe, Ce) as well as classification performance between the four PCA versions. The highest classification accuracies were achieved by using some of the uncentered-unscaled higher order principal components.
The findings confirm that the uncentered PCA performs better than the traditional mean-centered PCA.

Finally, this work is based exclusively on public domain data and Free Open Source Software (FOSS). It may serve as a proof of concept to develop a burned area mapping project using exclusively FOSS. While being cost-free is undoubtedly an attractive argument to use free open source tools, there is a lot more involved in the discussion why FOSS?


Kurzfassung in Deutsch

Die Hauptkomponentenanalyse (PCA) ist nützlich zur Projektion des spektralen Profils von fernerkundeten verbrannten Flächen in einer geringeren Anzahl von Dimensionen als in den Originellen multispektralen Datensätzen. Demzufolge ermöglicht sie eine genauere Klassifizierung der von Feuer betroffenen Flächen. In ihrer klassischen Form basiert PCA auf der Eigenvektorzersetzung (EVD).

Die Eigenanalyse der Kovarianz-Matrix (non-standardised PCA) einer multidimensionalen Datenmatrix generiert die Transformationskoeffizienten auf deren Basis neue Dimensionen, die Hauptkomponenten genannt werden, erstellt werden. Die Durchschnitts-Zentrierung der Datenmatrix vor der Eigenanalyse stellt sicher, dass die erste Hauptkomponente proportional zur maximalen Varianz der multidimensionalen Daten ist. Alternativ, erzwingt die Benutzung der Korrelation-Matrix anstelle der Kovarianz-Matrix (non-standardised PCA) den gleichen Beitrag aller Anfangsdimensionen bei der Analyse--ein Schritt der auch als Skalierung bezeichnet wird.

Ein im Wesentlichen gleichwertiger Algorithmus zum EVD, aber numerisch robuster ist die Singulaerwertzerlegung (SVD). Tatsächlich ergeben zentrierte Daten, die der SVD unterzogen wurden, identische Transformationskoeffizienten wie mit der konventionellen PCA. Während die Durchschnitts-Zentrierung als wesentlicher Bestandteil der EVD-basierende PCA behandelt wird, ist sie optional in SVD. Das Vermeiden der Zentrierung der Datenmatrix resultiert in einer allgemeineren ersten Komponente, die in erster Linie den Mittelwert der Daten reflektiert.

Diese Studie konzentriert sich auf SVD und behandelt die Kombinationen von Zentrierung, Nicht-Zentrierung, Skalierung und Nicht-Skalierung vor der eigentlichen Transformation als vier verschiedene Versionen der PCA. Mit den beiden, unitemporalen und bi-temporalen, sowohl mittel- als auch hochauflösenden, verwendeten Datensätzen (MODIS und Landsat5 TM Produkte entsprechend), werden alle vier PCA Versionen experimentiert mit dem Ziel, die spektrale Trennbarkeit abgebrannter Flächen zu erhöhen.

Die Ergebnisse deuten an, dass eine unzentrierte PCA, besser als eine zentrierte PCA im Vergleich zu einer zentrierten PCA eine bessere Trennbarkeit der verbrannten Gebiete in einigen der Komponenten höherer Ordnung liefern kann. Dennoch ist PCA eine höchst datenabhängige Methode und daher sollten alle Versionen gründlich geprüft werden, um die effizienteste zu identifizieren.

Darüber hinaus betrachtet die Analyse einen empirisch normalisierten MODIS Datensatz. Die Normalisierung, die auf einer linearen Regression basiert, soll dazu beitragen, die Variationen in der Reflexion zwischen der Pre- und Post-Feuer Satellitaufnahmen zu reduzieren. Während der normalisierte unzentrierte-unskalierte Datensatz die gesamte Klassifikationsgenauigkeit erhöht, ergeben die normierten zentrierten-skalierten Datensätze jedoch identische Ergebnisse wie die nicht-normierten zentrierten-skalierten Daten.

Der Vergleich der vier PCA-Versionen betrifft die Klassifizierung der verbrannten Gebiete in Peloponnes, Griechenland 2007. Vebrannte Gebiete verschiedener Grössen wurden aus MODIS-basierten Klassifikationen extrahiert. Deren thematische Genauigkeit wurde durch das Pareto-Kriterium mit Verwendung hochauflösender Landsat7 ETM+ (SLC-off) Post-Feuer Daten als Referenz bemessen. Die Ergebnisse betonen einzelne Klassifikationsfehler--paare von fälschlich zugewiesenen und nicht erkannten Bildelementen (omission/commission errors)--sowie die Klassifizierungsleistung zwischen den vier PCA-Versionen. Die höchsten Klassifizierungsgenauigkeiten wurden mit Hilfe von einigen der unzentrierten-unskalierten Hauptkomponenten höherer Ordnung erreicht. Die Ergebnisse bestätigen, dass die unzentrierte PCA besser funktioniert als die traditionelle durchschnitts-zentrierte PCA.

Abschliessend basiert diese Arbeit ausschliesslich auf Public-Domain Daten und Free-Open-Source-Software (FOSS). Diese Arbeit kann als Proof-of-Concept zur Entwicklung eines Kartografierungsprojekts zur Erkennung abgebrannter Flächen ausschliessich mit FOSS dienen. Während kostenlos sein, zweifellos ein attraktives Argument fuer die Verwendung von freien Open-Source-Tools darstellt, gibt es noch viel mehr in der Diskussion wieso FOSS?


SWD-Schlagwörter: Kartierung , Hauptkomponentenanalyse , Public Domain , Open Source , Fernerkundung , Satellitenfernerkundung
Freie Schlagwörter (deutsch): Hauptkomponentenanalyse , Zentrierung, Skalierung, Waldbrände , Kartierung, Peloponnese , Parnitha , Griechenland , MODIS , Landsat5 TM
Freie Schlagwörter (englisch): PCA , EVD , SVD , mean-centering , scaling , forest fires , burned area mapping , Peloponnese , Mt Parnitha , Greece , MODIS , Landsat5 TM
Institut: Institut für Forstökonomie
Fakultät: Fakultät für Forst- und Umweltwissenschaften
DDC-Sachgruppe: Land- und Forstwirtschaft, Veterinärmedizin
Dokumentart: Dissertation
Erstgutachter: Kuntz, Steffen (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 29.06.2011
Erstellungsjahr: 2011
Publikationsdatum: 15.12.2011
Bemerkung: - This version includes grammatic, syntactic and typographic corrections after the submission of the thesis on February the 28th, 2011. Custom source code is also included in various sections in the Appendix

- This work is licensed under the 'Creative Commons Attribution 3.0 Unported License'

Indexliste