Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-88377
URL: http://www.freidok.uni-freiburg.de/volltexte/8837/


López Hernández, Juan Ygnacio

Development of a method for forest type detection

Entwicklung einer Methode für Forst-Erkennung

Dokument1.pdf (9.554 KB) (hyperlinks in table of contents) (md5sum: c0b425881f14c3c911169dc14f689f76)

Kurzfassung in Englisch

The definition of forest based on FAO (Food and Agriculture Organization of the United Nations), but with 40 % of crown closure was used. A set of 7056 plots, from the National Forest Inventory (NFI) database of Bavaria, in Germany, were used to train algorithms and classify LANDSAT TM data taken between 2006 and 2007. The data from the inventory was filtered using a buffer around the boundary of official forest cover layer of the state to avoid the boundary effect. The NFI was then classified with unsupervised method, taking into account the relative importance of species. Clustering techniques based on Partitioning Around Medoids (PAM) were used to find the number of clusters from the NFI. The images were preprocessed for orthorectification and clouds removal. Some other anomalies at the boundaries of the scenes were also removed. The algorithms tested for PBIA classification were: Maximum Likelihood (MxL) and Minimum Distance (MD); for OBIA classification were: support vector machines (SVM), k nearest neighbour (kNN), multinomial logistic regression (MNL), decision trees (DT) and random forest (RF). Recursive back wise variable selection based on Random Forest (RF) was carried out to select the best predictors of forest types with OBIA. Classification and regression with Machine Learning algorithms were tuned and applied with 10-folds cross validation and 5 replications to the optical bands and synthetic bands of standard deviation (SD), tasseled cap (TC), and texture (TXT). The results showed that the OBIA approach was more accurate for the delineation than the PBIA approach. PBIA was rejected based on differences with the official forest layer. Consideration of boundary effect in NFI was determinant in finding the solution to classify in terms of accuracy and kappa. Precise placement of physical plot for each medoid of cluster derived from the NFI could be found by PAM method. Mixed behavior was found in the accuracy of the classifications. In general the SVM was the best classifier with overall accuracy ranging from 70.6%, 71.2%, 73.2% to 82.5% and kappa 0.559, 0.569, 0.898 to 0.738 respectively for 4 of the 6 images under evaluation. In other image with less mixture of forest classes, the best classifier was kNN with 85.1% accuracy and 0.778 kappa. RF was found to be the best in one image with 78.5% accuracy and 0.678 kappa. The results suggest that the unequal distribution of forest in all images can explain the errors in the classification. The best models selected per image were composed by 10 to 12 predictors when SVM was the best classifier. Only models that used 1 or 9 predictors were applied for two images which had kNN or RF as the best classifier. Parts of the method are automated and can be applied sequentially in the steps for clustering NFI and the classification, regression with final evaluation.


Kurzfassung in Deutsch

Die vorliegende Studie verwendet 7056 Inventurpunkte der Bundeswaldinventur des Bundeslandes Bayern zur Klassifizierung von Bestandestypen aus Landsat TM Satellitenbilder der Jahre 2006 und 2007. Die verwendeten Satellitenbilder wurden orthorektifiziert and Wolken sowie andere Anomalien wurden entfernt. Die Inventurdaten wurden mit Hilfe von offiziellen Geodaten der Forstverwaltung verschnitten um alle Inventurpunkte außerhalb des Waldes zu entfernen. Dabei wurde die Walddefinition der FAO, aber mit einem minimalen Kronenschlussgrad von 40% als Kriterium verwendet. Zusätzlich wurde ein Puffer verwendet um Inventurpunkte nahe der Waldgrenzen ebenfalls auszuschließen. Die verbleibenden Inventurpunkte wurden einem statistischen „Clustering“-Verfahren unterzogen. Dabei dienten die Grundflächenanteile der unterschiedlichen Baumarten als Eingangsvariable. Für das „Clustering“ wurde die „Partitioning Around Medoids (PAM)“-Methode verwendet um eine optimale Anzahl unterschiedlicher Bestandestypen und deren Eigenschaften, welche durch die Medoide definiert sind, auszuscheiden. Zwei unterschiedliche Verfahren wurden für die Klassifizierung der Satellitenbilder getestet: Pixelbasierte Verfahren und objekt-orientierte Verfahren. Rekursive Rückwärtsselektion basierend auf Random Forest (RF) wurde durchgeführt um die besten Prädiktoren für die Unterscheidung der definierten Waldtypen zu bestimmen. Die Klassifizierung der Satellitenbilder und die Regression der Inventurpunkte mit den Sallitendaten wurde mit unterschiedlichen Verfahren des maschinellen Lernens durchgeführt. Es wurde eine 10-fache Kreuzvalidierung mit 5 Wiederholungen angewandt. Als Eingangsdaten wurden sowohl die originären Landsat-Bänder als auch synthetische Derivate der Bänder (Standartabweichungen, Tasseled-Cup-Transformationen, Texturinformationen) verwendet. Als pixelbasierte Verfahren kamen MaximumLikelihood und MinimumDistance Klassifikatoren zum Einsatz. Für die Klassifizierung der Segmente, welche während des objekt-orientierten Ansatzes definiert wurden, wurden Support Vector machines (SVM), k nearest neighbour (kNN) , multinomial logistic regression (MNL), und Entscheidungsbaum-basierte Verfahren (DT, RF) eingesetzt. Die Ergebnisse zeigen, dass der verwendete objekt-orientierte Ansatz bessere Ergebnisse als der pixel-basierte Ansatz lieferte. Allgemein lieferte SVM die besten Genauigkeiten, die für 4 der 6 Bilder zwischen 70.6% und 82.5% lagen (kappa zwischen 0.559 und 0.738). In den zwei übrigen Bildern, die eine geringere Mischung an verschiedenen Bestandestypen aufwiesen, waren die besten Klassifikatoren einmal kNN mit 85.1% (kappa 0.778) und einmal RF mit 78.5% (kappa 0.678). Die Ergebnisse zeigen, dass die Zusammensetzung der Bestandestypen in den unterschiedlichen Landsat-Szenen variiert und dass das optimale Klassifikationsverfahren von der Zusammensetzung der Bestandestypen abhängt. Für die 4 Bilder, bei denen SVM-Klassifizierungen beste Ergebnisse erzeugten, beinhalteten die Modelle zwischen 10 und 12 Prädiktoren. Die kNN- und RF-Modelle der beiden anderen Bilder, welche beste Genauigkeiten lieferten beinhalteten einen bzw. 9 Prädiktoren. Zusammenfassend kann gesagt werden, dass die vorgestellte Methode autmatisierbar ist und die drei methodischen Schritte (Clustering der Inventurdaten, Klassifikation und schlussendlich Regression und Validierung) sequentiell durchgeführt werden können, um aus Landsat-Daten in Kombination mit Daten der Bundeswaldinventur Bestandestypen zu klassifizieren.


SWD-Schlagwörter: Fernerkundung , Landsat , Landsat/TM , Maschinelles Lernen
Freie Schlagwörter (deutsch): LANDSAT TM , Bestandestypenklassifikation , maschinelles Lernen , Waldinventur , objektbasiertes Verfahren
Freie Schlagwörter (englisch): LANDSAT TM , forest type classification , machine learning , OBIA, forest inventory
Institut: Institut für Forstökonomie
Fakultät: Fakultät für Forst- und Umweltwissenschaften
DDC-Sachgruppe: Land- und Forstwirtschaft, Veterinärmedizin
Dokumentart: Dissertation
Erstgutachter: Koch, Barbara (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 14.11.2012
Erstellungsjahr: 2012
Publikationsdatum: 06.12.2012
Bemerkung: Classification of forest types in the boundaries of the oficial forest in Bavaria was made. The national forest inventory with enrichment of Bavaria was used as reference and clusters were build. Based in application of machine learning techniques and supervised classification five different classifiers were tested and validated.
Indexliste