Direkt zum Inhalt | Direkt zur Navigation

Eingang zum Volltext

Lizenz

Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgende
URN: urn:nbn:de:bsz:25-opus-81600
URL: http://www.freidok.uni-freiburg.de/volltexte/8160/


Nguyen-Tuong, Duy

Model Learning in robot control

Modell-Lernen für Roboter-Regelung

Dokument1.pdf (7.756 KB) (md5sum: f16411b990ca971f2608c80732ccbf62)

Kurzfassung in Englisch

Creating autonomous robots that can safely interact with humans in daily life has been a long-standing dream of robotics and artificial intelligence. This goal cannot be achieved without compliant and fully adaptive robot control, which requires accurate models of the robot and its environment. However, analytical models obtained from physics-based modeling techniques have shown to be insufficient for many modern robots systems. It appears that compliant and fully adaptive robot control can only be achieved with model learning. In this thesis, we explore how statistical kernel-based learning techniques can be employed in real-time approximate model based robot control. The presented work includes contributions to robot control, as well as machine learning. This thesis advances a kernel-based statistical approach to robot control.

We show that kernel-based learning can be used to obtain both compliance and accurate control performance. In this case, learning the inverse dynamics models is necessary to predict the required torques for the robot to perform a desired task.
In order to adapt the models to changes in the robot dynamics and environment, real-time online learning of such models is essential. We additionally present machine learning solutions to model learning problems in robotics, such as learning models from multi-valued mappings. Learning from such mappings is necessary for approximating torque prediction models for task-space robot tracking control. The
proposed kernel-based approach for learning models from multi-valued mappings is based on the insight that although it is globally ill-posed, the learning problem is locally well-defined. Additionally, in many real-world situations, we also face the problems of sparse and potentially poor data. In such cases, nonparametric learning methods can fail to provide a good prediction model. We investigate how prior
model knowledge can help to improve the model learning process in the presence of sparse and poor data. The developed semi-parametric learning approaches are effective for this data.

As a contribution to machine learning, we develop kernel-based learning methods which enable online model learning in real-time. We present two novel real-timekernel learning techniques for online model approximation. The first approach employs the local learning principle to speed up the nonparametric Gaussian process regression. The core idea behind this approach is to partition the data space into local regions, for which independent local Gaussian models are learned. Using these local models, learning and prediction can be accelerated significantly. The second approach relies on the concept of sparsification. Here, the idea is to select informative points from the stream of online arriving data and use them for learning the
models. We present a framework for online, incremental sparsisfication designed for fast real-time model learning. The proposed framework can be used to speed up incremental learning methods appropriate for online model learning in real-time. The approaches are implemented and evaluated on a Barrett whole arm manipulator for real-time learning control.


Kurzfassung in Deutsch

Die Erschaffung autonomer Roboter, die mit Menschen im täglichen Leben interagieren, ist ein erklärtes Ziel der Robotik und der künstlichen Intelligenz. Dieses Ziel kann jedoch nicht ohne adaptive und nachgiebige Roboterregelung realisiert werden. Eine weiche und nachgiebige Regelung erfordert jedoch ein genaues Modell des Roboters und seiner Umgebung. Es zeigt sich, dass traditionelle analytische
Modelle für viele moderne Roboter-Systeme unzureichend sind. In solchen Fällen kann eine nachgiebige und adaptive Roboterregelung nur mit Hilfe von Modelllernen erreicht werden. In dieser Arbeit soll gezeigt werden, wie statistische Lerntechniken in der modellbasierten Roboterregelung eingesetzt werden können.

Es soll dargestellt werden, wie kernbasiertes Lernen angewendet werden kann, um eine genaue Regelung zu erlangen und gleichzeitig den Roboter nachgiebig zu halten. Um die erforderlichen Drehmomente für die Roboterbewegung zu berechnen, ist es notwendig, die inverse Dynamik des Roboters zu lernen. Darüber hinaus ist Online-Lernen in Echtzeit für solche Modelle unerlässlich, um den Veränderungen in der Dynamik und Roboter-Umgebung Rechnung zu tragen. Zusätzlich wird dargestellt, wie maschinelles Lernen dazu beiträgt, das Lernen von nicht eindeutigen Abbildungen zu ermöglichen. Das Lernen dieser Abbildungen ist notwendig für eine Folgeregelung im Roboter-Handraum. Der hierzu vorgeschlagene kernbasierte Ansatz beruht auf der Erkenntnis, dass - obwohl solche Abbildungen global nicht wohl-definiert sind - das Lernproblem jedoch lokal wohl-definiert ist. Darüber hinaus stellt sich zudem in vielen realen Situationen das Problem der nicht-informativen Daten. In solchen Fällen können nicht-parametrische Lernmethoden keine guten Modelle für die Regelung bieten. Die vorliegende Untersuchung zeigt, wie zusätzliche analytische Modellierungsinformationen nicht-parametrischem Modelllernen helfen kann. Es wird gezeigt, dass semi-parametrische Lernansätze den Lernprozess bei spärlicher und nicht-informativer Datengrundlage entscheidend verbessern können.

Als Beitrag zum maschinellen Lernen werden kernbasierte Lernmethoden entwickelt, die Online-Modelllernen in Echtzeit ermöglichen. Hierzu werden zwei neue kernbasierte Lerntechniken für das Online-Lernen in Echtzeit vorgestellt. Der erste Ansatz nutzt das Prinzip des lokalen Lernens zur Beschleunigung der nicht-parametrischen Gauß’schen Prozesse. Die zentrale Idee dieser Methode ist die Einteilung des Datenraums in lokale Regionen, für die unabhängige lokale Gauß’sche Modelle gelernt werden. Mit Hilfe dieser lokalen Modelle kann die Geschwindigkeit des Lernens deutlich erhöht werden. Der zweite Ansatz beruht auf dem Konzept der Sparsifikation. Das entscheidende Vorgehen bei dieser Methode besteht darin, informative Punkte aus der Menge der ankommenden Daten online zu wählen und diese für das Lernen der Modelle zu verwenden. Hierzu wird eine Methode für die inkrementelle Online-Sparsifikation vorgestellt. Die vorgeschlagene Methode kann dazu verwendet werden, inkrementelle Online-Lernverfahren echtzeitfähig zu
machen. Die vorgestellten Ansätze wurden auf einem Barrett-Manipulator für die Echtzeit-Lernregelung implementiert und evaluiert.


SWD-Schlagwörter: Maschinelles Lernen , Robotik , Regelung
Freie Schlagwörter (englisch): robotics , machine learning , model learning , real-time control
Institut: Institut für Informatik
Fakultät: Technische Fakultät (bisher: Fak. f. Angew. Wiss.)
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Erstgutachter: Riedmiller, Martin (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 26.05.2011
Erstellungsjahr: 2011
Publikationsdatum: 11.07.2011
Indexliste