Sliding-Mode-Lernverfahren für neuronale Netzwerke in adaptiven Regelungssystemen
Die vorliegende Arbeit stellt einen Beitrag zur Nutzung von Online-trainierten neuronalen Netzwerken in sicherheitskritischen Regelungssystemen dar. Indem der Trainingsfehler und dessen Ableitung durch die vorgestellten Verfahren in eine stabile Ruhelage gezwungen werden, ist es möglich das Konvergenzverhalten des Netzwerks gezielt zu beeinflussen. Als Resultat dessen, kann das oftmals als Black-Box empfundene Netzwerktraining gegenüber klassischen Methoden transparenter gestaltet werden. Grundlage der vorgestellten Lernverfahren ist die Übertragung ausgewählter Sliding- Mode-Control-Konzepte erster und zweiter Ordnung auf das Training neuronaler Netzwerke. Durch die Verwendung der diesen Ansätzen zu Grunde liegenden Stabilitätsbedingungen, kann für die dargestellten Trainingsverfahren eine dynamische Berechnung der Lernrate umgesetzt werden. Die auf dieseWeise realisierbare Überführung der Netzwerkzustände in den asymptotisch stabilen Gleitzustand wird anhand ausgewählter Trainingsbeispiele demonstriert und hinsichtlich des Konvergenzverhaltens in Abhängigkeit eingeführter Stabilitätsparameter untersucht. Anwendung im Kontext der adaptiven Regelung sicherheitskritischer Systeme finden die dargestellten Trainingsverfahren als Teil einer nichtlinearen dynamischen Inversionsregelung. Zur Darstellung der generischen Natur der entwickelten Verfahren werden dabei sowohl ein Flug- als auch ein Fahrzeugregler mit Erweiterung um neuronale Netzwerke umgesetzt und in nichtlinearen Simulationen untersucht. Dabei unterstreichen die Ergebnisse sowohl die im Vergleich zu etablierten Ansätzen erhöhte Konvergenzgeschwindigkeit, als auch die gestiegene Robustheit gegenüber Parameterunsicherheiten und Systemschäden. In besondereWeise kann die vereinfachte Anwendbarkeit von neuronalen Netzwerken mit Verwendung der entwickelten Lernverfahren, durch die direkte Übertragbarkeit der Trainingsparameter zwischen den beiden vorgestellten Regelungsanwendungen, gezeigt werden. Darüber hinaus demonstrieren praktische Fahrversuche die Relevanz von adaptiven Regelungssystemen für den Ausgleich auftretender Systemfehler. Dabei wird durch die Untersuchung des Sliding-Mode-Lernverfahrens sowie dem Vergleich des Inversionsreglers mit einem nicht lernfähigen Regelungskonzept der Vorteil von schnellen und robust trainierten neuronalen Netzwerken unterstrichen.
The present thesis makes a contribution to the use of online-trained neural networks in safety critical control systems. By forcing the training error and its derivation into the stable point of origin, it is possible to directley influence the convergence behavior of the network. As a result, the network training often perceived as black box can be made more transparent compared to classical methods. The basis of the presented learning methods is the transfer of selected first and second order sliding mode control concepts to the training of neural networks. Through the use of the intrinsic stability conditions, a dynamic calculation of the learning rate can be implemented for the presented training methods. The transition of the network states into the asymptotically stable sliding mode is demonstrated by means of selected training examples and examined with respect to the convergence behavior as a function of the introduced stability parameters. Applied in the context of the adaptive control of safety-critical systems, the presented training methods become part of a non-linear dynamic inversion controller. To illustrate the generic nature of the developed methods, both a flight controller and a vehicle controller with extension of neural networks are implemented and tested in non-linear simulations. The results underline the increased speed of convergence as compared to established approaches as well as the increased robustness against parameter uncertainties and system failures. In particular, the simplified applicability of neural networks using the developed learning methods can be demonstrated. Due to the direct transferability of the training parameters between the two control applications presented, a time-consuming empirical determination of the learning rate can be avoided. In addition, practical driving tests demonstrate the relevance of adaptive control systems for the compensation of system errors. The advantage of fast and robustly trained neural networks is underlined by the study of the sliding mode learning method and the comparison of the inversion controller with a non-adaptive control concept.
Preview
Cite
Access Statistic
Rights
Use and reproduction:
All rights reserved