Tactical and Operational Scene Understanding in a Data-Driven Approach for Highly-Automated Driving
Scene understanding is an essential building block of automated driving systems. Understanding the current and future scene is a crucial prerequisite for a legal, safe, and comfortable ride. Anticipating the future actions of the other road users allows the automated vehicle to take them into account when planning its trajectory throughout the scene. An automated driving system without a scene prediction can only react to its surroundings and not plan based on anticipated behaviors. For example, such a purely reactive system would adapt its planned future trajectory towards a pedestrian crossing the road only when the pedestrian’s current position intersects the planned trajectory of the autonomous vehicle. In contrast, an automated driving system that predicts the other traffic participants’ future behavior would be able to detect the imminent collision ahead of time and avoid it by changing the planned trajectory or applying the brakes. This work categorizes the goals of a road user into strategic, tactical, and operational goals and differentiates between tactical and operational scene understanding, correspondingly. The tactical level breaks down the strategic goal, such as reaching a specific street in time, into a sequence of steps. The operational level, in turn, translates these steps into a description of physical movements. Data-driven approaches are presented for both levels of scene understanding.
This thesis is divided into four parts, each focusing on one level of scene understanding. First, it introduces an approach to tactical scene understanding which recognizes traffic maneuvers, e.g., lane changes and turning maneuvers. In the second part, a neural network for operational scene understanding is described that predicts a traffic participant’s future trajectory. The third part of this work introduces a combination of the tactical and operational levels of scene understanding. Lastly, this thesis introduces the openDD trajectory dataset and assesses the trajectory prediction network on this dataset.
Das Szenenverständnis ist ein essentieller Bestandteil hochautomatisierter Fahrsysteme, welcher die Szene in der Fahrzeugumgebung analysiert und deren zukünftige Entwicklung prädiziert. Vor allem die Prädiktion der zukünftigen Szene ist unerlässlich, um gesetzeskonform, sicher und komfortabel fahren zu können. Ohne diese Prädiktion ist das hochautomatisierte Fahrzeug ausschließlich in der Lage, auf das aktuelle Verhalten der anderen Verkehrsteilnehmer zu reagieren, kann deren zukünftiges Verhalten aber nicht antizipieren. Ein solches Fahrzeug würde erst auf einen Fußgänger, der die Straße überquert, reagieren, wenn seine aktuelle Position mit der geplanten Trajektorie des Fahrzeugs kollidiert. Ein Fahralgorithmus, welcher die zukünftige Szene prädiziert, könnte schon reagieren, kurz nachdem der Fußgänger die Straße betritt.
Im Rahmen dieser Arbeit wird zwischen strategischen, taktischen und operativen Zielen eines Verkehrsteilnehmers unterschieden und die Problemstellung des Szenenverständnisses analog in einen taktischen und einen operativen Level aufgeteilt. Die taktische Ebene des Szenenverständnisses beschreibt die Dekomposition des strategischen Ziels, wie z.B. eine bestimmte Straße zu erreichen, in eine Sequenz von taktischen Fahrmaneuvern wie Spurwechsel und Abbiegen. Das operationale Szenenverständnis stellt die möglichen Umsetzungen der taktischen Ebene mit Hilfe von Trajektorien dar, die eine Bewegung durch die Szene definieren. Für beide Problemstellungen werden datengetriebene Ansätze vorgestellt.
Diese Arbeit ist in vier Teile untergliedert: Im ersten Teil wird das taktische Szenenverständnis durch die Maneuvererkennung anderer Verkehrsteilnehmer auf Basis von Bilddaten behandelt und ein Algorithmus mit hohen Erkennungsraten vorgestellt. Der zweite Teil thematisiert das operationale Szenenverständnis durch die Prädiktion von Trajektorien anderer Verkehrsteilnehmer mit Hilfe deren vergangener Positionen und Kartendaten. Im dritten Teil wird eine Kombination des taktischen und operationalen Szenenverständnisses beschrieben, mit dem Ziel, den Einfluss der verschiedenen Ebenen des Szenenverständnisses
zu analysieren. Der letzte Teil behandelt den openDD-Trajektoriendatensatz, und evaluiert die neuronalen Netzwerke für das operationale Szenenverständnis auf diesem.
Preview
Cite
Access Statistic
Rights
Use and reproduction:
All rights reserved