Training autonomer Fahrzeuge und „Data Engine“ von Tesla erklärt

Beim Gedanken daran, wie man das Autofahren lernt, fühlt sich mancher in seine Teenagerzeit zurückversetzt, mit Papa oder Mama auf dem Beifahrersitz. Für Ingenieure von autonomen Fahrzeugen bedeutet Fahrenlernen das Eintauchen in enorme Datensätze, das Programmieren komplexer neuronaler Netzwerk-Algorithmen und langsame Fortschritte, Schritt für Schritt, über Jahre hinweg.

Beim Training autonomer Fahrzeuge nutzen große Expertenteams aus Hard- und Softwareingenieuren sowohl Daten als auch Simulationssysteme und hochmoderne Infrastrukturen im Bereich künstliche Intelligenz (KI), um autonome Fahrzeuge für den Straßenverkehr fit zu machen.

Tesla ist führend bei autonomen Fahrzeugen und hat eine komplexe Maschinenlern-Infrastruktur entwickelt, um seine „Full-Self-Driving (FSD)“-Computer zur Bewältigung praktischer Herausforderungen zu trainieren und gleichzeitig die Tesla-Schulungsdatensätze zu verbessern.

Hier untersuchen wir die Grundlagen des Ablaufs der „Data Engine“ von Tesla, um zu sehen, wie die von den Tesla-Autos erzeugten Daten retroaktiv wieder in das Training derselben Autos für die Zukunft einfließen.

Was ist die „Data Engine“ von Tesla?

Teslas „Data Engine“ ist eine tragende Säule im Rennen zur vollständigen Autonomie. Dieser einzigartige Daten-Workflow nutzt reale Fahrbeispiele zum interaktiven Ausführen von Maschinenlern-Algorithmen, die dann zum Training von neuronalen Netzwerken zum autonomen Fahren genutzt werden.

Tesla tut dies auf eine ganz besondere Weise: Jedes Automobil ist mit einem FSD-Computer ausgestattet, auf dem gleichzeitig zwei FSD-Systeme laufen. Ein FSD-Computer dient zum Fahren und Steuern des Fahrzeugs im Autopilot-Modus. Der andere FSD-Computer läuft ständig im „Schattenmodus“.

Der Schattenmodus läuft so, als ob er das Auto tatsächlich kontrollieren würde. Wenn der Fahrer anderes reagiert als der Computer oder wenn das neuronale Netzwerk signalisiert, das es nicht weiß, was es in der aktuellen Situation tun soll, dann als Ungenauigkeit aufgezeichnet. Da Tesla diese Ungenauigkeiten im Speicher ablegt, können sie retroaktiv gesammelt werden.

Angenommen, Tesla erkennt genügend Ungenauigkeiten unter ähnlichen Umständen. In diesem Fall kann Tesla dann nach ähnlichen Fahrbedingungen in anderen Autos der Tesla-Flotte suchen, auch wenn es keine Ungenauigkeit erkannte.

Tesla kann dann Beispiele mit ähnlichem Kontext „ernten“. Mithilfe dieses neu zusammengestellten, gut gekennzeichneten Datensatzes kann Tesla sein neuronales Netzwerk neu trainieren, um besser auf das Szenario zu reagieren, in dem diese Ungenauigkeiten aufgetreten sind. Nachdem das neuronale Netzwerk neu trainiert wurde, kann es das überarbeitete neuronale Netzwerk zum autonomen Fahren im „Schattenmodus“ einsetzen und neue Datenbeispiele für weitere Ungenauigkeiten sammeln.

Datensammlung von Tesla im Überblick

Die visuelle Repräsentation der nachfolgenden Abbildung veranschaulicht die zyklische Natur der Tesla-Strategie zur Datensammlung und Iteration. Zunächst werden Daten an der Quelle gesammelt (dem FSD-Computer im Tesla-Fahrzeug). Danach identifiziert das Fahrzeug eine Ungenauigkeit. Diese Ungenauigkeit gelangt in die „Unit Tests“ von Tesla. Dort wird sie auf ihre Berechtigung geprüft, um auszuschließen, dass sie auf Unzulänglichkeiten des menschlichen Fahrers zurückzuführen ist.

Wird die Ungenauigkeit als berechtigt angesehen, fordert Tesla dann von seiner Flotte weitere Beispiele dafür an, wo die Ungenauigkeiten gefunden wurden. Diese Beispiele werden dann korrekt durch menschliche Mitarbeiter gekennzeichnet und zum Training des neuronalen Netzwerks verwendet. Das Netzwerk wird dann erneut auf die Datenquelle angewendet, um weitere Ungenauigkeiten zu sammeln.

Wettbewerb in der Automobilindustrie

Als Tesla an seinem Autonomy Day im Jahr 2019 erstmals eine „Data Engine“ vorstellte, sorgte dies natürlich für Neid in der übrigen Automobilbranche

Der CEO von Audi sagte 2020 In einem Gespräch mit Reuters: „Tesla hat in Sachen Computing, Software-Architektur und autonomes Fahren einen Vorsprung von zwei Jahren.“ Diese massive Infrastruktur für Datenerzeugung, Sammlung von Trainingsmaterialien, Erkenntnisgewinnung, iteratives Neutraining, Deployment und Neuausführungsmechanismus war extrem gut konzipiert.

Die „Data Engine“ bot unterstützende Integrationen auf jedem Schritt der Datenkette, was eine grundlegend neu konzipierte Architektur zum Sammeln, Übertragen und Verarbeiten von Daten erforderlich machte. So können Tesla-Automobile beispielsweise die Drahtlosverbindung zur zentralen Datenbank von Tesla funktional unterstützen, ebenso die Berechnung und Datenerfassung im Schattenmodus – und das alles parallel zur Ausführung der produktionsseitig eingesetzten Algorithmen zum autonomen Fahren. Bei der Vorstellung hatte kein anderer Automobilhersteller eine so robuste und ausgereifte Infrastruktur zur Erfassung von Fahrzeugdaten wie Tesla.

Dezentrale Fallidentifizierung und Iteration

Zu den wichtigsten Funktionen der Data Engine zählt ihre Fähigkeit zur Erkennung von Ungenauigkeiten zwischen menschlichem Fahren oder den produktionsseitig angewendeten neuronalen Netzwerken und dem als Schattensystem laufenden neuronalen Netzwerk. Tesla nutzte bei der Präsentation an seinem Autonomy Day das Beispiel von Fahrungenauigkeiten in Anwesenheit von Fahrrädern auf der Fahrbahn, um die Komplexität der Maschinenlern-Infrastruktur von Tesla und ihrer Fähigkeit zum Erkennen solcher Ungenauigkeiten zu veranschaulichen.

In seinen produktionsseitigen neuronalen Netzwerken hatte Tesla festgelegt, Fahrräder zu meiden, weil diese meist von Menschen gefahren werden. Falls ein Tesla-Automobil eine Kollision mit einem von zwei Objekten für unausweichlich hielte, würde es das Fahrrad meiden und stattdessen die Kollision mit einem anderen Automobil in Kauf nehmen, da dieses seinen Fahrer besser schützt als das Fahrrad.

Tesla bemerkte jedoch, dass sich Fahrräder manchmal in der Mitte der Fahrbahn, in großer Nähe zu anderen Autos befanden, wodurch das als Schattensystem arbeitende neuronale Netzwerk anzeigte, dass es im Vergleich zum Fahrerverhalten nicht wusste, was zu tun war. Vielleicht wäre Tesla auch aufgefallen, dass wenn das neuronale Netzwerk des produktionsseitigen Autopiloten ausgeführt wurde und ein Fahrrad „in der Mitte der Fahrbahn“ identifiziert wurde, menschliche Fahrer eingegriffen und den Kurs des Autos „korrigiert“ hätten.

Als Tesla benachrichtigt wurde, überprüften die für die Datenkennzeichnung zuständigen Techniker die Ungenauigkeit und stellten fest: Sie ereigneten sich, als Autos mit Fahrradträgern und darauf angebrachten Fahrrädern ausgestattet waren.

Für Menschen wäre dieses Ereignis einfach ein neues Auftreten gewesen. Aber diese Trainingsdaten deckten eine kritische Herausforderung für das produktionsseitig eingesetzte neuronale Netzwerk in selbstfahrenden Autos auf. In diesem Szenario fragte Tesla dann seine Flotte FSD-fähiger Fahrzeuge ab, um nach anderen Ereignissen zu suchen, bei denen ein Fahrrad auf oder in der Nähe eines Autos war.

Diese Datenbeispiele wurden an die für die Datenbezeichnung zuständigen Techniker gesendet, die korrekt ein tatsächliches Fahrrad, ein am Heck eines Autos montiertes Fahrrad, ein auf einem Dachträger angebrachtes Fahrrad oder keine der genannten Möglichkeiten identifizierten. Mithilfe des neu gesammelten und gekennzeichneten Datensatzes war es möglich, das neuronale Netzwerk der Beta-Version mit den Maschinenlern-Rechenzentren von Tesla neu zu trainieren und ihn flottenweit neu bereitzustellen, damit es im Schattenmodus ausgeführt und iteriert wurde.

Tesla kann mit seiner Data Engine neue Softwareversionen anhand der Erkenntnisse seiner Schattenmodus-Bereitstellungen und anhand schneller Trainingsiterationen erstellen. Das Geniale an der Datensammlungsinfrastruktur von Tesla besteht darin, dass sie reale Datenbeispiele auflistet und menschliche Fahrer zum Trainieren ihrer Maschinenlernmodell einsetzt. Letztlich beschleunigt die „Data Engine“ von Tesla das Training neuronaler Netzwerke durch das schnelle Sammeln gut gekennzeichneter, realer Trainingsdaten selbstfahrender Automobile und die anschließend Nutzung zur Durchführung iterativer Maschinenlern-Versuche.

Datensammlung von Tesla mit Gewinnerpotenzial

Andere Unternehmen im Automobilsektor haben proprietäre Methoden zum Training ihrer autonomen Fahrzeuge, die aber alle nicht an die Größenordnung von Tesla heranreichen. Mit Autos auf der ganzen Welt kann Tesla mehr Fahrsicherheitsdaten und mehr Edge-Case-Ungenauigkeiten sammeln und diese zum Anlernen seiner neuronalen Netzwerke nutzen.

Viele andere Unternehmen haben extrem robuste Mechanismen zum Trainieren von Simulationen und zur Sammlung von Daten. Aber oftmals ist deren Arbeitsfeld auf eine einzige Stadt oder Region beschränkt. Ganz gleich, die von autonomen Autos – derzeit nur semi-autonome Fahrzeuge – erzeugten Daten sind der unvermeidliche Türöffner zur vollständigen Autonomie von Automobilen.


ArrowPerks-Loyalty-Program-Signup-banner-DE


Neue Beiträge

Leider ergab Ihre Suche kein Ergebnis

Aktuelles über Elektronikkomponenten­

Wir haben unsere Datenschutzbestimmungen aktualisiert. Bitte nehmen Sie sich einen Moment Zeit, diese Änderungen zu überprüfen. Mit einem Klick auf "Ich stimme zu", stimmen Sie den Datenschutz- und Nutzungsbedingungen von Arrow Electronics zu.

Wir verwenden Cookies, um den Anwendernutzen zu vergrößern und unsere Webseite zu optimieren. Mehr über Cookies und wie man sie abschaltet finden Sie hier. Cookies und tracking Technologien können für Marketingzwecke verwendet werden.
Durch Klicken von „RICHTLINIEN AKZEPTIEREN“ stimmen Sie der Verwendung von Cookies auf Ihrem Endgerät und der Verwendung von tracking Technologien zu. Klicken Sie auf „MEHR INFORMATIONEN“ unten für mehr Informationen und Anleitungen wie man Cookies und tracking Technologien abschaltet. Das Akzeptieren von Cookies und tracking Technologien ist zwar freiwillig, das Blockieren kann aber eine korrekte Ausführung unserer Website verhindern, und bestimmte Werbung könnte für Sie weniger relevant sein.
Ihr Datenschutz ist uns wichtig. Lesen Sie mehr über unsere Datenschutzrichtlinien hier.