Training und Einsatz des DL-Modells mit simulierten Daten

Autoren: Harsh Vardhan Singh, Mayank Mukesh, Anisha Thakkar | Datum: 21. März 2023 | Kategorie: Automobilindustrie

Einleitung

Eine typische Entwicklungspipeline für Deep-Learning-Modelle umfasst die Datenerfassung, die Datenaufbereitung, das Modelltraining, das Leistungsbenchmarking des Modells, die Optimierung des Modells und schließlich die Bereitstellung des Modells auf dem Zielgerät. Da ein Deep-Learning-Modell die Darstellung direkt aus den Daten lernt, können wir sagen, dass die Leistung umso besser ist, je mehr Daten wir haben.

Die manuelle Erfassung einer so großen Datenmenge, die alle Varianten enthält, ist eine mühsame Aufgabe. Darüber hinaus ist die Kommentierung einer so großen Datenmenge ebenfalls sehr zeit- und arbeitsaufwändig. Um dieses Problem zu lösen, hat Nvidia einen Simulator (Isaac Simulator) entwickelt, der ML-Ingenieuren (Machine Learning) dabei helfen kann, große, kommentierte Datensätze zu erstellen.

Um einen Bilddatensatz aus dem Isaac-Simulator zu erfassen, importieren wir eine mit dem Blender-Tool erstellte Szene. Nach dem Import der Szene und anderer erforderlicher Objektmodelldateien in den Simulator können wir verschiedene Zufallseinstellungen wie Textur und Beleuchtung vornehmen, um reale Variationen in den Datensatz einzubeziehen. Der generierte Datensatz wird dann für das Training des DL-Modells mit Hilfe des von Nvidia bereitgestellten TAO-Toolkits verwendet. Das TAO-Toolkit ist eine Komplettlösung zum Trainieren, Erweitern und Optimieren des Modells. Man kann das mit dem TAO-Toolkit trainierte Modell im .trt- oder .plan-Format exportieren, das auf dem TensorRT- oder Triton-Ausführungsserver ausgeführt werden kann. In diesem Blog werden wir uns diese Tools im Detail ansehen und erfahren, wie wir sie für das Training und den Einsatz eines Deep-Learning-Modells nutzen können.

Training und Einsatz des DL-Modells mit simulierten Daten

Erstellung von Datensätzen

Wir haben einen synthetischen Trainingsdatensatz mit Blender und dem Isaac-Simulator erstellt. Blender ist ein kostenloses und quelloffenes 3D-Erstellungsprogramm, das die gesamte 3D-Pipeline unterstützt, einschließlich Modellierung, Rigging, Animation, Simulation und Rendering. Die mit Blender erstellte Szene wird dann in den Isaac-Simulator importiert. NVIDIA Isaac Sim™ ist eine skalierbare Robotersimulationsanwendung und ein Tool zur Generierung synthetischer Daten, das umfangreiche Tools für die Generierung synthetischer Daten bietet, wie z. B. Domain Randomization, Ground Truth Labeling, Segmentierung und Bounding Boxes.

Weitere Einzelheiten zur Erzeugung synthetischer Daten mit Isaac sim finden Sie im folgenden Blog: Vom Konzept zur Fertigstellung: Rationalisierung der 3D-Szenenerstellung für die Robotik mit Nvidia Isaac Sim und Blender

 

Bei der Arbeit mit einem nichtlinearen System wie einem AMR müssen wir einige Änderungen am Kalman-Filter-Algorithmus vornehmen. Um sicherzustellen, dass unsere Zustandsdarstellung nach jedem Vorhersage- und Aktualisierungsschritt weiterhin einer Gaußschen Verteilung entspricht, müssen wir die Bewegungs- und Messmodelle linearisieren. Dies geschieht durch die Verwendung von Taylor-Reihen, um die nichtlinearen Modelle als lineare Modelle zu approximieren. Diese Erweiterung des Kalman-Filters wird als erweiterter Kalman-Filter bezeichnet.

Modellschulung mit TAO-Toolkit

Nvidia bietet eine Low-Code-Lösung an, die es Entwicklern und Unternehmen ermöglicht, das Training und die Optimierung von Modellen zu beschleunigen: das TAO-Toolkit. Das TAO-Toolkit hilft Einsteigern, indem es die Komplexität von KI-Modellen und Deep-Learning-Frameworks abstrahiert. Mit dem NVIDIA TAO Toolkit können wir die Leistung des Transfer-Learnings nutzen und die von NVIDIA vortrainierten Modelle mit unseren eigenen Daten feinabstimmen und das Modell für die Inferenz optimieren.

Das TAO-Toolkit bietet zahlreiche vortrainierte Computer Vision Modelle für Objekterkennung, Bildklassifikation, Segmentierung und Konversations-KI. Modelle, die mit dem TAO-Toolkit erzeugt werden, sind vollständig kompatibel mit und beschleunigt für TensorRT, was eine maximale Inferenzleistung ohne zusätzlichen Aufwand gewährleistet.

Unsere Trainingspipeline nutzt das Nvidia TAO-Toolkit für eine effiziente und schnelle Entwicklung des Modells. Der Arbeitsablauf von der Erzeugung synthetischer Daten bis zum Einsatz ist unten dargestellt:

Modellschulung mit TAO-Toolkit

Beim Training des Modells mit dem TAO-Toolkit ist zu beachten, dass alle Ressourcen/Assets, die in der gesamten TAO-Pipeline verwendet werden, in den TAO-Docker-Container eingebunden und von dort aus genutzt werden. Während des Trainings werden Umgebungsvariablen sowohl für den Pfad zum Systemverzeichnis (Quelle) als auch für den Pfad zum TAO-Docker-Container (Ziel) erstellt. Die Datei "mount.json" enthält die Quell- und Zielpfade.

Beim Training ist es wichtig, dass die Dimensionen in allen Spezifikationsdateien bis zum Ende gleich bleiben. Eine zwischenzeitliche Änderung der Dimensionen führt zu falschen Ausgabemetriken (Precision, Recall, MIOU) und schlechter Modellleistung.

Für die Objekterkennung haben wir DetectNetV2 ausgewählt und anhand synthetischer Daten, die mit dem Isaac-Simulator erzeugt wurden, eine Feinabstimmung vorgenommen. Die trainierte Modelldatei wird exportiert und auf der Hardware zur Inferenz eingesetzt. Das Blockdiagramm der Trainingspipeline ist unten dargestellt:

Modellschulung mit TAO Toolkit1

Bereitstellung auf Edge-Geräten

 

Gazebo ist eine ROS 2-fähige Simulationsumgebung, die viel Flexibilität beim Testen von Robotersystemen bietet. Sie ermöglicht es uns, Sensorrauschen einzufügen, verschiedene Reibungskoeffizienten auszuprobieren und die Genauigkeit der Radausleser zu verringern, wodurch wir realistische Szenarien nachstellen können, die die Zustandsschätzung eines AMR in der realen Welt beeinflussen würden.

Um die Leistungsfähigkeit der Sensorfusion zu quantifizieren, können wir einen Schleifenschließtest durchführen, bei dem das AMR auf einer zufällig geschlossenen Bahn gefahren wird, sodass der Start- und Endpunkt des AMR identisch sind. Anschließend können wir die vom EKF nach der Fusion von IMU und Raddrehgebern durchgeführte Zustandsschätzung grafisch darstellen und mit der Zustandsschätzung vergleichen, die auf der Grundlage der Rohdaten der Raddrehgeber erfolgt ist. Im Idealfall soll der geschätzte Zustand unseres AMR für x, y und Gierwinkel jeweils (0, 0, 0) angeben.

Sobald das Modell die gewünschte Genauigkeit erreicht und alle Leistungsprüfungen bestanden hat, wird es in eine .trt- oder .plan-Datei exportiert. Das exportierte Modell kann auf Nvidia-Edge-Geräten für Echtzeit-Inferenzen eingesetzt werden. Die Inferenzpipeline erwartet RGB-Bilder von der Kamera in Echtzeit und wendet die erforderliche Vorverarbeitung auf das Bild an, um es mit der Eingabegröße des Modells kompatibel zu machen und die gewünschte Leistung/den gewünschten Durchsatz zu erreichen. Das folgende Blockdiagramm zeigt den Inferenzfluss:

Bereitstellung auf Edge-Geräten

Schlussfolgerung und künftiger Anwendungsbereich

In diesem Blog haben wir gesehen, wie wir schnell ein DL-Modell auf synthetischen Daten trainieren und es für Echtzeit-Inferenz einsetzen können. Wir haben das Modell für die Erkennung von Pappkartons auf synthetischen Daten trainiert und eine Genauigkeit von über 90 % in der realen Welt erreicht. In Zukunft möchten wir mit synthetischen Daten und realen Daten experimentieren und sehen, wie sich dies auf die Gesamtleistung des Modells auswirkt.

Schlussfolgerung und künftiger Anwendungsbereich

Autoren

Pallavi Pansare
Pallavi Pansare
ManMohan Tripathi
ManMohan Tripathi

Bericht herunterladen

Beispielbericht herunterladen

Broschüre herunterladen

Nehmen Sie noch heute Kontakt auf

Vereinbaren Sie ein 30-minütiges Beratungsgespräch mit unseren Experten für Automobil-Lösungen

Nehmen Sie noch heute Kontakt auf

Vereinbaren Sie ein 30-minütiges Beratungsgespräch mit unserem Experten für Batteriemanagementlösungen

Nehmen Sie noch heute Kontakt auf

Vereinbaren Sie ein 30-minütiges Beratungsgespräch mit unseren Expertenfür Industrie- und Energielösungen

Nehmen Sie noch heute Kontakt auf

Vereinbaren Sie ein 30-minütiges Beratungsgespräch mit unseren Experten für die Automobilbranche

Nehmen Sie noch heute Kontakt auf

Vereinbaren Sie ein 30-minütiges Beratungsgespräch mit unseren Experten

Bitte geben Sie unten Ihre Daten ein und fordern Sie einen Musterbericht an

Referenzdesigns

Unsere Arbeit

Innovativ sein

Verwandeln.

Maßstab

Partnerschaften

Unternehmen

Produkte & geistiges Eigentum

Datenschutzerklärung

Unsere Website speichert Cookies auf Ihrem Gerät, um Ihr Nutzererlebnis zu verbessern und unsere Website zu optimieren. Erfahren Sie mehr über die von uns verwendeten Cookies und wie Sie diese deaktivieren können. Cookies und Tracking-Technologien können zu Marketingzwecken eingesetzt werden.

Wenn Sie auf „Akzeptieren“ klicken, stimmen Sie der Speicherung von Cookies auf Ihrem Gerät sowie unserer Nutzung von Tracking-Technologien zu. Klicken Sie unten auf „Mehr erfahren“, um weitere Informationen und Anweisungen zur Deaktivierung von Cookies und Tracking-Technologien zu erhalten. Die Zustimmung zu Cookies und Tracking-Technologien ist freiwillig; ihre Deaktivierung kann jedoch dazu führen, dass die Website nicht ordnungsgemäß funktioniert und bestimmte Werbeanzeigen für Sie weniger relevant sind.
Wir respektieren Ihre Privatsphäre. Lesen Sie unsere Datenschutzerklärung.

Unbedingt erforderliche Cookies

Unbedingt erforderliche Cookies sollten stets aktiviert sein, damit wir Ihre Präferenzen für die Cookie-Einstellungen speichern können.