NEWS

NVIDIA präsentiert Drive PX Pegasus

2x Xavier SoC + 2x Next-Gen GPU für 320 TFLOPS

Portrait des Authors


2x Xavier SoC + 2x Next-Gen GPU für 320 TFLOPS
2

Werbung

Auf der Keynote der GTC Europe in München hat NVIDIA ein neues Compute-Modul für den Automotive-Bereich vorgestellt. Das Drive PX Modul namens Pegasus verwendet dabei bis zu zwei Xavier-SoCs und zwei dedizierte GPUs auf Basis der nächsten Grafik-Architektur, die bisher noch keinen Namen hat. Drive PX Pegasus soll dabei die Rechenleistung für das Level 5 des autonomen Fahrens, und ist zusätzlich als ASIL D (Automotive Safety Integrity Level D), zertifiziert. Dies bedeutet, dass auch kritische Anwendungen aufgrund verschiedener Sicherheitssysteme darauf laufen dürfen. Aktuell arbeiten Fahrzeuge wie die von Tesla oder der neue Audi A8 auf dem autonomen Level 3.

Wichtigstes Merkmal des Drive PX Pegasus ist die Rechenleistung von 320 TOPS (Tera Operationen pro Sekunde) bzw. einfachen INT8-Berechnungen, wie sie für das Training und Inferencing von Deep-Learnging-Netzwerken notwendig sind. Erreicht wird dies durch den Einsatz von zwei bereits bekannten Xavier-SoCs und zwei GPUs mit bisher unbekannter GPU-Architektur.

Mehrere Dutzend Sensoren sind für ein vollautomatisches Fahren notwendig. Dazu gehören Kameras, Radar, Lidar, Ultraschall und vieles mehr. Alle diesen Daten müssen in Sampleraten von meist hunderten Abfragen pro Sekunde verarbeitet werden. Die Verarbeitung all dieser Daten benötigt natürlich auch eine entsprechende Rechenleistung – nicht nur durch das Training des Deep-Learning-Netzwerkes, welches bei den Herstellern selbst in Rechenzentren erfolgt, sondern auch schon durch die Auswertung der entsprechenden Daten.

Ein alter Bekannter: Xavier

Vor genau einem Jahr präsentierte NVIDIA den Xavier-SoC. Dieser kombiniert acht CPU-Kerne mit einer dedizierten Volta-GPU mit 512 Shadereinheiten sowie einigen SFUs (Special Function Units), wie Signalprozessoren, die zwei 8K-Videostreams mit HDR encodieren und analysieren können. Die Rechenleistung für einen Xavier-SoC gibt NVIDIA mit 30 TOPS an – bei einer Leistungsaufnahme von ebenfalls 30 W. Die ersten Module mit Xavier-SoC sollen nun gegen Ende des Jahres ausgeliefert werden.

NVIDIA musste den eigenen Terminplan etwas nach hinten verschieben. War Xavier ursprünglich für Mitte 2017 geplant, wird es nun etwas später. Zwischenzeitlich drehte man aber auch an der Leistungsschraube von Xavier. Es werden nun 30 anstelle von 20 TOPS erreicht. Dazu müssen aber auch 30 anstatt 20 W aufgewendet werden.

Next-Gen GPU: Nach Volta kommt ein großes Fragezeichen

Mit Drive PX Pegasus kombiniert NVIDIA bis zu zwei Xavier-SoCs. Interessanter aber ist, dass NVIDIA hier erstmalig den Nachfolger der Volta-Architektur erwähnt, denn neben den beiden SoCs sollen auch zwei dedizierte GPUs in Drive PX Pegasus zum Einsatz kommen, die auf der "Next-Gen GPU" basieren. Einen Namen hat NVIDIA dafür offenbar noch nicht.

Wir konnten in Gesprächen im Nachgang aber folgendes in Erfahrung bringen: Die Next-Gen GPU wird weiterhin die Strategie der dedizierten Hardware für AI und Deep Learning fortsetzen. Die Tensor Cores, erstmals eingeführt mit der Volta-Architektur, werden also weiterhin eine wichtige Rolle spielen. Derzeit unklar ist, ob man die Anzahl der Tensor Cores pro Streaming Multiprozessor im Vergleich zur Volta-Architektur geändert hat. Hier waren es noch acht Tensor Cores pro SM und im Vollausbau demnach 640 für eine Rechenleistung von 120 TOPS.

Diese 120 TOPS entsprächen demnach in etwa auch der Rechenleistung, welche die Next-Gen GPU erbringen müsste, um im Drive PX Pegasus Modul die rechnerisch erforderliche Leistung zu erbringen. Von den 320 TOPS von Drive PX Pegasus, lassen sich 2x 30 TOPS durch die Xavier-SoCs abziehen. Die übrig gebliebenen 260 TOPS teilen sich zu jeweils 130 TOPS auf die beiden GPUs auf – eine Tesla V100 kommt alleine durch die Tensor Cores auf 120 TOPS.

Allerdings verbrauchen die Tesla-V100-Karten mit 150 bis 300 W deutlich mehr Energie, um in dieser Form in einem Fahrzeug eingesetzt zu werden. Zudem sind diese auf das Training von Deep-Learning-Netzwerken ausgelegt, in einem Fahrzeug sollte aber nur noch das Inferencing stattfinden. NVIDIA gibt für das Drive PX Pegasus eine Leistungsaufnahme von 500 W an. Diese lassen sich sicherlich nicht mehr passiv kühlen, sodass NVIDIA sich hier zusammen mit den Autoherstellern etwas wird einfallen lassen müssen. NVIDIA spricht bei der höchsten Ausbaustufe von Drive PX Pegasus von einer aktiven Kühlung.

Zusammen mit der eigentlichen Rechenleistung müssen die zahlreichen Sensoren natürlich auch ihre Daten an das Modul liefern können. Dazu stehen 4x 10GbE, 8x 1GBE und 16x 100 MbE zur Verfügung.

Wir wollen uns das von NVIDIA veröffentlichte Rendering des Drive-PX-Pegasus-Modules auch noch einmal genauer anschauen. Klar sollte dabei sein, dass es sich um grundsätzlich nur um eine symbolische Darstellung handelt. Dennoch dürften einige Elemente dem entsprechen, wie die Chips und dazugehörigen Komponenten auch tatsächlich aussehen werden.

Links sind die beiden neuen GPUs zu sehen. Diese basieren wieder auf dem SMX2-Modul. Neben der GPU sehen wir aber keinen High Bandwidth Memory mehr, sondern sechs Speicherchips, die einem GDDR5-Speicher deutlich näher kommen. Diese Art Speicher sehen wir offenbar auch für die Xavier-SoCs (rechts). NVIDIA gibt die kombinierte Bandbreite für das gesamte Modul mit 1 TB/s an. Zum Vergleich: Eine NVIDIA Tesla V100 kommt mit HBM2 bereits auf 900 GB/s. Demnach ist eine kombinierte Bandbreite von 1 TB/s eigentlich nur mit klassischem GDDR5-Grafikspeicher denkbar, dessen Bandbreite je nach Speicherinterface und Anzahl der Speicherchips zwischen 256 und 384 GB/s liegt. Auf vier GPU-Beschleuniger verteilt ergibt dies die angegebenen 1 TB/s.

Drive PX Pegasus in der 2. Jahreshälfte 2018 - NVIDIA testet auch in Deutschland

Forschungseinrichtungen und Partner in der Automotive-Industrie steht Drive PX Pegasus ab der 2. Jahreshälfte 2018 zur Verfügung. Early Samples sollen Ende des Q1 2018 ausgeliefert werden. Bis wir eine solche Hardware in ersten Fahrzeugen sehen werden, wird es aber noch einige Jahre dauern. Zur GPU Technology Conference 2018 erwarten wir uns nähere Informationen zur GPU-Architektur nach Volta. Allerdings stehen aktuell auch noch einige technischen Daten zur Volta-Architektur im Consumerbereich aus.

Um die eigene Hardware anpassen und die Softwareschnittstellen testen zu können, hat NVIDIA eines der eigenen Testfahrzeuge inzwischen nach Deutschland überführt. Hier bewältigt es bereits Kilometer um Kilometer, um Testdaten für NVIDIA zu gewinnen. Erkenntnisse aus den Tests von den Straßen der USA müssen nicht unbedingt auch hierzulande hilfreich sein – zu groß sind die Unterschiede in der Kennzeichnung und Beschaffenheit der Straßen.

Die am Fahrzeug angebrachten Sensoren sind auf eben diesen Fahrzeugtyp von Chrysler kalibriert, NVIDIA arbeitet aber mit deutschen Herstellern zusammen, die ihre Fahrzeugtypen mithilfe des NVIDIA-Testfahrzeugs simulieren können. Wird die Drive-PX-Plattform dann auch vom Hersteller selbst getestet, erfolgt dies in eigenen Fahrzeugen.

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen