NEWS

NVIDIA präsentiert Quadro GP100 mit GP100-GPU und 16 GB HBM2

Portrait des Authors


NVIDIA präsentiert Quadro GP100 mit GP100-GPU und 16 GB HBM2
23

Werbung

Bisher beschränkte sich der Einsatz der GP100-GPU, also den Vollausbau der Pascal-Architektur im Zusammenspiel mit schnellem High Bandwidth Memory der 2. Generation, auf den Server-Bereich und hier vor allem auf das Training von Deep-Learning-Netzwerken. Zunächst auf den Einsatz in DGX-1-Supercomputern beschränkt, stellte NVIDIA wenige Monate später auch eine PCI-Express-Version vor, die wahlweise auf 12 oder 16 GB HBM2 zurückgreifen konnte.

Heute nun aktualisiert NVIDIA seine Quadro-Produktlinie und stellt in diesem Zuge auch ein neues High-End-Modell vor, welches die GP100-GPU einsetzt. Der Bedarf an immer höherer Rechenleistung dürfte offensichtlich sein – mehr Leistung wird in bestimmten Anwendungsbereichen immer benötigt. Bisher waren die Quadro P5000 und P6000 mit GP102- und GP104-GPU die schnellsten Vertreter diese Kategorie. Auf den Einsatz der GP100-GPU im Zusammenspiel mit HBM2 hatte NVIDIA in diesem Segment bisher verzichtet.

Die Quadro GP100, bei der ungewöhnlicherweise die GPU den Produktnamen vorgibt, arbeitet mit 3.584 Shadereinheiten. Die Rechenleistung für FP16-Berechnungen wird mit 20 TFLOPS angegeben, bei FP32-Berechnungen sollen es noch 10 TFLOPS sein und komplexe FP64-Berechnungen werden mit 5 TFLOPS berechnet. Damit liegt die Quadro GP100 in etwa zwischen der Tesla P100 als Compute-Modul im DGX-1 und der schnellen PCI-Express-Variante. Als bisher einziger GPU-Beschleuniger mit GP100-GPU bietet die Quadro P6000 aber die vollen 3.840 Shadereinheiten. Selbst die Tesla P100 verwendet "nur" 3.584 Shadereinheiten, genau wie die neue Quadro GP100.

Die 16 GB HBM2 kommt über ein 4.096 Bit breites Speicherinterface auf eine Speicherbandbreite von 720 GB/s – auch dies liegt auf Niveau der übrigen Beschleuniger mit GP100-GPU. Die Display-Ausgänge in Form von 4x DisplayPort 1.4 und 1x DVI können 4x 4.096 x 2.160 Pixel bei 120 Hz oder 4x 5.120 x 2.880 Pixel bei 60 Hz darstellen. Als Besonderheit bietet die Quadro GP100 die Möglichkeit per NVLink zusammengefasst zu werden. In einer Art SLI werden vier Links einer NVLink-Verbindung verwendet und stellen damit eine Gesamtbandbreite von 160 GB/s zur Verfügung. Die physikalische Verbindung wird dabei über zwei Brücken hergestellt, die einer SLI-Bridge ähnlich sind.

Die technischen Daten der Quadro-Serie in der Übersicht
Modell: Quadro GP100 Quadro P4000 Quadro P2000 Quadro P1000 Quadro P600 Quadro P400
Preis: - 1.100 Euro 560 Euro 390 Euro 200 Euro 160 Euro
Technische Daten
GPU: GP100 GP104 GP106 GP107 GP107 GP107
FP32-Leistung 10,3 TFLOPS 5 TFLOPS 3,0 TFLOPS 1,8 TFLOPS 1,1 TFLOPS 0,6 TFLOPS
Speichertyp:  HBM2 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Speichergröße:  16 GB 8 GB 5 GB 4 GB 2 GB 2 GB
Speicherinterface:  4.096 Bit 256 Bit 160 Bit 128 Bit 64 Bit 64 Bit
Speicherbandbreite:  720 GB/s - - - - -
Shadereinheiten:  3.584 1.792 1.024 640 384 256
TDP: 235 W 105 W 75 W 47 W 40 W 30 W
NVLink: Ja Nein Nein Nein Nein Nein

Als Ersatz für die Quadro M4000, M2000, K1200, K620 und K420 sieht NVIDIA ebenfalls einige neue Karten mit Pascal-GPU vor. Die Quadro P4000 verwendet die GP104-GPU, lässt hier allerdings nur 1.792 Shadereinheiten aktiv – die GeForce GTX 1070, ebenfalls mit GP104-GPU kommt auf 1.920 Shadereinheiten. Der Speicherausbau beträgt hier 8 GB GDDR5, die über ein 256 Bit breites Speicherinterface angebunden sind. Die vier DisplayPort-1.4-Ausgänge stellen auf allen Ports 4.096 x 2.160 Pixel bei 120 Hz oder 4x 5.120 x 2.880 Pixel bei 60 Hz dar. Ein SLI per NVLink wird hier nicht mehr angeboten, da die GP104 auch nicht mehr über die entsprechende Funktionalität verfügt. Dies gilt auch schon für die GP102-GPU.

Preislich dürfte sich die Quadro GP100 noch einmal etwas über der Quadro P6000 bewegen, die mit 24 GB GDDR5-Speicher satte 5820 Euro kostet. Alle Preise sind hier noch ohne Mehrwertsteuer angegeben.

Ebenfalls neu ist die Quadro P2000. Hier wird eine abgespeckte Variante der GP106-GPU verwendet, die 1.024 Shadereinheiten verwendet. Die 5 GB GDDR5 Speicher sind über ein 192 Bit breites Speicherinterface angebunden. Die Display-Konfiguration ist zur Quadro P4000 identisch. Bei der Quadro P1000 wird die GP107-GPU eingesetzt. 640 Shadereinheiten und 4 GB GDDR5 sollen den Ansprüchen in diesem Bereich gerecht werden. Anstatt großer DisplayPort-Ausgänge setzte NVIDIA Mini-DisplayPort ein. Die kleinste Quadro, die P600, besitzt nur noch 384 Shadereinheiten, der 2 GB GDDR5 zur Seite stehen. Auch hier sehen wir die Mini-DisplayPort-Konfiguration.

Die technischen Daten der High-End-Quadro-Serie in der Übersicht
Modell: Quadro GP100 Quadro P6000 Quadro M6000 Quadro K6000
Technische Daten
GPU: GP100 GP102 GP106 GK110
Architektur: Pascal Pascal Maxwell Kepler
Fertigung: 16 nm 16 nm 28 nm 28 nm
Shadereinheiten: 3.584 3.840 3.072 2.880
Textureinheiten: 224 240 192 240
ROPs: 128 96 96 48
Speichertyp: HBM2 GDDR5X GDDR5 GDDR5
Speichergröße: 16 GB 24 GB 12 GB 12 GB
Speicherinterface: 4.096 Bit 384 Bit 384 Bit 384 Bit
Speicherbandbreite: 720 GB/s 480 GB/s 317 GB/s 288 GB/s
ECC: Ja Nein Nein Nein
FP64: 10,3 TFLOPS 12 TFLOPS 7 TFLOPS 5,2 TFLOPS
FP32: 5,1 TFLOPS 0,375 TFLOPS 0,219 TFLOPS 1,4 TFLOPS
TDP: 235 W 250 W 250 W 225 W
NVLink: Ja Nein Nein Nein

Um die Leistungssteigerungen der vergangenen Jahre und über die GPU-Generationen einmal etwas deutlicher zu machen, haben wir in einer Tabelle die Quadro GP100 der Quadro P6000, M6000 und K6000 gegenübergestellt.

Die neuen Quadro-Karten mit Pascal-GPUs sollen ab März 2017 erhältlich sein. Preise nennt NVIDIA nur für die neuen Modelle Quadro P4000 bis Quadro P600 und diese reichen von 1.100 bis 200 Euro. Die Quadro P6000 als bisher schnellstes Modell kostet 5.820 Euro, so dass eine Quadro GP100 noch einmal deutlich darüber liegen sollte. Alle Preise werden ohne Mehrwertsteuer angegeben.

Quellen und weitere Links KOMMENTARE (23) VGWort