Werbung
Mitte Mai, auf der GPU Technology Conference, präsentierte NVIDIA die Volta-Architektur und die dazugehörigen GPU-Beschleuniger Tesla V100. Alle Details zur Volta-Architektur sind in einem ausführlichen Artikel zu finden. Auf der Computer Vision and Pattern Recognition Conference auf Hawaii hat NVIDIA nun die ersten Modelle der PCI-Express-Variante an Forscher ausgegeben.
Allerdings konnten nicht alle Teilnehmer der sehr speziellen Konferenz eine Tesla V100 entgegennehmen. Von den 150 Teilnehmern können sich immerhin 15 glücklich schätzen den GPU-Beschleuniger nun ihr Eigen nennen zu können. Übergeben wurden die Karten von Jen-Hsun Huang, dem CEO von NVIDIA, persönlich. Auf der Verpackung der Karte findet sich dementsprechend auch eine persönliche Widmung.
Datenschutzhinweis für Twitter
An dieser Stelle möchten wir Ihnen einen Twitter Feed zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Twitter setzt durch das Einbinden des Applets Cookies auf ihrem Rechner, mit welchen sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf diesen Feed. Der Inhalt wird anschließend geladen und Ihnen angezeigt.Ihr Hardwareluxx-Team
Tweets ab jetzt direkt anzeigen
NVIDIA hat die Tesla V100 bzw. die GV100 speziell auf die Anwendung von Deep-Learning-Netzwerken ausgelegt. Dementsprechend hat NVIDIA auch spezielle Tensor Cores implementiert und erreicht damit eine Rechenleistung von 120 TFLOPS.
Erkauft wird sich diese Rechenleistung mit einem enormen Entwicklungs- und Fertigungsaufwand. Gefertigt wird die GPU in 12 nm bei TSMC. 5.120 Shadereinheiten, 640 Tensor Cores und mehr als 6 MB an L2-Cache ergeben eine GPU-Fläche von riesigen 815 mm² bei 21,1 Milliarden Transistoren. Damit bewegt sich NVIDIA an den Grenzen des derzeit technische Machbaren.
Neben der reinen Rechenleistung musste NVIDIA auch die Speicher- und Cache-Architektur deutlich ausbauen. Die 16 GB HBM2 sind mit 900 GB/s angebunden. Der L1-Cache kommt auf eine kombinierte Bandbreite von 14 TB/s. Reduziert werden konnten auch die Latenzen. All diese Maßnahmen resultieren in der enormen Leistung des GPU-Beschleunigers.
Die technischen Daten der Tesla V100 im Überblick | |||
---|---|---|---|
Modell | Tesla P100 (SMX2) | Tesla V100 (SMX2) | Tesla V100 (PCIe) |
Technische Daten | |||
GPU | GP100 | GV100 | GV100 |
Fertigung | 16 nm | 12 nm | 12 nm |
Transistoren | 15,3 Milliarden | 21 Milliarden | 21 Milliarden |
Chipgröße | 610 mm² | 815 mm² | 815 mm |
GPU-Takt (Base Clock) | 1.328 MHz | - | - |
GPU-Takt (Boost Clock) | 1.480 MHz | 1.455 MHz | 1.370 MHz |
Speichertakt | 737 MHz | 878 MHz | 878 MHz |
Speichertyp | HBM2 | HBM2 | HBM2 |
Speichergröße | 16 GB | 16 GB | 16 GB |
Speicherinterface | 4.096 Bit | 4.096 Bit Bit | 4.096 Bit |
Speicherbandbreite | 720 GB/s | 900 GB/s | 900 GB/s |
Shadereinheiten | 3.584 | 5.120 | 5.120 |
Tensor Cores | - | 640 | 640 |
FP16-Rechenleistung | 21,2 TFLOPS | 30 TFLOPS | 28 TFLOPS |
FP32-Rechenleistung | 10,6 TFLOPS | 15 TFLOPS | 14 TFLOPS |
FP64-Rechenleistung | 5,3 TFLOPS | 7,5 TFLOPS | 7 TFLOPPS |
Int8-Rechenleistung | - | 120 TFLOPS | 112 TFLOPS |
Typische Boardpower | 300 W | 300 W | 250 W |
Datenschutzhinweis für Twitter
An dieser Stelle möchten wir Ihnen einen Twitter Feed zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Twitter setzt durch das Einbinden des Applets Cookies auf ihrem Rechner, mit welchen sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf diesen Feed. Der Inhalt wird anschließend geladen und Ihnen angezeigt.Ihr Hardwareluxx-Team
Tweets ab jetzt direkt anzeigen
NVIDIA liefert die SMX2-Variante der Tesla V100 bereits an einige Supercomputer-Betreiber aus. Die Stückzahlen sollen bis zum Ende des Jahres aber noch deutlich gesteigert werden. Die PCI-Express-Variante soll ebenfalls gegen Ende des Jahres breiter verfügbar sein. Der Preis dürfte sich mindestens auf Niveau des Vorgängers bewegen und dieser kostet noch immer etwa 7.000 Euro pro Karte.