GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

HWL News Bot · 10.05.2017

GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

Wenig überraschend hat NVIDIAs CEO Jen-Hsun Huang heute auf der Keynote der GPU Technology Conference 2017 die nächste GPU-Architektur namens Volta vorgestellt. Erstmalig im März 2013 erwähnt, soll die Volta-Architektur die Basis für die zukünftigen Grafik- und Compute-Beschleuniger sein.Wie im vergangenen Jahr mit der Pascal-Architektur präsentiert NVIDIA die Volta-Architektur zunächst für den HPC-Bereich. Die Tesla V100 ist der erste GPU-Beschleuniger, der die neue Volta-Architektur einsetzt. Die technischen Daten sind beeindruckend:{razuna doubleimagefromgallery}2CFD7519BE4F451C80ACDF212D77F874 0 1{/razuna doubleimagefromgallery}21 Milliarden...

... weiterlesen

NikBerlin · 10.05.2017

Was ne fette Die-Fläche o.o

slot108 · 10.05.2017

Jo, Baby! Das liest sich aber mal lecker

ABA74 · 10.05.2017

Baaaaam!, Volta ist da

, Vorfreude ist die Schönste !

Gurkengraeber · 10.05.2017

Baaam was? Also kommt die Consumer Graka erst 2018? Dann kann ich mir ja getrost ne Ti bestellen.

pescA · 10.05.2017

"Über 100 Milliarden VIAs sind die GPU und der HBM2 über einen Interposer miteinander verbunden."

Die Zahl klingt etwas zu groß

Don · 10.05.2017

pescA schrieb:
"Über 100 Milliarden VIAs sind die GPU und der HBM2 über einen Interposer miteinander verbunden."

Die Zahl klingt etwas zu groß

VIAs ist der falsche Begriff. NVIDIA spricht von 100 Milliarden Wires, die vorhanden sind. Bei der GP100-GPU machte man diese Angabe auch schon und sprach von 50 Milliarden Wires.

NasaGTR · 10.05.2017

16GB HBM2 klingt schon fast nach wenig für so ne monströse Rechenleistung^^ Der 102 Ableger wird sowas von 4K Fähig sein.

Don · 10.05.2017

NasaGTR schrieb:
16GB HBM2 klingt schon fast nach wenig für so ne monströse Rechenleistung^^ Der 102 Ableger wird sowas von 4K Fähig sein.

Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer schlechten Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.

ssj3rd · 10.05.2017

Don schrieb:
Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.

Da fehlt ein Wort ...

hRy · 10.05.2017

Im Text steht 12nm Fertigung und in der Tabelle 14nm?

Galerie funktoniert (bei mir) nicht.

Wenn der HBM2 auf der Volta nur mit 900 MHz taktet sehe ich auf der Vega keinesfalls die erhofften 1000 MHz.

Scheint aber ein ganz schöner Klotz zu werden bei der Die Fläche. Ich rechne mit steigenden Preisen gegenüber den Einstiegspreisen von Pascal.

L0rd_Helmchen · 10.05.2017

Na dann kommt hoffentlich ein GV102 mit vollen 5120 Shadern und 16GB GDDR6 aka Titan XV.

€dit: Es sollen "12nm" sein, dass diese Angabe mit Vorsicht zu genießen ist, sollte ja aber auch klar sein...

[-Dead Eye-] · 10.05.2017

... die dann bei dem riesen Die 1.800€ kostet.

Don · 10.05.2017

Muss natürlich 12 nm heißen.

Cippoli · 10.05.2017

Es sind sogar 5376 Shader. Ein kleiner Teil wird wie üblich wegen besserer Ausbeute deaktiviert.

Bei 6 GPCs entspricht das 896 Shader (5376 : 6 = 896) je Cluster. Damit lässt sich u.a. auf GV104 spekulieren. Bei Maxwell und Pascal wurden von 6 GPCs 2 deaktiviert. Für den GV104 läuft es daher auf 3584 Shader (896 x 4 = 3584) hinaus. Dazu GDDR6 und fertig ist unser GeForce 2080 Kärtchen.

SkizZlz · 10.05.2017

Wer den Livestream nachträglich gucken will, ich hab den komplett aufgenommen

Lade ihn dann hoch, sobald alles fertig gerendert ist.
Anscheinend soll der schon bei Nvidia direkt verfügbar sein, weiß aber nicht obs da wie bei der 1080Ti wieder nur eine Zusammenfassung ist.

Ali G · 10.05.2017

Ach, Anfang 2018 ne Titan Volta wäre doch fein, irgendwas mit 5k Cuda Cores klingt auch nicht verkehrt

Pickebuh · 10.05.2017

ABA74 schrieb:
Baaaaam!, Volta ist da , Vorfreude ist die Schönste !

Ist doch nur eine Attrappe in seiner Hand, oder glaubst du wirklich, dass von Volta ein über 800mm² Die in 12nm schon jetzt gefertigt werden kann ? Das dauert noch gut 1 Jahr.

SkizZlz · 10.05.2017

Woher weißt du, dass es "nur" ne Attrappe sein soll ? :fresse2:

Don · 10.05.2017

Pickebuh schrieb:
Ist doch nur eine Attrappe in seiner Hand, oder glaubst du wirklich, dass von Volta ein über 800mm² Die in 12nm schon jetzt gefertigt werden kann ? Das dauert noch gut 1 Jahr.

Ab Q3 werden die Super Computer mit Tesla V100 bestückt, die damit geplant sind. Kurz darauf folgen die OEMs.

fdsonne · 10.05.2017

Don schrieb:
Das die Speicherkapazität im Vergleich zur Tesla P100 nicht weiter gesteigert werden konnte, liegt vermutlich an der noch immer schlechten Verfügbarkeit von HBM2 – vor allem mit mehr als vier Stacks.

Du meist mit mehr als vier Lagen!?
Weil sowohl GP100 als auch GV100 verwenden vier 4-Hi Stacks... Vega verwendet (wohl) zwei 4-Hi Stacks und kommt damit auf 8GB. Die Verfügbarkeit von 8-Hi Stacks dürfte im Moment gegen Null gehen, wenn es sowas überhaupt schon gibt.

PS: Inside Volta: The Worldâ€™s Most Advanced Data Center GPU | Parallel Forall
Wer sich für mehr Details interessiert...

Sehr interessant finde ich den hier:
"Unlike Pascal GPUs, which could not execute FP32 and INT32 instructions simultaneously, the Volta GV100 SM includes separate FP32 and INT32 cores, allowing simultaneous execution of FP32 and INT32 operations at full throughput, while also increasing instruction issue throughput."

-> 300W TDP im Power-Mode
-> 1455MHz Boost und damit 1,4899TFLop/sec FP32

Am Ende ist das aber irgendwie alles HPC Stuff... Wie viel am Ende davon im GV104 oder GV102 über bleiben wird? Abwarten... Eigentlich kann man nur hoffen, dass Vega richtig einschlägt und so NV gezwungen wird, auch den großen TopDog zu "missbrauchen" :fresse:

L0rd_Helmchen schrieb:
Na dann kommt hoffentlich ein GV102 mit vollen 5120 Shadern und 16GB GDDR6 aka Titan XV.

Wenn mich nicht alles täuscht, dann wurde bei den Infos zu GDDR6 schon ein 384Bit SI geteasert

Rechne also eher mit 12GB oder 24GB. Warscheinlich eher 12...

Nimrais · 10.05.2017

Hab mal Excel bemüht und die Anzahl CUDA Cores stieg von Tesla bis Kepler von 24 auf 192 und sank dann wieder (halbierung mit jeder Generation). Tatsächlich scheint es so, wie Cippoli schreibt dass Volta eigentlich 5376 CUDA Cores hat.

Ich hoffe, NV beschäftigt sich nicht aufgrund der "fehlenden" Konkurrenz zu sehr auf Computing und vernachlässigt die GeForce. Bei Pascal konnte man ja noch mehr als zufrieden sein. Das darf ruhig so bleiben.

fdsonne · 10.05.2017

Es bleibt @Nimrais bei 64x pro SM... Und es sind bestätigt (siehe Link auf der Dev. Page von NV) wirklich 5376 ALUs...

PS: G80 kommt auf 16x8 = 128 ALUs
G200 auf 24x10 = 240 ALUs
GF100/110 auf 32x4x4 = 512 ALUs
GK110 auf 192x3x5 = 2880 ALUs
GM200 auf 128x4x6 = 3072 ALUs
GP100 auf 64x10x6 = 3840 ALUs
GP102 auf 128x5x6 = 3840 ALUs
GV100 auf 64x14x6 = 5376 ALUs

Die letzte Zahl steht jeweils für die Anzahl der GPCs
Die mittlere (sofern vorhanden) für die Anzahl der SMs
Und die erste für die ALUs pro jeweiligem Block

Allerdings ist das, siehe oben nur die halbe "Wahrheit" bei GV100... Denn GV100 kann nach dem Post im Dev. Forum alle INT32 Einheiten zusammen mit den FP32 Einheiten nutzen... Technisch gesehen ergibt das ein nicht zu verachtenden Vorteil ggü. dem Vorgänger, sofern ein derartiger Workload anliegt.

Cippoli · 10.05.2017

Vernachlässigen würde ich nicht sagen @ Nimrais. Der hier gezeigte Top-Dog (GV100), aus dem üblicherweise die kleineren Chips geschnitzt werden, lässt diesen Schluss jedenfalls nicht zu.

Link von fdsonne: Inside Volta: The Worldâ€™s Most Advanced Data Center GPU | Parallel Forall

With 84 SMs, a full GV100 GPU has a total of 5376 FP32 cores, 5376 INT32 cores, 2688 FP64 cores, 672 Tensor Cores, and 336 texture units. Each memory controller is attached to 768 KB of L2 cache, and each HBM2 DRAM stack is controlled by a pair of memory controllers. The full GV100 GPU includes a total of 6144 KB of L2 cache. Figure 4 shows a full GV100 GPU with 84 SMs (different products can use different configurations of GV100). The Tesla V100 accelerator uses 80 SMs.

Beim GV102 und darunter dürften (wie üblich) die 2688 FP64 Cores und die nun neu dazugekommen 672 Tensor Cores wegfallen. Damit wäre man irgendwo bei 500mm² Die-Size mit 5120 FP32 Cores und GDDR6 / 384-bit.

Beim GV104 dürften dann wie bereits geschrieben zusätzlich noch 2 GPCs wegfallen --> 3584 FP32 Cores. Die-Size im Bereich um die 350mm² mit GDDR6 und 256-bit.

Vorstellbar wäre dann 1080 Ti Leistung in Form von GV104 bei niedrigeren Preis. Irgendwas um die 500,- Euro vielleicht...

Betabrot · 10.05.2017

Da freut man sich ja schon richtig auf die nächste Generation. Auch dürfte die zu einem hohen Werteverfall aktueller Karten führen (da werden sich die ganzen Titan X(P) Besitzer wieder winden *G*).

Shariela · 10.05.2017

Betabrot schrieb:
(da werden sich die ganzen Titan X(P) Besitzer wieder winden *G*).

Glaube ich weniger. Stimmt die Leistung, kaufen sie einfach Volta.

Shevchen · 11.05.2017

Über 5k Shader-Einheiten - die wird der Endkunde aber nicht unter nem Gebrauchtwagen-Preis bekommen.

Ich stimme fdsonne da mal zu, hoffentlich schlägt Vega ordentlich ein, damit Nvidia auch die dicken Teile an die "Normalos" rausgibt. Auf der anderen Seite sind 12,5 TFlops vs. 15 TFlops jetzt auch nicht der große Unterschied.

Hätte hätte Frahrradkette - AMD ne Vega Version mit 6144 Shader-Einheiten gebastelt, dann wäre Volta echt unter Druck gewesen. Sieht auf jeden Fall wie ne schöne Architektur aus.

Gibts eigentlich infos zu HBM-Versionen unterschiedlicher Hersteller?

DivineLight · 11.05.2017

Cippoli schrieb:
Vernachlässigen würde ich nicht sagen @ Nimrais. Der hier gezeigte Top-Dog (GV100), aus dem üblicherweise die kleineren Chips geschnitzt werden, lässt diesen Schluss jedenfalls nicht zu.

Link von fdsonne: Inside Volta: The Worldâ€™s Most Advanced Data Center GPU | Parallel Forall

Beim GV102 und darunter dürften (wie üblich) die 2688 FP64 Cores und die nun neu dazugekommen 672 Tensor Cores wegfallen. Damit wäre man irgendwo bei 500mm² Die-Size mit 5120 FP32 Cores und GDDR6 / 384-bit.

Beim GV104 dürften dann wie bereits geschrieben zusätzlich noch 2 GPCs wegfallen --> 3584 FP32 Cores. Die-Size im Bereich um die 350mm² mit GDDR6 und 256-bit.

Vorstellbar wäre dann 1080 Ti Leistung in Form von GV104 bei niedrigeren Preis. Irgendwas um die 500,- Euro vielleicht...

Für 500 €, würde ich sofort kaufen. In der Praxis wird es höchstens Ende 2017, eher Anfang 2018 was.

Shevchen schrieb:
Über 5k Shader-Einheiten - die wird der Endkunde aber nicht unter nem Gebrauchtwagen-Preis bekommen.

Ich stimme fdsonne da mal zu, hoffentlich schlägt Vega ordentlich ein, damit Nvidia auch die dicken Teile an die "Normalos" rausgibt. Auf der anderen Seite sind 12,5 TFlops vs. 15 TFlops jetzt auch nicht der große Unterschied.

Hätte hätte Frahrradkette - AMD ne Vega Version mit 6144 Shader-Einheiten gebastelt, dann wäre Volta echt unter Druck gewesen. Sieht auf jeden Fall wie ne schöne Architektur aus.

Gibts eigentlich infos zu HBM-Versionen unterschiedlicher Hersteller?

Wird er schon, aber erst 2018 oder 19. Der GV102 für Normalverbraucher kam auch erst vor ein paar Monaten. Es wird vermutlich recht schnell eine beschnittene Titan kommen, dasselbe Spiel wie immer.

Gäbe es etwas verlässliches würde ich das mit dem SLI glatt aufgeben. Am Ende ist es aber doch wieder ein Jahr hin bis die Modelle die für mich in Frage kämen dann auch verfügbar sind. Dazu kamen beim letzten Mal die überzogenen Preise. Bis 600 € hätte ich glatt eine X80 gekauft, aber für knapp 800 € muss da "Ti" hinterstehen.

SkizZlz · 11.05.2017

Livestream zum nachgucken den ich aufgenommen hab, kann ab und an mal zu Unterbrechungen kommen, lag aber am Stream.

Betabrot · 11.05.2017

Shariela schrieb:
Glaube ich weniger. Stimmt die Leistung, kaufen sie einfach Volta.

Meinte eher damit, das die sich winden, den Wertverlust zu akzeptieren. Sieht man ja immer wieder wenn es um den Preis zukünftiger Hardware geht (deren Preis dann natürlich im Verhältnis zur Mehrleistung steigen wird, damit man selber keinen Wertverlust erleidet

). Gerade die Titanen der Pascal Serie wird es noch härter treffen als die vorherige X, weil nur 1 GB mehr vRam ist nicht so das Argument für einen Aufpreis wie 6 GB mehr

.

PS: Ich hab mich schon mal mental von dem Wert meiner verabschiedet :P

GTC17: NVIDIA präsentiert die nächste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2

News

Experte

Enthusiast

Enthusiast

Legende

Enthusiast

[printed]-Redakteur, Tweety

Enthusiast

[printed]-Redakteur, Tweety

Urgestein

Enthusiast

Der Saft ist mit euch!

Enthusiast

[printed]-Redakteur, Tweety

Enthusiast

Urgestein

Experte

Enthusiast

Urgestein

[printed]-Redakteur, Tweety

Legende

Enthusiast

Legende

Enthusiast

Experte

Urgestein

Urgestein

DivineLight

Guest

Urgestein

Datenschutzhinweis für Youtube

Experte