GTC17: Alle Details zur Volta-Architektur von NVIDIA

In ein paar Wochen :d:d:d:d
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wann soll Risk Produktion starten von TSMC's 12nm FFN? Oder sind die schon im Bulk Prozess :eek:

Naja, wie auch immer, Hut ab für Jensen und seinen Masterplan, noch 2020 Skynet dank EUV zu schaffen...
 
Mogelpackung hin oder her, ~800mm2 Diesize ist schon 'ne Hausnummer für sich :d Daher meine Frage, denn bei 28 und 16 waren bisher ~600mm2 Max.
 
Ich will garnicht wissen, was die Yield Rate ist, zumal der GV100 ja um 5% beschnitten ist.

Der Chip ist fast ausschließlich ein Prestigeobjekt, sowas wird der normale Konsument nie zu Gesicht bekommen.
 
Ich will garnicht wissen, was die Yield Rate ist, zumal der GV100 ja um 5% beschnitten ist.

Der Chip ist fast ausschließlich ein Prestigeobjekt, sowas wird der normale Konsument nie zu Gesicht bekommen.
472mm² GP102 3.840 Shader = 100% -vs- 3.584 Shader = ~93,4% (Erstprodukt Titan X)
610mm² GP100 3.840 Shader = 100% -vs- 3.584 Shader = ~93,4% (Erstprodukt Tesla P100)
815mm² GV100 5.376 Shader = 100% -vs- 5.120 Shader = ~95,2% (Erstprodukt Tesla V100)

Der 815mm² riesige GV100 ist ~72,7% größer als der GP102, wird aber prozentual gesehen beim 'Erstprodukt' sogar weniger beschnitten als die letzten großen 16nm GPUs.
...so schlecht kann die 12nm FFN Produktion also wahrscheinlich gar nicht laufen?!
 
Zuletzt bearbeitet:
Mich würden eher die Kosten für R&D interessieren...

Die Produktionskosten sollten hier trotz der extremen Die-Size nicht so sehr ins Gewicht fallen. AMDs Fiji GPU mit 596mm² (28nm) soll angeblich 80,- Dollar in der Produktion gekostet haben. Im Profisegment sind die Margen außerdem extrem hoch. Unterm Strich dürfte es für nVidia, selbst bei relativ schlechter Yield Rate noch ein sehr lohnendes Geschäft sein.
 
Der Chip ist fast ausschließlich ein Prestigeobjekt, sowas wird der normale Konsument nie zu Gesicht bekommen.
GV100 ist kein Prestigeprojekt sondern eine Karte für spezielle Anwendungen im DeepLearning-Bereich u.ä.
NV hat da Kunden welche die Karte bereits lieber gestern als heute hätten.
Nebenbei ist der Chip natürlich Technologieträger.

Und nein, Consumer werden keinen GV100 bekommen, wozu auch, dafür ist der Chip nicht gedacht.
 
Dann hab ich mich falsch ausgedrückt.
Prestigeobjekt gesehen bezüglich den Stückzahlen im Verhältnis zu den geforce Karten.

Die Margen werden natürlich abnormal hoch sein was bei der Zielgruppe auch kein Wunder ist.

Außerdem werden normalo Konsumenten nie so einen großen Chip zu Gesicht bekommen, wäre deutlich teurer als ne Titan, aber da es sich um Nvidia handelt, sag niemals nie...

@SFVogt wo hab ich gesagt, dass der "12"nm Prozess schlecht ist?
 
Außerdem werden normalo Konsumenten nie so einen großen Chip zu Gesicht bekommen, wäre deutlich teurer als ne Titan, aber da es sich um Nvidia handelt, sag niemals nie...
Auch wenn es sich um nVidia handelt, wäre es nichts verwerfliches den 'einfachen' Gamern solche eine absolute High-End Spitzen-GPU zur Verfügung zu stellen, wenn diejenigen bereit sind den entsprechenden Preis zu bezahlen und da wird es bestimmt den einen oder anderen Kaufinteressenten geben, welcher möglicherweise nicht deinem Preis-Leistungs-Weltbild folgt, dies aber völlig okay und legitim wäre, jeder wie er es will und kann.

@SFVogt wo hab ich gesagt, dass der "12"nm Prozess schlecht ist?
Ich schrieb nirgends das du etwas von einem schlechten 12nm Prozess gesagt hast. Es war mein Vergleich der letzten drei großen nVidia GPUs der mich zu meiner "so schlecht kann die 12nm FFN Produktion also wahrscheinlich gar nicht laufen" Theorie brachte und möglicherweise somit die Yield Rate gar nicht so 'schlecht/negativ/gering/etc' sein kann, wie es eine Aussage wie "Ich will garnicht wissen, was die Yield Rate ist, zumal der GV100 ja um 5% beschnitten ist." impliziert.
 
Der 815mm² riesige GV100 ist ~72,7% größer als der GP102, wird aber prozentual gesehen beim 'Erstprodukt' sogar weniger beschnitten als die letzten großen 16nm GPUs.
...so schlecht kann die 12nm FFN Produktion also wahrscheinlich gar nicht laufen?!

Das kann man so eigentlich nicht rechnen, denn der anteilige "Beschnitt" ist nur bedingt aussagekräftig. Schau dir mal an, wie viel Unterschied in der DIE Size zwischen GP100 und 102 sind trotz gleicher Anzahl. Der relative Flächenanteil der ALUs ist wohl beim GP100 höher als beim GP102. Weil der GP100 dedicated FP64 Einheiten mitbringt, die Fläche im Gesamten kosten und dazu auch teildeaktiviert sind. Kein Plan, ob da DIE Shots mal ausgewertet wurden... Beim GV100 ist das noch schlimmer, neben dedicated FP64 hat man dort noch die Tensor-Einheiten als Flächenanteil, die GPU kann nunmehr auch FP32/INT32 gleichzeitig, wegen dedizierten Einheiten, Pascal kann das auch nicht. Das heist, alles was man zu den Ausführungseinheiten zählt, ist flächenmäßig wohl angestiegen, der Transitorcount ist auch deutlich angezogen pro Einheit, deaktiviert man nun, wird viel mehr Reserve in vielen Teilbereichen frei... Technisch gesehen ist das aber nur die halbe Wahrheit, am Ende muss es wirtschaftlich passen.
 
Das kann man so eigentlich nicht rechnen, denn der anteilige "Beschnitt" ist nur bedingt aussagekräftig.
Was heißt 'eigentlich'? Entweder man kann oder kann nicht. 'Bedingt aussagekräftig' bedeutet immer noch 'aussagekräftig'.

Schau dir mal an, wie viel Unterschied in der DIE Size zwischen GP100 und 102 sind trotz gleicher Anzahl. Der relative Flächenanteil der ALUs ist wohl beim GP100 höher als beim GP102. Weil der GP100 dedicated FP64 Einheiten mitbringt, die Fläche im Gesamten kosten und dazu auch teildeaktiviert sind. Kein Plan, ob da DIE Shots mal ausgewertet wurden... Beim GV100 ist das noch schlimmer, neben dedicated FP64 hat man dort noch die Tensor-Einheiten als Flächenanteil, die GPU kann nunmehr auch FP32/INT32 gleichzeitig, wegen dedizierten Einheiten, Pascal kann das auch nicht. Das heist, alles was man zu den Ausführungseinheiten zählt, ist flächenmäßig wohl angestiegen, der Transitorcount ist auch deutlich angezogen pro Einheit, deaktiviert man nun, wird viel mehr Reserve in vielen Teilbereichen frei... Technisch gesehen ist das aber nur die halbe Wahrheit, am Ende muss es wirtschaftlich passen.
Es ging bei diesem Vergleich nicht um 100%ige Korrektheit auf Transistor/Fläche Ebene, dies wird viel zu komplex schon allein aufgrund des unterschiedlichen Speicherinterface, von den von dir genannten speziellen Profi-Features ganz zu schweigen. Was ich 'einfach' aufzeigen wollte sieht wer will ganz klar: trotz das der 815mm² GV100 rund 33,6% größer ist als der GP100 und ~72,7% größer als der GP102 hat dies scheinbar keinen Einfluss gehabt auf die Entscheidung auch 'nur' 256 Shader (plus das was unmittelbar dran hängt) als Sicherheit bzw. zur Steigerung der Produktionsausbeute zu deaktivieren wie bei GP100 und GP102, noch mal angemerkt: bei einer Chip Größe die es bisher kaum zu fertigen galt.
 
Was heißt 'eigentlich'? Entweder man kann oder kann nicht. 'Bedingt aussagekräftig' bedeutet immer noch 'aussagekräftig'.
Eigentlich steht dort, weil ich auf die potentielle Frage, die du mir hättest stellen können, ob ich konkrete Zahlen vorlegen kann, nur passen könnte/konnte.
Sprich ich kann es dir nicht als Fakt verkaufen, weil ich es nicht 100% selbst belegen kann... :wink:

Was ich 'einfach' aufzeigen wollte sieht wer will ganz klar: trotz das der 815mm² GV100 rund 33,6% größer ist als der GP100 und ~72,7% größer als der GP102 hat dies scheinbar keinen Einfluss gehabt auf die Entscheidung auch 'nur' 256 Shader (plus das was unmittelbar dran hängt) als Sicherheit bzw. zur Steigerung der Produktionsausbeute zu deaktivieren wie bei GP100 und GP102, noch mal angemerkt: bei einer Chip Größe die es bisher kaum zu fertigen galt.

Aber das ist ja genau der Punkt den ich meinte... Wenn angenommen nun 256ALUs auf einmal nicht mehr angenommen 5% von der gesamten Fläche sind, sondern, weil noch so und so viel dran hängt, auf einmal 20% -> wäre es doch zumindest ansatzweise nachvollziehbar, warum es eben "nur" 256 ALUs sind. Nämlich weil eben die ALUs nicht (mehr) der Part sind, den man teildeaktiviert, sondern die ALUs nur ein Teil dessen, was man teildeaktiviert...
Über die Jahre und Generationen hat sich aus meiner Sicht (auch hier wieder, ohne das dediziert nachgemessen zu haben) der Anteil der ALU Fläche ggü. dem Anteil der Gesamtfläche stark verringert! Vor allem bei NV, die ja auch mit Volta noch dedizierte FP64 Einheiten verbauen und dort sogar noch dedizierte INT Einheiten drauf sind mit dem Resultat, FP32/INT32 gleichzeitig zu können. -> all das wird doch mit skaliert.
-> für mich ist der Vergleich der absoluten ALU (FP32) Anzahl zur absoluten Gesamtfläche damit (eigentlich) nicht passend ziehbar ggü. den Vorgängergegenerationen... Weil eben der relative Anteil völlig anders ist.
Das gilt bspw. auch für Caches -> die mit Volta nach aktuellen Infos ebenso gestiegen sind. Speicherzellen sind bspw. vergleichsweise einfach zu fertigen, verschlingen aber vergleichsweise viel Fläche -> dafür kann man aber auch bequem Reserve einbauen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh