NVIDIA-GPU mit 7.552 CUDA-Cores zeigt sich (Update

GPU mit 7.936 Shadern)

Von Andreas Schilling
Dienstag, 03.03.2020 um 16:28 Uhr

GPU mit 7.936 Shadern)

252

In 23 Tagen, also am 23. März, soll in San Jose die GPU Technology Conference stattfinden – wenn COVID19 hier nicht noch dazwischenfunkt. Zur Keynote der Konferenz erwartet wird eine Vorstellung der nächsten Generation der HPC-Beschleuniger bzw. GPGPU-Karten. Diese sollen auf der Ampere-Architektur basieren, zu der es noch keinerlei Details gibt.

Twitterer @_rogame ist in der Online-Datenbank des Geekbench einige Ergebnisse ausfindig gemacht, welche bisher unbekannte NVIDIA-GPUs beinhalten. Zu bedenken ist an dieser Stelle, dass die Ergebnisse offenbar aus dem Oktober und November des vergangenen Jahres stammen und bisher nur unentdeckt blieben. Wie immer gilt es bei solchen Ergebnissen und Details eine gewisse Vorsicht in der Beurteilung walten zu lassen.

Satte 7.552 bzw. 6.912 CUDA-Cores (Shadereinheiten) sollen hier zum Einsatz kommen. Zum Vergleich: Eine GeForce RTX 2080 Ti bietet 4.352 Shadereinheiten, eine Quadro RTX 6000/8000 kommt auf derer 4.608 und eine Tesla V100 (mit GV100-GPU), der nominelle Vorgänger der Ampere-Karten, bringt es auf 5.120 Shadereinheiten.

Eine vermeintliche GA100-GPU mit 7.552 bzw. 6.912 Shadereinheiten besäße also fast 50 % mehr Shadereinheiten. Ob es beim Aufbau bei 64 Shadereinheiten für einen Streaming Multiprozessor (SM), sprich 118 bzw. 108 SMs bleibt, lässt sich nur vermuten. Zumindest ein Vielfaches von 64 scheint dürfte aber wieder eine Rolle spielen.

Datenschutzhinweis für Twitter

An dieser Stelle möchten wir Ihnen einen Twitter Feed zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Twitter setzt durch das Einbinden des Applets Cookies auf ihrem Rechner, mit welchen sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf diesen Feed. Der Inhalt wird anschließend geladen und Ihnen angezeigt.

Ihr Hardwareluxx-Team

Tweets ab jetzt direkt anzeigen

Unbekannt ist natürlich der weitere Aufbau. Die Volta-Architektur bietet pro SM 64 FP32-, 64 INT32- und 32 FP64-Recheneinheiten. Hinzu kommen acht Tensor-Kerne und vier Textureinheiten. RT-Kerne spielen erst in der Turing-Architektur eine Rolle. Ob diese im HPC-Segment überhaupt sinnvoll einsetzbar wären, ist nicht bekannt.

Das Geekbench-Ergebnis nennt außerdem den Speicherausbau von 24 und 47 GB. Die 47 GB dürften sich aber eher auf 48 GB beziehen und werden hier aufgrund eines unbekannten Fehlers offenbar falsch angezeigt. Bis zu 48 GB kennen wir schon von der Quadro RTX 8000. Ob hier von GDDR6 oder HBM2 die Rede ist, bleibt ebenfalls offen. HBM2 ließe sich in sechs Speicherchips zu je 8 GB auf 48 GB bringen. Bei dieser Anzahl an Chips sprächen wir dann von einem Speicherinterface mit einer Breite von 6.144 Bit. Bei 460 GB/s pro Chip sprächen wir von einer Gesamtspeicherbandbreite von 2,76 TB/s. Ob dies in dieser Form zu realisieren ist, bleibt abzuwarten.

Keine große Aussagekraft haben die Angaben zum Takt, denn es dürfte sich um recht frühe Samples handeln. Eine Tesla V100 kommt in der PCI-Express-Variante auf 1.245 MHz. Für Ampere wird der Einsatz der 7-nm-Fertigung erwartet und von daher wären auch höhere Taktraten als die angegebenen 1.110 MHz zu erwarten.

Next-Gen HPC oder GeForce

Der Speicherausbau legt nahe, dass wir hier Ampere-Chips für das HPC-Segment sehen. Ob sich daraus auch Rückschlüsse auf zukünftige GeForce-Karten machen lassen, ist nicht bekannt. Insgesamt ist die Informationslage noch recht dünn.

Hinsichtlich der Fertigung wird der Einsatz von 7 oder 8 nm erwartet. Beim Speicher dürfte im HPC-Bereich HBM2 zum Einsatz kommen, während GeForce-Karten wohl eher nicht den teuren Speicher verwenden werden. Wir werden wohl die GTC Ende März abwarten müssen, bis wir gesicherte Erkenntnisse haben.

Update: Weiteres GPU-Modell mit 7.936 Shadern

Eine weitere GPU ist in der Online-Datenbank des Geekbench aufgetaucht und zeigt 124 SMs was 7.936 Shadereinheiten bedeuten würde. Entdeckt wurde das Ergebnis von @W_At_Ar_U. Die GPU soll mit 1,1, GHz gelaufen sein, während 32 GB an Speicher verbaut waren, die mit 1,2 GHz liefen. Auch dieses Ergebnis stammt aus dem Oktober des vergangenen Jahres.

Quellen und weitere Links