NEWS

Supercomputing-Konferenz

NVIDIA spricht über Blackwell und FP64

Portrait des Authors


NVIDIA spricht über Blackwell und FP64
1

Werbung

Zur Vorstellung der Blackwell-GPU sprach NVIDIA vor allem über die KI-Rechenleistung. Das HPC-Segment mit seinen Anforderungen an Datenformaten mit hoher Genauigkeit (FP64) spielte nur eine nebengeordnete Rolle. Die theoretische Rechenleistung über die Tensor-Kerne geht für FP64-Berechnungen im Vergleich zu H100 mit 67 zu 30 TFLOPS sogar zurück. Dies wurde NVIDIA im Rahmen der Vorstellung von Backwell natürlich so ausgelegt, dass man das HPC-Segment völlig vernachlässigen würde. NVIDIA versprach, dass es mit dem Whitepaper zur Blackwell-Architektur auch weitere Informationen zur HPC-Rechenleistung gäbe.

Ein Whitepaper gibt es weiterhin nicht. Dafür hat NVIDIA einige projizierte Leistungsdaten für Blackwell bei doppelter Genauigkeit veröffentlicht. Laut diesen Daten soll die Blackwell-GPUs eine um 30 % höhere FP64- und FP32-FMA-Leistung (Fused Multiply-Add) gegenüber Hopper bieten. Dies wäre allerdings auch der Fall, wenn man nur die Rechenleistung der Tensor Cores für FP64-Berechnungen hernimmt. Hier kommt die B200-GPU auf 40 TFLOPS, zwei der Chips auf GB200 auf 80 TFLOPS. Ein GH200 kommt auf 67 TFLOPS. Wie viele FP64-Recheneinheiten in den SMs stecken ist für die Blackwell-Architektur also womöglich weiterhin offen.

Da die Blackwell-GPU im Grace Blackwell Superchip GB200 zum Einsatz kommen soll, nennt NVIDIA einige Leistungsdaten zum Cadence SpectreX Simulator. In drei Anwendungsbereichen der Software soll GB200 um den Faktor 13 bis 30 schneller sein, als dies mit GH200 (Grace Hopper) der Fall ist. Diese deutlich höhere Leistung ist natürlich nicht nur durch die höhere FP64-Rechenleistung zu begründen, sondern hier spielen andere Faktoren eine maßgebliche Rolle.

Noch Ende 2024 will NVIDIA die ersten Blackwell-GPUs in Form der B100-Beschleuniger ausliefern. Es wird aber wohl bis ins Jahr 2025 dauern, bis größere Stückzahlen zur Verfügung stehen und auch bis der GB200-Beschleuniger eine größere Rolle spielen wird. 

Grace Hopper kommt in Fahrt

In diesem Jahr wird zunächst einmal GH200 eine größere Rolle spielen. 2024 sollen neun Supercomputer mit GH200 fertiggestellt werden, die zusammengenommen eine Rechenleistung von 200 EFLOPS erreichen sollen. Diese werden sowohl für HPC- wie auch KI-Anwendungen zum Einsatz kommen.

Die neuen Systeme wären:

  • EXA1-HE in Frankreich
  • Helios in Polen
  • Alps in der Schweiz
  • JUPITER in Deutschland
  • DeltaAI in den USA
  • Miyabi in Japan
  • Isambard-AI in Großbritannien
  • Isambard 3 in Großbritannien
  • ein weiteres unbekanntes System in den USA

Der Alps des Swiss National Supercomputing Centre ist heute auf den sechsten Platz als einziger Neueinsteiger in die Top Ten der schnellsten Supercomputer aufgenommen worden und setzt auf den GH200-Beschleuniger.

Quellen und weitere Links KOMMENTARE (1)