NEWS

Zukünftige AI-Hardware

Blackwell und Blackwell NVLink Switch im Einsatz

Portrait des Authors


Blackwell und Blackwell NVLink Switch im Einsatz
5

Werbung

Zur Hot-Chips-Konferenz 2024 spricht NVIDIA über einige weitere Details seiner Blackwell-Generation der KI-Beschleuniger, bzw. die dazugehörige Netzwerk-Hardware. Zunächst einmal gab es in den vergangenen Monaten immer wieder Gerüchte zu einer Verschiebung von Blackwell im Datacenter und tatsächlich musste NVIDIA eine neue Revision des Chips, bzw. Package auflegen, was einen Neustart in der Fertigung bei TSMC nach sich gezogen hat. Davon betroffen ist ausschließlich Blackwell in Form des KI-Chips – es gibt keinerlei Auswirkungen auf das, was aktuell im ersten Quartal 2025 an Gaming-Hardware erwartet wird.

NVIDIA testet die Blackwell-GPU in den eigenen Datacentern. Neben B200 und GB200 gehört die weitere Infrastruktur in Form der NVLink Switches, NVLink Switch Trays, Compute Trays, Spectrum-X800 und Quantum-X800 – beide letztgenannten sorgen für die Netzwerkverbindungen außerhalb der Rack-Infrastruktur.

Mit Blackwell wird NVIDIA die fünfte Generation des NVLink-Interconnects zum Einsatz bringen. Diese erreicht einen Datendurchsatz von bidirektionalen 1,8 TB/s. Der dazugehörige Blackwell NVLink Switch Chip kann 72 Ports bereitstellen, die allesamt miteinander verbunden sind und eine bidirektionale Bandbreite von 7,2 TB/s vorzuweisen haben. In einem Blackwell NVLink Switch Tray befinden sich zwei Blackwell NVLink Chips.

NVIDIA lässt den Blackwell NVLink Chips bei TSMC in 4NP fertigen. Die Anzahl der Transistoren liegt bei etwa 50 Milliarden und die Größe gibt NVIDIA mit mehr als 800 mm² an. Damit bewegt man sich auch hier, neben der Blackwell-GPU als solches, die ebenfalls auf mehr als 800 mm² kommt, darin aber 104 Milliarden Transistoren unterbringt, am Maximum dessen, was eine Chipfertigung aktuell leisten kann. Der Blackwell NVLink Chip kommt auf deutlich weniger Transistoren, da hier der SerDes-Bereich für die Ports viel Platz einnimmt, aber nur vergleichsweise wenige Transistoren benötigt werden, um dies umzusetzen.

Auf der Hot-Chips-Konferenz will NVIDIA noch weitere Details zur Blackwell-Architektur verraten. Bisher wurde noch kein Whitepaper oder dergleichen veröffentlicht. Ab Ende 2024, im größeren Umfang aber erst Anfang 2025, sollen dann die ersten Systeme mit Backwell-GPU auf den Markt kommen. NVIDIA plant mit HGX B100, HGX B200, DGX B200 und dem GB200 Superchip mehrere Konfigurationen.

Bereits auf der Computex zeigte NVIDIA seine Pläne für das, was nach Blackwell kommen soll. Diese wurden nun noch einmal bestätigt.

Nach der Blackwell-GPU, wie sie nun vorgestellte wurde, soll Blackwell Ultra kommen. Der Speicherausbau steigt von bis zu 192 GB auf 244 GB an. Die Speicherbandbreite bleibt identisch. Vermutlich wechselt NVIDIA hier von HBM3e mit acht Stacks auf die Variante mit derer zwölf.

Bereits durch zahlreiche Gerüchte und die Präsentation auf der Computex war bekannt, dass Rubin 2026 der Nachfolger von Blackwell sein wird. Es wird eine Rubin-GPU geben, die auf HBM4 setzen wird. Während Blackwell noch mit der Grace-CPU kombiniert wird, soll es zu Rubin den Grace-Nachfolger Vera geben. Die Bandbreite von NVLink verdoppelt sich abermals auf 3,6 TB/s und auch bei den InfiniBand-Verbindungen werden die Datenraten verdoppelt.

Eine Vergrößerung der Speicherkapazität des HBM4 setzt NVIDIA als Rubin Ultra an, die dann 2027 folgen soll.

Quellen und weitere Links KOMMENTARE (5) VGWort