NEWS

ISC 2023

Intel legt Daten des Aurora-Supercomputers offen

Portrait des Authors


Intel legt Daten des Aurora-Supercomputers offen
1

Werbung

Der Aurora-Supercomputer soll das erste System sein, welches eine Rechenleistung von 2 ExaFLOPS erreicht. Das Prestigeobjekt von Intel hat jedoch längst einige Kratzer bekommen. Ursprünglich mal mit Xeon-Phi-Beschleunigern geplant, musste Aurora schon mehrfach verschoben werden. In diesem Jahr soll es nun endlich soweit sein. Intel verkündete im Rahmen der ISC den finalen Ausbau der Hardware. Bisher war nur eine grobe Anzahl an Nodes bekannt.

Ausgestattet ist Aurora mit Prozessoren aus der Xeon-CPU-Max-Serie auf Basis des Sapphire-Rapids-Designs, die mit HBM2e-Speicher ausgestattet sind, sowie den Data-Center-GPUs Max 1550 alias Ponte Vecchio. Pro Node kommen zwei Prozessoren und vier GPUs zum Einsatz. Insgesamt wird Aurora über 10.624 Nodes und somit 21.248 Prozessoren und 63.744 GPUs verfügen. Zum Vergleich: Der aktuelle Spitzenreiter und das erste Exascale-System Frontier kommt auf 9.472 EPYC-Prozessoren und 37.888 GPUs.

Die weiteren Daten von Aurora lauten 2,21 PB/s an Spitzendatenübertragung über den Fabric-Interconnect sowie das Vorhandensein von 1,36 PB an HBM2e-Speicher bei den Prozessoren, 8,16 PB an HBM2e-Speicher bei den GPUs sowie 10,9 PB an DDR5-Speicherkapazität. Theoretisch sind alle Prozessoren und GPUs in der Lage, über ihren HBM2e-Speicher eine Bandbreite von 30,5, bzw. 208,9 PB/s zu erreichen. Dies sind jedoch nur theoretisch Zahlen.

Das dazugehörige Speicher-Subsystem DOAS (Distributed Asynchronous Object Storage) bietet eine Kapazität von 230 PB und ist auf 1.024 Nodes verteilt. Die theoretische Datenübertragungsrate liegt hier bei 31 TB/s.

Intel erwartet auf Basis von Hochrechnungen der Leistung, dass man die 2 ExaFLOPS erreichen wird. Man verweist außerdem auf die gute Skalierung bei wenigen Nodes, beispielsweise im Vergleich zu ähnlich ausgestatteten Test-Systemen wie Polaris oder Crusher. Die Hardware von Aurora steht, nun geht es darum, das System skaliert hochfahren zu können und mehr und mehr Nodes einzubinden.

Wir hatten im vergangenen Jahr die Gelegenheit, Borealis – das Testsystem für Aurora – bei Intel zu besichtigen. Borealis besteht aus 128 Nodes und war anfangs nicht mit den Prozessoren aus der Xeon-CPU-Max-Serie bestückt, sondern mit solchen ohne HBM2e-Speicher. Im Artikel werfen wir einen ausführlichen Blick auf die Art und Weise wie Intel und das Argonne National Laboratory sich auf den Aufbau von Aurora vorbereitet haben. Neben dem Borealis-System bei Intel gab es das baugleiche Sunspot-System, welches für die Hochrechnungen der Leistung verwendet wurde.

Wann genau Aurora nun vollständig in den Betrieb geht, ist noch nicht bekannt. Die endlose Geschichte sollte allerdings in den kommenden Wochen und Monaten ihr Ende finden.

Update: Aurora ist fertiggestellt

Am heutigen Tage verkündet Intel, dass das letzte von 10.624 Compute Blades nun installiert und der Aufbau des Aurora-Supercomputers damit abgeschlossen ist.

Aurora besteht aus 166 Racks, die in acht Reihen aufgestellt sind und jeweils 64 Blades enthalten. Jedes Blade wiegt in etwa 35 kg und wird mittels einer speziellen Vorrichtung in das Rack geschoben. Insgesamt verfügt nun Aurora über 10.624 Nodes und somit 21.248 Prozessoren und 63.744 GPUs.

In einem nächsten Schritt werden die Forscher des ALCF’s Aurora Early Science Program (ESP) und DOE’s Exascale Computing Project ihre Anwendungen nun vom Sunspot-Testsystem auf Aurora überführen. Dabei wird es darum gehen die Leistung von 128 Blades für Sunspot auf mehr als 10.624 Blades zu skalieren.

Quellen und weitere Links KOMMENTARE (1) VGWort