Werbung
Die heute gestartete Supercomputing 2017 (SC17) in Denver ist auch immer ein Termin für die Veröffentlichung der neuesten Version der Top500-Liste für Supercomputer. Dabei zeigt sich ein fortgesetzter Trend zur letzten Veröffentlichung im Juni: Asien baut massiv Rechenkapazitäten auf und führt die Liste mit drei Systemen weiterhin an.
Der schnellste Supercomputer hört demnach weiterhin auf den Namen Sunway TaihuLight und kommt auf eine Rechenleistung (Rmax) von 93 PFLOPS. Platz zwei belegt der Tianhe-2 (MilkyWay-2) mit 33,8 PFLOPS unter Verwendung von Intel-Xeon-E5-2692v2- und Intel-Xeon-Phi-31S1P-Beschleunigern. Der europäische Piz Daint, der in der Schweiz steht, schiebt sich auf Platz drei mit einer Rechenleistung von 19,6 PFLOPS. Die Erhöhung der Rechenleitung wird vor allem durch den Einsatz von Tesla P100 Beschleunigern erreicht.
Der erste echte Neueinsteiger ist der Gyoukou getaufte Supercomputer aus Japan. Er verwendet Xeon D-1571 mit 16 Kernen und zusätzliche Beschleuniger namens PEZY-SC2, die bisher noch nicht so weit oben in der Liste zu finden waren. Mit 19,1 PFLOPS ist ihm Piz Daint dicht auf den Fersen. Erst auf Platz vier ist der erste Supercomputer zu finden, der in den USA steht. Nächstes Jahr wollen die USA aber zwei neue Supercomputer fertigstellen, die sich ebenfalls in den ersten fünf Plätzen wiederfinden sollten.
Pezy-CS2-Beschleuniger arbeiten in Flüssigkühlung
Eine Besonderheit der neuen Nummer vier bei den Supercomputern sind die speziellen Pezy-CS2-Beschleuniger. Diese besitzen jeweils 2.048 MIMD-Einheiten (Multiple Instruction Multiple Data), die mit bis zu 1.000 MHz arbeiten können. Um effizienter zu sein, laufen sie im Gyoukou mit nur 700 MHz. Bei vollem Takt erreichen sie eine Rechenleistung von 4,1TFLOPS bei doppelter Genauigkeit, 8,2 TFLOPS bei einfacher Genauigkeit und 16,4 TFLOPS für INT8-Berechnungen bzw. halber Genauigkeit. Dazu stehen jedem Rechenkern 64 kB an L1-Instruction-Cache und 64 kB an L1-Data-Cache zur Verfügung. Hinzu kommen 2 MB an L2-Cache. Pro Beschleunigerboard stehen außerdem vier DIMM-Steckplätze für DDR4-Speicher mit einer Bandbreite von 100 GB/s zur Verfügung. Die Leistungsaufnahme pro Board liegt bei 130 W.
Das als ZettaScaler-2.0 bezeichnete Gesamtsytem umfasst mehrere Dutzend solcher Beschleunigerboards. Diese werden in speziellen Gehäusen versenkt, in denen sich eine Kühlflüssigkeit befindet. Dadurch soll die Hardware nicht nur besonders gut gekühlt werden, sondern auch als Gesamtsystem (inklusive Kühlung) besonders effizient arbeiten.
Im kommenden Jahr stehen neben zahlreichen neuen Supercomputer-Projekten auch wieder zahlreiche Updates an. Intel und NVIDIA werden im kommenden Jahr größere Stückzahlen ihrer High-End-Beschleuniger liefern können.