NEWS

Ampere Altra

80 Kerne bei 210 W für den HPC-Einsatz (Update)

Portrait des Authors


80 Kerne bei 210 W für den HPC-Einsatz (Update)
0

Werbung

Ampere hatte bereits in der Vergangenheit Serverprozessoren auf Basis von ARM-Kernen vorgestellt. Der Ampere 8180 beispielsweise bietet 32 Kerne und kommt in einer Workstation zum Einsatz. Mit dem Altra läutet das Unternehmen nun eine neue Generation der HPC-Chips mit ARM-Design. Angekündigt hat man einen solchen Prozessor im November des vergangenen Jahres – nun ist es soweit.

Der Ampere Altra bietet 80 ARM-v8.2+-Kerne in einem Sockel. In der Dual-Sockel-Variante sprechen wir also von 160 Kernen. Die CPU-Kerne sollen auf dem N1-Design von ARM basieren und einige Anpassungen besitzen. Pro Kern können zwei 128 Bit SIMD-Einheiten die Rechenaufgaben erledigen. Unter anderem werden Berechnungen in INT8 und FP16 unterstützt – also solche mit niedriger Genauigkeit, wie sie für das Inferencing von Deep-Learning-Netzwerken verwendet werden. Der Takt des Prozessors beläuft sich auf 3 GHz. An Caches stehen 64 KB L1 I-Cache und 64 KB L1 D-Cache sowie 1 MB L2 D-Cache zur Verfügung. Zudem besitzt der Altra 32 MB an System Level Cache (SLC).

Gefertigt wird der Chip von TSMC in 7 nm (7N). Der Speichercontroller (8x 72 Bit) unterstützt auf acht Kanälen DDR4-3200 mit einer Gesamtkapazität von 4 TB pro Sockel. Bis zu 16 DIMMs stehen auf den dazugehörigen Mainboards zur Verfügung. Natürlich wird auch ECC unterstützt.

Zudem werden 128 PCI-Express-4.0-Lanes angeboten, wenn ein Sockel verwendet wird. Kommt ein Dual-Sockel-System zum Einsatz, stehen 192 PCI-Express-Lanes zur Verfügung – die fehlenden 64 Lanes werden offenbar für die Verbindung zwischen den beiden Sockeln verwendet. Organisiert sind die PCI-Express-Lanes als 8x 8 PCIe + 4x 16 PCIe/CCIX Extended Speed Mode (ESM).

Der Ampere Altra bietet außerdem die Unterstützung für den CCIX-Interconnect (4x 16 CCIX-Verbindungen). Ob man auch den von Intel etablierten, aber noch nicht umgesetzten CXL-Interconnect unterstützen wird, ist nicht bekannt. Platz findet der Prozessor in einem Package mit 4.926 Pins. Die Thermal Design Power reicht von 45 bis 210 W.

Ampere hat bereits damit begonnen erste Samples des Altra auszuliefern. Die Massenproduktion soll Mitte 2020 beginnen.

Erst heute gab es einige Benchmarks zum Graviton2, wie er von Amazon in den AWS-Instanzen eingesetzt wird. Diese zeigen zumindest im Falle von KeyDB einen erheblichen Geschwindigkeits- und Kostenvorteil im Vergleich zu üblicher Cloud-Hardware. Auch der Graviton2 ist ein HPC-Prozessoren auf Basis eines ARM-Designs.

Update: Leistungsdaten zum Ampere Altra

Einen Aspekte haben wir in der gestrigen Vorstellung noch ausgeblendet: Die vermeintliche Leistung des 80-Kern-ARM-Prozessors.

Ampere vergleicht ein 2P-System, also zwei Altra-Prozessoren mit jeweils 80 Kernen gegen zwei AMD EPYC 7742 mit jeweils 64 Kernen und zwei Intel Xeon 8280 mit jeweils 28 Kernen. Zudem laufen die beiden Altra-Prozessoren mit 3,3 GHz, was schneller als die angegebenen 3 GHz ist, die man offiziell als dauerhaften Turbotakt angibt. Das Specrate-2017-Ergebnis des Altra-System wurde aufgrund von Projektionen geschätzt, was auch die "Übertaktung" auf 3,3 GHz erklärt.

Schlussendlich wurden die Ergebnisse der beiden AMD- und Intel-Prozessoren um 16,5 % und 24 % korrigiert, um den für die Altra-Prozessoren verwendeten GCC im Vergleich zum AOCC und ICC zu kompensieren. Ampere nennt alle diese Details in den Fußnoten, versteckt sie also nicht. Dennoch aber müssen die Ergebnisse in Form der Diagramme mit Vorsicht genossen werden.

Die komplette Präsentation mit weiteren Berechnungen zu Effizienz und den Kosten für einen solchen Server findet ihr hier: