Werbung
Aus den GPU-Ambitionen des Projektes Larabee ist nichts geworden und dennoch kann Intel Teile der Entwicklung und Erkenntnisse nutzen – die Rede ist von den Xeon-Phi-Beschleunigerkarten, deren Sinn es ursprünglich einmal war, gegen AMD und NVIDIA im Desktop-GPU-Segment antreten zu können. Auf der International Supercomputing Conference 2016 in Frankfurt/Main hat Intel nun endlich die finale Version der neuen Generation der Xeon-Phi-HPC-Beschleuniger vorgestellt: Knights Landing.
Technische Grundlage der Xeon Phi Knights Landing sind ein 700 mm² großer Chip, der bei Intel in 14 nm FinFET gefertigt wird. Wichtigstes Merkmal der Architektur sind 76 Silvermont-Rechenkerne, die mit den ursprünglichen Kernen dieser Generation aber nicht mehr viel gemein haben, da sie in vielen Stellen von Intel für das Computing optimiert wurden. Dazu gehören Vektoreinheiten für AVX-512, größere Caches und die Möglichkeit, per Hyperthreading vier Threads pro Kern zu verarbeiten. Die Sechs Speicherkanäle des Chips können bis zu 384 GB DDR4-Arbeitsspeicher anbinden.
Der Speicher spielt bei den HPC-Prozessoren Xeon Phi Knights Landing ebenfalls eine entscheidende Rolle, denn die Nutzer haben die Wahl zwischen dem Arbeitsspeicher, der aber nur vergleichsweise langsam angesprochen werden kann (typischerweise mit 90 bis 120 GB/s), sowie dem auf dem Package integrierten MCDRAM von Micron. Dieser ist zwar nur 16 GB groß, bietet dafür aber eine Bandbreite von 500 GB/s. Genutzt werden kann der Speicher im sogenannten Flat-Modell und bildet dabei einen eigenen Speicherknoten für den jeweiligen Beschleuniger. Alternativ ist eine Nutzung als transparenter Cache möglich, ähnlich wie dies für EDRAM bei den integrierten GPUs bei Intel der Fall ist. Zur Wahl steht aber auch ein Hybrid-Modus aus beiden Möglichkeiten.
Intel bietet ab sofort vier Modelle der Xeon Phi Knights Landing an. Das Topmodell wird aber erst im September verfügbar sein, während die übrigen drei ab sofort ausgeliefert werden sollen. Teilweise ist dies schon geschehen wie ein Blick in die Top-500-Liste der Supercomputer zeigt. Im Herbst, genauer gesagt im Oktober, sollen die HPC-Beschleuniger dann auch mit optionalem Omni Path, einem Interconnect auf Basis von Lichtwellenleitern, verfügbar sein. Diese Varianten sind jeweils 278 US-Dollar teurer und verbrauchen 15 W mehr. Varianten auf Basis von PCI-Express-Karten sind für Ende des Jahres geplant.
Intel Xeon Phi Knights Landing | ||||||
---|---|---|---|---|---|---|
Modell | Kerne | Takt | MCDRAM | DDR4 | TDP | Preis |
7290 | 72 | 1,5 GHz | 16 GB 500 GB/s | 384 GB 2.400 MHz | 245 W | 6.254 US-Dollar |
7250 | 68 | 1,4 GHz | 16 GB 500 GB/s | 384 GB 2.400 MHz | 215 W | 4.876 US-Dollar |
7230 | 64 | 1,3 GHz | 16 GB 500 GB/s | 384 GB 2.400 MHz | 215 W | 3.710 US-Dollar |
7210 | 64 | 1,3 GHz | 16 GB 444 GB/s | 384 GB 2.133 MHz | 215 W | 2.438 US-Dollar |
Allen Varianten von Xeon Phi Knights Landing gemein sind der Sockel LGA 3647, ein 16 GB großer MCDRAM und die Möglichkeit, 384 GB DDR4-Speicher anzubinden. Das Top-Modell 7290 aktiviert 72 oder 76 Rechenkerne und arbeitet mit 1,5 GHz. Der 16 GB große MCDRAM arbeitet mit der vollen Bandbreite von 500 GB/s und die Leistungsaufnahme beträgt 245 W. Der Preis liegt hier bei 6.254 US-Dollar. Das zweitschnellste Modell 7250 lässt 68 Kerne auf 1,4 GHz arbeiten. Der Verbrauch wird dadurch auf 215 W reduziert und auch der Preis ist mit 4.876 US-Dollar deutlich niedriger. Die höchste Speicherbandbreite pro Kern bietet die Variante 7230. Die 64 Kerne kommen hier auf 1,3 GHz und der Verbrauch liegt ebenfalls bei 215 W. Den Preis gibt Intel mit 3.710 US-Dollar an. Das beste Preis-Leistungs-Verhältnis soll das Modell 7210 bieten. Es setzt auf 64 Kerne bei einem Takt von 1,3 GHz. Allerdings ist der MCDRAM hier nur mit 444,4 GB/s angebunden und außerdem kann nur DDR4-Speicher mit 2.133 MHz eingesetzt werden. Die Leistungsaufnahme beträgt auch hier 215 W und der Preis liegt bei 2.438 US-Dollar.
Bei der Rechenleistung macht Intel nur Angaben zum schnellsten Modell 7290. Dieses soll bei einfacher Genauigkeit auf eine Rechenleistung von 7 TFLOPS und bei doppelter Genauigkeit von 3,5 TFLOPS kommen. Zum Vergleich: NVIDIAs Tesla P100 – erst kürzlich in einer PCI-Express-Variante vorgestellt – kommt auf 10,6 bzw. 5,3 TFOPS in der NVLINK-Variante und auf 9,3 bzw. 4,7 TFLOPS in der PCI-Express-Variante. Die Leistungsaufnahme ist mit 250 W in etwa vergleichbar. Theoretisch sind die neue Xeon Phi Knights Landing nicht mehr auf einen Host-Prozessor angewiesen und können selbstständig booten und Software ausführen. Dies dürfte das Einsatzgebiet der HPC-Beschleuniger noch einmal deutlich ausweiten.