Werbung
Für AMD ist das Chiplet-Design aus getrennten Chips für die CPU-Kerne und die I/O-Komponenten wegweisend. Die EPYC-Prozessoren der 2. Generation werden derart aufgebaut sein und gleiches gilt auch für die Ryzen- und Ryzen-Threadripper-Prozessoren der 3. Generation auf Basis der Zen-2-Architektur.
Für Intel ist ist die EMIB-Weiterentwicklung (Embedded Multi-die Interconnect Bridge) namens Foveros der Weg in die Multi-Chip-Zukunft und schlussendlich muss man sich auch hier eingestehen, dass der monolitische Ansatz bei den Prozessoren ein Ende gefunden hat. Natürlich arbeiten auch andere Hersteller an Chips, die aus mehreren Komponenten bestehen. Huawei stellt bereits im Herbst den 910 Ascend vor. Nun sind weitere Details zum Compute-Chip veröffentlicht worden.
Der Huawei Ascend 910 besteht aus acht einzelnen Chips, die in einem Package zusammengeführt werden. Vier davon entfallen alleine auf den HBM2. Es handelt sich dabei um den schnellsten derzeit verfügbaren HBM2 Aquabolt von Samsung. Bei einer Speicherbandbreite von 2,4 GBit/s pro Pin werden hier insgesamt 1,2 TB/s an Speicherbandbreite für den Chip erreicht. Zum Vergleich: Die aktuellen GPU-Beschleuniger und auch die neue Radeon VII von AMD kommen bei vier Speicherchips auf 1 TB/s.
Außerdem verwendet Huawei drei Compute-Dies. Diese basieren auf der Da-Vinci-Architektur und verwenden neben klassischen ARM-Kernen auch noch Recheneinheiten für Matrix-Multiplikationen. Im Vordergrund stehen die Dateneinheiten FP16 und INT8, wo der Huawei Ascend 910 neue Leistungsrekorde aufstellen soll. Gefertigt werden die Compute-Dies in 7 nm, wohingegen die Fertigungsgröße des I/O-Die unbekannt ist.
Die Thermal Design Power eines Ascend 910 liegt bei 350 W. Dann soll ein solcher Chip doppelt so viel Rechenleistung wie ein Tesla-V100-GPU-Beschleuniger bieten. Von 256 TFLOPS an FP16-Rechenleistung und 512 TOPS INT8-Rechenleistung ist die Rede. Außerdem soll die Performance ausreichend sein, um 128 FullHD-Videostreams zu decodieren. Der Chip ist also darauf ausgelegt Deep-Learning-Algorithmen auszuwerten und beispielsweise eine Analyse eines Videobildes (z.B. Gesichtserkennung) zu erstellen. Trainiert werden solche Systeme auf anderer Hardware, die auch Daten mit höherer Genauigkeit (FP64) berechnen können.
Der Huawei Ascend 910 soll im 2. Quartal 2019 verfügbar sein.