AMDs EPYC-CPUs und NVIDIAs Tesla-GPUs für gemeinsam 100 PFLOPS

Thread Starter
Mitglied seit
06.03.2017
Beiträge
114.151
amd-epyc-2.jpg
Die Entstehung eines neuen Supercomputers ist für die beteiligten Unternehmen immer eine Gelegenheit, die eigenen Produkte in den Fokus zu rücken. Schaut man sich die aktuelle Top500-Liste der Supercomputer an, ist darunter nur noch ein einziges System mit AMD-Prozessoren. Der Titan setzt auf den Cray XK7 und das System wiederum auf Opteron 6274 mit jeweils 16 Kernen. Darüber hinaus sind Supercomputer mit Prozessoren aus dem Hause AMD eher rar.Doch aufgrund der technischen Stärke der EPYC-Prozessoren, will AMD in diesem Bereich eine größere Rolle...

... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Bereits die bestehenden Epyc CPUs sind doch schon ein Erfolg für AMD.
Und wenn diese Forschungseinrichtung jetzt schon einen Supercomputer mit "Milan" Epycs ordert, dann werden die wohl sehr überzeugt von den Teilen sein und von Rome schon mehr gesehen haben als wir.
 
Ist nur die Frage, ob sie wirklich auf Rome + DDR4 setzen, oder man schon Milan mit DDR5 verbaut und wie der neue Sockel aussieht.
 
Die EPYCs taugen nur dazu für die nVidia GPGPUs die IO-Arbeit zu machen. Wegen der vielen PCIe Lanes, sind die EPYCs dafür ideal und senken so die Kosten. Fürs Numbercrunchen selbst taugen die EPYCs nicht, weil sie mangels AVX-512 nicht mit Intel CPUs mithalten können.
 
Da ab Rome ein neuer Sockel kommt, könnten da sogar noch mehr PCIE-Lanes verfügbar sein.
Auch DDR5 kann später per neuer I/O-Die nachgeliefert werden.
Da man I/O aus den CPUs auslagert, kann man in die zusätzliche Die viel mehr integrieren:)

Das hängt ja in Zukunft nur noch von der I/O-Die ab.

Wäre halt toll, wenn NVIDIA auch CCIX unterstützt.
Aber wahrscheinlich kommt das nicht:\
 
Zuletzt bearbeitet:
Weil es NVLink nicht bei Intel/AMD gibt und zumindest AMD CCIX unterstützt.
Weil CCIX mehr als doppelt so schnell wie PCIe 4.0 ist?

PCIe 4.0 = 16Gb/s
CCIX auf PCIe 4.0 basierend = 25Gb/s
NVLink 2.0 = 25Gb/s

NVIDIA erreich nur eine höhere Geschwindigkeit, weil sie mehr Lanes nutzen.

Die nächste Generation von CCIX soll schon 50Gb/s erreichen.
 
Die EPYCs taugen nur dazu für die nVidia GPGPUs die IO-Arbeit zu machen. Wegen der vielen PCIe Lanes, sind die EPYCs dafür ideal und senken so die Kosten. Fürs Numbercrunchen selbst taugen die EPYCs nicht, weil sie mangels AVX-512 nicht mit Intel CPUs mithalten können.

Es wird Teile des Supercomputers geben, die CPU-only sind und solche bei denen die EPYC-Prozessoren tatsächlich hauptsächlich der Anbindung der GPU-Beschleuniger dienen. Aber sie nur als IO-Chip zu sehen ist sicher nicht richtig.
 
weniger als eine smartwatch würde ich tippe. gab ja schon analoge superrechner
 
Wikipedia "Supercomputer":
"Der erste offiziell installierte Supercomputer Cray-1 schaffte 1976 130 MegaFLOPS."

Zum Vergleich: Die GPU eines SD810 hat ca. 350 GigaFLOPS.
 
Zuletzt bearbeitet:
Es wird Teile des Supercomputers geben, die CPU-only sind und solche bei denen die EPYC-Prozessoren tatsächlich hauptsächlich der Anbindung der GPU-Beschleuniger dienen. Aber sie nur als IO-Chip zu sehen ist sicher nicht richtig.

Die Realität ist noch ein wenig komplizierter. Denn oft hängt es vom Solver (Software) ab. Was für Hardware genutzt wird und auch wie gut.
Es gibt manche Solver die skallieren gut mit vielen Cores. Andere wiederum kommen gut mit Cuda bzw. OpenCL klar.
Wieder andere sagen, schön das du 32 Kerne zur Verfügung hast, ich (Solver) nutze trotzdem nur 2.
 
Die strukturellen Schwächen von SPECfp für Multithreading Systeme sind hoffentlich bekannt? Linpack liefert deutlich bessere Aussagen über optimale Parallelisierung als Linpack, obwohl AMD in der Vergangenheit den Linpack immer geschönt hat. Sprich die AMD Implementation der BLAS war nur auf DGEMM optimiert und der Rest wurde sehr vernachlässigt. Wie sehen die aktuellen Werte für BLAS und LAPACK für EPYC aus? Intel liefert die MKL mit sehr guter Performance, was liefert AMD ab?

- - - Updated - - -

NVIDIA erreich nur eine höhere Geschwindigkeit, weil sie mehr Lanes nutzen.
Entscheidend ist, was in der Realität möglich ist. CCIX wird es wohl kaum für nVidia geben, sondern nur NVLink, und das ist nun einmal aktuell schneller als CCIX.

- - - Updated - - -

Es wird Teile des Supercomputers geben, die CPU-only sind und solche bei denen die EPYC-Prozessoren tatsächlich hauptsächlich der Anbindung der GPU-Beschleuniger dienen. Aber sie nur als IO-Chip zu sehen ist sicher nicht richtig.
Der große Preisvorteil bei EPYC ergibt sich aus der Tatsache, dass man nur eine CPU für einen GPGPU Knoten braucht. Wie sehen echte Rechnungen auf dem EPYC bei AMD aus? Synthetische Benchmarks sind schön, aber nicht das alleinig seeligmachende.
 
Die strukturellen Schwächen deiner ersten Aussage sind auch bekannt? Aber hast ja inzwischen selbst angedeutet, dass es vom Anwendungsfall abhängt, welche CPU sinnvoller ist. Insofern alles gut...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh