HWL News Bot
News
Thread Starter
- Mitglied seit
- 06.03.2017
- Beiträge
- 113.949
... weiterlesen
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: this_feature_currently_requires_accessing_site_using_safari
Wozu? NVLink ist deutlich schneller, und IBMs POWER9 hat das schon direkt in der CPU eingebaut.Wäre halt toll, wenn NVIDIA auch CCIX unterstützt.
Aber wahrscheinlich kommt das nicht:\
Die EPYCs taugen nur dazu für die nVidia GPGPUs die IO-Arbeit zu machen. Wegen der vielen PCIe Lanes, sind die EPYCs dafür ideal und senken so die Kosten. Fürs Numbercrunchen selbst taugen die EPYCs nicht, weil sie mangels AVX-512 nicht mit Intel CPUs mithalten können.
Weil es NVLink nicht bei Intel/AMD gibt und zumindest AMD CCIX unterstützt.
Die EPYCs taugen nur dazu für die nVidia GPGPUs die IO-Arbeit zu machen. Wegen der vielen PCIe Lanes, sind die EPYCs dafür ideal und senken so die Kosten. Fürs Numbercrunchen selbst taugen die EPYCs nicht, weil sie mangels AVX-512 nicht mit Intel CPUs mithalten können.
Es wird Teile des Supercomputers geben, die CPU-only sind und solche bei denen die EPYC-Prozessoren tatsächlich hauptsächlich der Anbindung der GPU-Beschleuniger dienen. Aber sie nur als IO-Chip zu sehen ist sicher nicht richtig.
Die strukturellen Schwächen von SPECfp für Multithreading Systeme sind hoffentlich bekannt? Linpack liefert deutlich bessere Aussagen über optimale Parallelisierung als Linpack, obwohl AMD in der Vergangenheit den Linpack immer geschönt hat. Sprich die AMD Implementation der BLAS war nur auf DGEMM optimiert und der Rest wurde sehr vernachlässigt. Wie sehen die aktuellen Werte für BLAS und LAPACK für EPYC aus? Intel liefert die MKL mit sehr guter Performance, was liefert AMD ab?
Entscheidend ist, was in der Realität möglich ist. CCIX wird es wohl kaum für nVidia geben, sondern nur NVLink, und das ist nun einmal aktuell schneller als CCIX.NVIDIA erreich nur eine höhere Geschwindigkeit, weil sie mehr Lanes nutzen.
Der große Preisvorteil bei EPYC ergibt sich aus der Tatsache, dass man nur eine CPU für einen GPGPU Knoten braucht. Wie sehen echte Rechnungen auf dem EPYC bei AMD aus? Synthetische Benchmarks sind schön, aber nicht das alleinig seeligmachende.Es wird Teile des Supercomputers geben, die CPU-only sind und solche bei denen die EPYC-Prozessoren tatsächlich hauptsächlich der Anbindung der GPU-Beschleuniger dienen. Aber sie nur als IO-Chip zu sehen ist sicher nicht richtig.