mr.dude
Urgestein
- Mitglied seit
- 12.04.2006
- Beiträge
- 6.419
Ich sprach ja von 2 Generationen. Von Bulldozer auf Steamroller waren es ~15%. Aber da hatte AMD eh mehr mit Fehlerbeseitigung zu tun. Da bin ich bei Zen schon etwas optimistischer. Und wie gesagt, Lisa Su selbst sprach von einer Reihe recht einfacher Kernverbesserungen.was die IPC angeht, bin ich nicht ganz so optimistisch. Bei einer völlig neuen Architektur wie Zen, wird man aber sicher so 5-7% rausholen können. Siehe Vishera auf Bulldozer.
Erstmal kann ich auf den Folien kein Wort über NUMA lesen. Und selbst wenn es dastehen würde, das würde deine Aussagen wie "ein Dualsocket Epyc System verhält sich logisch wie ein Octosocket System" trotzdem nicht richtig machen. Stichwort Kohärenz.Mir scheint es eher so zu sein, dass hier massenweise nicht verstanden wird, was AMD an Folien gezeigt hat. Siehe AMD's EPYC Server CPU - Sizing Up Servers: Intel's Skylake-SP Xeon versus AMD's EPYC 7000 - The Server CPU Battle of the Decade?, hier sieht man am zweiten Bild (dick mit Naples überschrieben), dass jede CPU aus vier NUMA-Knoten besteht, die via Infinity Fabric verbunden sind.
Nein. IF ist zB protokollunabhängig, das sind die anderen nicht.Die Infinity Fabric ist nichts anders als eine überarbeitete Version von HyperTransport und das war und ist vergleichbar zu QPI bzw. UPI wie es Intel nun nennt.
Nichts. Ich sagte lediglich, dass die bei EPYC gemessene Speicherbandbreite nicht mit einer Dual-Channel Anbindung, wie von jdl behauptet, machbar wäre. Ich frage mich eher, was du mit deinem OpenMP Link beweisen willst. Für meine Aussage hat dieser keine Relevanz.Hinsichtlich des STREAM-Benchmarks: also der "original"-Benchmark wird mit OpenMP parallelisiert. Und wenn ich mir den Quellcode ansehe, sieht das für mich (als C+OpenMP-Laien) doch sehr danach aus, als ob der auch sehr gut über Numa-Nodes skaliert, da der verwendete Speicher auch auf der jeweiligen NUMA-Node alloziert werden kann/wird (vgl. hier: http://prace.it4i.cz/sites/prace.it4i.cz/files/files/advancedopenmptutorial_2.pdf#page=6). D.h. der Benchmark ist eben eine dieser Anwendungen, wo das mit dem NUMA ganz gut funktioniert und ich weiß nicht, was mr.dude damit beweisen will...
Zuletzt bearbeitet: