Was ist denn nun an den Folien dran, gibts dazu Infos?
Mich wundern nämlich diese vier Core "Module" etwas... 2x4 Cores, 2x L3 Cache und das ganze auf einem Träger hat irgendwie den Touch von Pentium D bzw. Core2... Mit allen Vor- und Nachteilen... Allerdings sind die Vorteile in heutiger Zeit wohl nicht mehr wirklich von Relevanz, die Nachteile bleiben allerdings... Ein Vorteil wäre, dass es einfach ist sowas zu fertigen. Zur Not sogar mit zwei DIEs auf einem Träger. Aber braucht man diesen Vorteil heute noch? Mir schmeckt da eher der mögliche Nachteil daraus nicht, der auch schon auf dem Core2 gelastet hat, wenn es um MT Performance ging. Nämlich dass das L3 Cache Doppelpack der Skalierung etwas im Wege stehen könnte... Weil eben 2x8MB nicht gleichbedeutend mit 1x16MB sind/währen in dem Fall. Passt was nicht in den Cache, gibts Quadzugriffe über den Interconnect oder gar Zugriffe über den RAM hintenraus.
Wäre eventuell realistisch gewesen, zumindest Nehalem Ebene. Allerdings vielleicht auch nur Single Threaded ... denn ein i5 hat ja doch noch 4 echte Kerne im Vergleich zu 2 Modulen / 4 Kernen.
Die Modulbauweise war kein so schlechtes Konzept, vor allem weil man leichter in die Breite gehen konnte als bei vollwertigen Kernen. Für den Desktopmarkt war das damals allerdings nicht die richtige Wahl wie sich rausgestellt hat da hier doch noch Single Threaded Anwendungen große Verbreitung hatten und haben.
Neja, ihr müsst euch halt mal entscheiden, wie ihr die Vergleiche anstellen wollt
IPC kann sich auf die ganze CPU oder auch auf ein Modul/Core beziehen... Das steht nicht festgeschreiben. Rein im Vergleich hat eine CPU von AMD in "CMT Bauweise" einen IPC Vorteil ggü. der von Intel mit SMT Bauweise bei gleicher Threadanzahl. Einfach weil CMT bedeutend besser als SMT skaliert.
Die Frage ist, ist das der Part den ihr ausdrücken wollt?
Ein Intel Haswell Core ist stark, zusammen mit SMT sinkt die "IPC pro Thread" allerdings zusammen auf ~125%/2. Bei AMDs Bulldozer Ablegern ist es halt ein "schwächerer" Core, der als Modul betrachtet zusammen irgendwo um die 160-170% erreicht. Allerdings, pro zwei Threads im Vergleich, also den Intel Core mit SMT ggü. dem AMD Modul mit CMT hat Intel aktuell etwas die Nase vorn, was im Schnitt wohl reine Leistung angeht. Der Unterschied ist allerdings nicht extrem groß.
Der große Vorteil bei Intel stand heute ist, dass die CPUs in ihren jeweiligen Märkten breit genug sind um SMT idR nicht bemühen zu müssen. Gerade in Games merkt man das teils extrem... Wenn auch da langsam aber sicher ein Schwenk auf die CPU Breite einsetzt!
PS: was die Modulbauweise angeht. Hier solltest du unterscheiden. Modulbauweise ist nicht automatisch CMT. Letzteres wird zwar ebenso Modul geschimpft bei AMD, allerdings sind das zwei paar Schuhe. Auch native Cores ohne SMT/CMT können Modular aufgebaut sein. Wie "leicht" man in die Breite gehen kann, hängt doch in erster Linie davon ab, wie modular der Spaß aufgebaut ist. Kann man einfach die Einheiten in der Anzahl skalieren, dann hast du ein modulares Konzept. Ob das nun gepaart mit SMT, CMT oder nichts dergleichen ist, ist nebensächlich... Soll heißen, nicht CMT macht das Ding einfach in die Breite zu skalieren, sondern der generelle Aufbau ansich. Genau so wie es bei Intel bspw. und anderen ebenso getätigt wird. Haswell-E geht von 6 bis 18 Cores + SMT, modular in einzelnen Schritten zu skalieren... Beim Haswell Mainstream wären es immerhin noch 1-4 Cores (+ SMT). Selbst ein drei Core (+ SMT) wäre technisch möglich, wenn man wollen würde, allerdings ggü. einem Quadcore ohne SMT eher unsinnig.
So ein Excavator FX4 mit L3 wäre wohl IPC Technisch schneller als ein Nehalem i5, und evtl schon auf Sandy Bridge i5 Niveau.
Ich hätte mir davon dann defenetiv einen FX8 gekauft und behalten, weil ich ein Mega fan von der Modulbauweise bin.
Dann vergleich halt die APUs miteinander... Der L3 Cache Performancevorteil lässt sich ja bei allen Probanten draufrechnen, wenn Bedarf besteht
Ob das Teil am Ende Nehalem i5 Niveau erreicht, bleibt halt abzuwarten. Pro Modul ggf. ja, aber auf alle vier Threads ggü. vier Intel Threads hingegen? Abwarten... Nehalem i5 wäre im Grunde Lynnfield i5. Das heist aber auch, vier Cores ohne SMT. Ob man den taktbereinigt packt mit zwei Modulen + CMT? Der Sprung müsste schon relativ fett ausfallen...
Also entweder der L3 bringt bis zu 20% mehr IPC, oder der Kaveri hat keine 20% mehr IPC
Lass den Cache mal aus dem Vergleich raus. Entweder du vergleichst mit oder ohne Cache...
Auch die K10(.5) CPUs gabs doch ohne L3 Cache in Form der Athlon X4 CPUs
-> die würden sich da eher für einen Vergleich anbieten...
Kaveri kann schon seine 15-20% mehr wie Richland pro Takt leisten. Zumindest in Benchmarks geht das durchaus in diese Region. Ggü. dem FX43xx CPUs nutzt der IPC Vorteil halt nur bedingt etwas, wenn der Cache zur Performance beiträgt. Was gerade in Games durchaus der Fall sein kann.