Blockdiagramm vergleicht "Excavator"- und "Zen"-Kerne (2. Update: Neue Roadmaps)

ich frage mich, warum die Bulldozer Updates immer so spärlich ausgefallen sind. Zwischen Bulldozer MK1 & MK2 liegen nur minimale Unterschiede, und die leistung des MK3 gegenüber dem MK2 ist auch nicht spürbar stärker. Jetzt beim MK4 gibts gegenüber dem MK3 wieder nur 5% mehr IPC.

Hat AMD so wenig geld und entwicklungskosten in die Bulldozer gesteckt oder ging da einfach nicht mehr als diese insgesamt 18% mehr IPC in 5 Jahren ?
Wie kommst du auf 5 Jahre? bdver1 war 2H 2011, bdver4 ist 1H 2015. Das sind also eher etwa 3,5 Jahre. Von bdver1 zu bdver2 waren es 5-10% IPC, von bdver2 zu bdver3 waren es 10-20% IPC, von bdver3 zu bdver4 sind es voraussichtlich 5% IPC. Insgesamt also etwa 20-35% IPC. Viel mehr war es von Sandy Bridge (1H 2011) auf Broadwell (2H 2014) in 3,5 Jahren auch nicht. Zudem sollte man auch einiges berücksichtigen. Kaveri ist gegenüber Richland bei 95/100W TDP deshalb nicht spürbar schneller, da die Taktraten aufgrund der Fertigung um 300-400 MHz sanken. Die Architektur wurde hingegen schon deutlich überarbeitet und verbessert (Dual-Decoder, Loop Buffer, verbesserte Sprungvorhersage, optimierte FPU, mehr L1I, schnellerer L1/L2 usw). Performance stand auch nicht immer im Vordergrund. ZB Piledriver war vor allem Bugfixing, um die gröbsten Kinderkrankheiten zu beseitigen. Excavator wiederum ist mehr auf Energieeinsparung und Flächenreduzierung mittels HDL getrimmt. Und nebenbei hat man ja auch noch K12 und Zen entwickelt. Das machen auch nicht nur ein paar Leute nebenbei in ihrer Mittagspause. ;)

Doch. Excavator (also Version 4) kommt doch erst in einem Jahr für den sockel FM3 raus.
Das steht noch überhaupt nicht fest. Die geleakten Folien lassen das eher bezweifeln. Excavator kommt jedenfalls mit Carrizo. Und der wird laut letztem Conference Call seit Q1 ausgeliefert und soll noch in Q2 vorgestellt werden.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wie kommst du auf 5 Jahre?

Ich ging von Desktop CPU,s aus und laut Gerüchten sollte nächstes Jahr der Excavator auf Desktop kommen, aber hat sich gestern schon erledigt mit den neuen Infos von Duplex.

Von bdver1 zu bdver2 waren es 5-10% IPC

Ok mit der angabe kann ich leben.

von bdver2 zu bdver3 waren es 10-20% IPC

Mit der angabe kann ich nicht leben.
Begründung: Ein Vishera FX4 leistet bei gleichem Takt, so viel wie ein Kaveri. Der Fehlende L3 frisst die ganze entwickelte extra IPC wieder auf.

Klingt ja schön das Kaveri mehr IPC haben kann, aber wenn man einfach den L3 weglässt und damit wieder auf dem Niveau von Bulldozer Mk2 landet, ist das für mich Irrelevant.

Und abgesehen davon, glaube ich nicht das der Fehlende L3 Chache, so 20% IPC stiehlt.

von bdver3 zu bdver4 sind es voraussichtlich 5% IPC.

Damit kann ich auch leben.
 
Doch. Excavator (also Version 4) kommt doch erst in einem Jahr für den sockel FM3 raus.
Carrizo (zumindest für den mobilen Bereich) steht doch quasi schon in den Startlöchern? Und daß ein Excavator Ableger für FM3 kommt war bisher nur ein Gerücht. In anderen Threads hatte ich ja auch schon geschrieben daß es zwar möglich wäre (wenn z.B. Zen bzw. dessen kleineren Varianten verspätet auf den Markt kommen) aber wenn dann auch nur in kleinen Low Budget Varianten. Auf diesen Folien ist auf jeden Fall nichts mehr davon zu sehen.
Vielleicht kommt Carrizo noch für FM2+, vielleicht aber auch gar nicht mehr im Desktop Bereich.

Ich finde es echt lustig dass die Leute, die AMD das so sehr wünschen einen großen Erfolg damit zu haben, Intel Inside Icons haben :d
Wenn es ehrlich gemeint ist, wieso nicht? Heißt ja nicht daß gleich jeder der das gut findet sich auch sowas kaufen wird. Wenn z.B. Zen in die Leistungsklasse irgendwo zwischen Sandy Bridge und Skylake fällt gibt es für viele die eine dieser Intel CPUs haben wohl keinen Grund auf/umzurüsten, oder?
Lediglich wenn man vielleicht mehr Kerne haben kann/will zu einem (eventuell?) guten Preis oder (eventuell?) guten OC Verhalten oder sonst irgendwelche Vorteile die wir aktuell noch nicht kennen.

also dieser satz ist der reinste bullshit:O
gerade nach der logik wäre mehr cache sinnvoll.
es wird einfach weniger, weil ein kleinerer L2-Cache schneller ist, genau deswegen wurde der auch bei Carrizo halbiert!
gibt es zusätzlich den großen L3-Cache und wahrscheinlich wurde auch der L1 etwas größer.
Bei einem L1 Datencache könnte ich es mir vorstellen daß es vielleicht möglich wäre diesen zu verkleinern wenn der Kern die Befehle schneller/besser abarbeiten kann, bei einem Daten Cache (L2, L3 ...) sehe ich aber auch keinen Sinn in der Aussage.
Vielleicht kann das wer besser erläutern.

sehr unwahrscheinlich, das mit den 2 Zen-Cores wird aktuell eher als sicherer fake gewertet!
ergibt einfach keinen sinn, Zen ist in 14nm so klein, da macht es keinen sinn das "Modul" auf 2 kerne zu halbieren.
dieses modul hat man extra gemacht, um es überall verwenden zu können und in 14nm wäre das um die 100mm² klein!
Wieso Fake? Wieso keine 2 Kern Zen CPUs? Ist doch bestimmt möglich Kerne zu deaktivieren (die eventuell defekt sind oder aufgrund einer höheren Nachfrage an 2 Kern CPUs). Wurde ja schon oft so gemacht, und gerade bei einer neuen Fertigung (14nm) UND komplett neuer Architektur ist Anfangs mit Problemen/schlechter Yield Rate zu rechnen.
Vielleicht kommen ja wieder 2 Kern Zen die man erfolgreich auf 4 Kerner freischalten kann.

Carrizo wurde eingestellt?
bitte einen beleg dafür!
Carrizo unterstützt als erste APU HSA 1.0...
Wüsste jetzt auch nichts daß Carrizo nicht mehr kommt aber vielleicht kommt Carrizo tatsächlich nicht mehr am Desktop, dann wäre dort wohl Bristol Ridge die erste APU die das vollständig kann.

Wie kommst du auf 5 Jahre? bdver1 war 2H 2011, bdver4 ist 1H 2015. Das sind also eher etwa 3,5 Jahre. Von bdver1 zu bdver2 waren es 5-10% IPC, von bdver2 zu bdver3 waren es 10-20% IPC, von bdver3 zu bdver4 sind es voraussichtlich 5% IPC. Insgesamt also etwa 20-35% IPC. Viel mehr war es von Sandy Bridge (1H 2011) auf Broadwell (2H 2014) in 3,5 Jahren auch nicht. Zudem sollte man auch einiges berücksichtigen. ...
Ja wenn Carrizo nun demnächst endlich rauskommt sind's 3,5+ Jahre.

...
Mit der angabe kann ich nicht leben.
Begründung: Ein Vishera FX4 leistet bei gleichem Takt, so viel wie ein Kaveri. Der Fehlende L3 frisst die ganze entwickelte extra IPC wieder auf.
...
Die IPC Steigerungen sind halt etwas schwerer direkt herauszurechnen da es ja nach bdver2 nur noch APUs gab und somit wohl das volle Potential von bdver3 nie ausgeschöpft wurde. Deswegen schreibt er auch 10-20% denn in einigen Bereichen hat Kaveri mehr als 20% zu Richland zugelegt, in anderen aber nur ein paar % bzw. sogar weniger (!).

Aber es stimmt schon daß es bei Intel Prozentual nicht sehr viel anders war.
Sandy -> Ivy ~5%, Ivy -> Haswell ~10-15%, Haswell -> Broadwell ~5% (?), Haswell/Broadwell -> Skylake ~10-15% (?).
Vorteil von Intel war halt daß Sandy von Haus aus ziemlich stark war und in den meisten Bereichen Bulldozer deutlich überlegen. Somit ist die Gewichtung der % etwas stärker. Und die haben alle Bereiche bedient (von Low Budget 2 Kern Celeron bis zu High End Server Sockel mit xx Kernen und HT). AMD hat ja leider den Performance und High End Bereich vernachlässigt. Klar wäre ein aktueller FX mit Steamroller (bdver3) oder gar Excavator (bdver4) Kernen immer noch nicht so schnell wie z.B. ein Haswell, aber man wäre wohl näher dran und hätte vielleicht aktuellere Features bzw. bessere Effizienz als bei den alten FX?

Aber vergessen wir Bulldozer und blicken lieber darauf was Skylake bringt und wie es nächstes Jahr mit Zen aussieht. Ich bin schon sehr gespannt.
 
Zuletzt bearbeitet:
Carrizo (zumindest für den mobilen Bereich) steht doch quasi schon in den Startlöchern? Und daß ein Excavator Ableger für FM3 kommt war bisher nur ein Gerücht.

Dazu hab ich ja im post zuvor schon geschrieben das es sich erledigt hatte, da wir ja seit gestern wissen das 2016 nur noch Zen für den Desktop kommt.

Daher stimmt das schon das es keine 5 Jahre sind :)

Klar wäre ein aktueller FX mit Steamroller (bdver3) oder gar Excavator (bdver4) Kernen immer noch nicht so schnell wie z.B. ein Haswell, aber man wäre wohl näher dran und hätte vielleicht aktuellere Features bzw. bessere Effizienz als bei den alten FX?

Ich hätte einen 28nm Piledriver & Excavator ohne iGPU mit FX4 & FX6 & FX8 bevorzugt. Die iGPU hat das Taktpotential geraubt weil die fertigung nicht mehr pur auf den CPU part optimiert werden konnte.

Leider fehlte AMD anscheinend das Geld dafür.

So ein Excavator FX4 mit L3 wäre wohl IPC Technisch schneller als ein Nehalem i5, und evtl schon auf Sandy Bridge i5 Niveau.

Ich hätte mir davon dann defenetiv einen FX8 gekauft und behalten, weil ich ein Mega fan von der Modulbauweise bin.
 
Wieso Fake? Wieso keine 2 Kern Zen CPUs? Ist doch bestimmt möglich Kerne zu deaktivieren (die eventuell defekt sind oder aufgrund einer höheren Nachfrage an 2 Kern CPUs).
dann würde man aber sicher auch einen quadcore für notebooks anbieten.
irgendwie macht es keinen sinn.
auch die seitenzahlen links unten an der roadmap sind komisch, die zahl ist viel zu hoch.
glaub eine seite fängt bei 25 an, was soll bitte 24 seiten davor noch sein?
normnalerweise hat eine roadmap so 10-15 seiten!


Wüsste jetzt auch nichts daß Carrizo nicht mehr kommt aber vielleicht kommt Carrizo tatsächlich nicht mehr am Desktop, dann wäre dort wohl Bristol Ridge die erste APU die das vollständig kann.
im text steht nur erste HSA 1.0 APU, also sollte da Carrizo auch berücksichtigt werden dürfen.
schaut für micxh halt schwer danach aus, daß der autor nicht wusste welche HSA-"Ausbaustufe" Carrizo hat:\
 
Das Problem ist nur, dass bdver1 weniger IPC als der K10.5 hatte, AMD musste also erstmal Boden gut machen.
 
das problem an bulldozer war halt nur zum teil die µArch selbst, der cache hatte einfach grottige latenzen:\
ind die leckströme haben ihn dann zum energiefresser gemacht.
 
Die gezeigten Verbesserungen betreffen dezidiert Systeme mit mehr als 2 units/ mehr als 8 cores. Das ist eigentlich nur für server relevant.
Für die meisten Desktopanwender reichen 4 Kerne. In einigen, wenigen Fällen lohnen sich evtl 8.

Ein 4 Kerner mit 1mb L2 cache pro Kern wäre mir lieber, sonst hab ich als ottonormal Desktopanwender nicht viel vom inklusiven Speicher.
 
...
So ein Excavator FX4 mit L3 wäre wohl IPC Technisch schneller als ein Nehalem i5, und evtl schon auf Sandy Bridge i5 Niveau.

Ich hätte mir davon dann defenetiv einen FX8 gekauft und behalten, weil ich ein Mega fan von der Modulbauweise bin.
Wäre eventuell realistisch gewesen, zumindest Nehalem Ebene. Allerdings vielleicht auch nur Single Threaded ... denn ein i5 hat ja doch noch 4 echte Kerne im Vergleich zu 2 Modulen / 4 Kernen.
Die Modulbauweise war kein so schlechtes Konzept, vor allem weil man leichter in die Breite gehen konnte als bei vollwertigen Kernen. Für den Desktopmarkt war das damals allerdings nicht die richtige Wahl wie sich rausgestellt hat da hier doch noch Single Threaded Anwendungen große Verbreitung hatten und haben.
Tja wir werden es nie wissen denn selbst wenn Carrizo noch auf den Desktop kommt (egal ob FM2+ oder FM3) werden das nur Low Budget bis max. unterer MidRange Bereich APUs sein. Möglicherweise mit einer stärkeren GPU, aber der CPU Teil wird wie bisher max. 2 Module ohne L3 Cache ohne hohe Taktfreuqenzen und höhere TDP Limits werden.

dann würde man aber sicher auch einen quadcore für notebooks anbieten.
irgendwie macht es keinen sinn.
Ist ja auch geplant - in der Roadmap steht das zumindest drin. "Up to 4 'Zen' CPU Cores"


auch die seitenzahlen links unten an der roadmap sind komisch, die zahl ist viel zu hoch.
glaub eine seite fängt bei 25 an, was soll bitte 24 seiten davor noch sein?
normnalerweise hat eine roadmap so 10-15 seiten!
Diese Roadmaps dürften ja nur Teil einer größeren Präsentation sein.
Klar können die Fake sein, kann mir aber gut vorstellen daß das so passt. Steht ja nichts total unrealistisches drin.

im text steht nur erste HSA 1.0 APU, also sollte da Carrizo auch berücksichtigt werden dürfen.
schaut für micxh halt schwer danach aus, daß der autor nicht wusste welche HSA-"Ausbaustufe" Carrizo hat:\
Naja ist halt immer eine Sache wie man was auffasst/interpretiert und der Author ist auch nur ein Mensch. Da kann man schon mal was falsch wiedergeben oder interpretieren bzw. vielleicht nicht alle Fakten kennen/wissen.
Aktuell ist Carrizo ja auch noch gar nicht am Markt ...
 
Aktuell ist Carrizo ja auch noch gar nicht am Markt ...
aber laut AMD wird Carrizo schon ausgeliefert und AMD gibt HSA 1.0 an, also glaube ich ihnen das mit HSA 1.0 auch so lange, bis jemand das gegenteil beweisen kann!

und ich finde wer solche artikel schreibt, der sollte schon sehr sehr gut informiert sein!
 
Mit der angabe kann ich nicht leben.
Begründung: Ein Vishera FX4 leistet bei gleichem Takt, so viel wie ein Kaveri. Der Fehlende L3 frisst die ganze entwickelte extra IPC wieder auf.
Der L3 gehört aber nicht zum Kern bzw zur Kernarchitektur. Daher macht ein Vergleich mit dem FX auch keinen Sinn. Du solltest Kaveri schon mit Trinity/Richland vergleichen, um die Unterschiede zwischen Piledriver und Steamroller zu sehen.

Und abgesehen davon, glaube ich nicht das der Fehlende L3 Chache, so 20% IPC stiehlt.
Wie kommst du auf 20%? Bzw wo ist Kaveri im Schnitt 0-10% langsamer pro Takt als der 2M Vishera?
 
Der L3 gehört aber nicht zum Kern bzw zur Kernarchitektur. Daher macht ein Vergleich mit dem FX auch keinen Sinn. Du solltest Kaveri schon mit Trinity/Richland vergleichen, um die Unterschiede zwischen Piledriver und Steamroller zu sehen.

Schon klar.
Aber wenn es nunmal keine Steamroller mit L3 gibt, lohnt sich ein aufrüsten auch nicht für leute die nur wert auf CPU Speed legen.

AMD hätte sich die IPC entwicklung echt sparen können wenn man keine anständige nachfolger CPU zum Vishera FX herausbringt.



Wie kommst du auf 20%?

Das war deine eigene aussage.

Ich Zitiere dich nochmal um dich an deine eigenen Worte zu errinern.

von bdver2 zu bdver3 waren es 10-20% IPC
 
Also erstmal..alles was auf facebook steht hat für mich absolut keinen Wert...
 
Naja nur weil AMD es hat entfernen lassen, heisst es ja nicht dass es nicht vllt ein wenig der Wahrheit entspricht. Es gibt kein Dementi seitens AMD..
 
Aber wenn es nunmal keine Steamroller mit L3 gibt, lohnt sich ein aufrüsten auch nicht für leute die nur wert auf CPU Speed legen.
Wir haben auch nicht über Aufrüstung oder ähnliches gesprochen. Es ging einfach nur um die Technik.

AMD hätte sich die IPC entwicklung echt sparen können wenn man keine anständige nachfolger CPU zum Vishera FX herausbringt.
Naja, ein Carrizo wird gerade im wichtigen mobilen Markt schon ein deutliches Update im Vergleich zu Trinity, auf allen Ebenen. Wenn man dann noch 15-25% IPC mitnehmen kann, bei verringertem Energiebedarf, wieso sollte man das nicht tun?

Das war deine eigene aussage.
Nein. Zum L3 sagte ich gar nichts. Ich sprach nur über die Kernarchitektur. Daher frage ich mich nach wie vor, wie du darauf kommst, dass ich behauptet oder impliziert hätte, der L3 würde 20% kosten.
 
Naja nur weil AMD es hat entfernen lassen, heisst es ja nicht dass es nicht vllt ein wenig der Wahrheit entspricht. Es gibt kein Dementi seitens AMD..
Äh, wenn der auf Facebook nicht lügt, dann ist das sehr wohl ein Dementi:
Laut AMD seien die darauf präsentierten Informationen völlig falsch und würden AMD falsch darstellen.
 
Äh, wenn der auf Facebook nicht lügt, dann ist das sehr wohl ein Dementi:

Schau mal P3Dnow.. Da steht nur auf Bitten AMDs entfernt, das andere kann also aus den Fingern gesaugt sein. Nichts desto trotz würde diese Zen Architektur sehr Deutlich Kellers Handschift tragen. Also entweder guter Fake oder aber zuviel Wahrheit als dass AMD es haben möchte
 
Naja, ein Carrizo wird gerade im wichtigen mobilen Markt schon ein deutliches Update im Vergleich zu Trinity, auf allen Ebenen. Wenn man dann noch 15-25% IPC mitnehmen kann, bei verringertem Energiebedarf, wieso sollte man das nicht tun?

ja für laptops etc bringt der sicher was. hätte mir halt gern ne neue desktop cpu gewünscht.

Nein. Zum L3 sagte ich gar nichts. Ich sprach nur über die Kernarchitektur. Daher frage ich mich nach wie vor, wie du darauf kommst, dass ich behauptet oder impliziert hätte, der L3 würde 20% kosten.

ich sagte nie das du etwas zum L3 sagtest. mir kommts so vor als hast du gerade den kontext vergessen.

es fing an mit deiner aussage das BD MK3 10-20% mehr IPC hat als BD MK2. Und ich verwies auf einen Piledriver der genau so schnell ist wie ein Kaveri bei taktgleichheit.

Ergo hat der Piledriver dank L3 doch 10-20% mehr IPC. sonnst könnte er ja nicht auf Kaveri speed kommen. Logisch oder ?
 
es fing an mit deiner aussage das BD MK3 10-20% mehr IPC hat als BD MK2. Und ich verwies auf einen Piledriver der genau so schnell ist wie ein Kaveri bei taktgleichheit.
Und wo sind die Quellen dafür? Und bitte keine Rosinenpickerei. In ausgewählten Benchmarks kann der L3 durchaus für 10-20% gut sein. Im Schnitt sollte es aber nicht mehr als 5% sein.
 
Und wo sind die Quellen dafür? Und bitte keine Rosinenpickerei.

In Spielen ist der Kaveri A10-7850K so schnell wie ein Phenom II X4 965. Und das obwohl der Phenom wesentlich weniger Takt hat.

Beweis.

Prozessor-Rangliste: Empfehlungen für jeden Geldbeutel - ComputerBase

Der FX4300 hat den gleichen Turbo Core Takt wie der erwähnte Kaveri, und ohne Turbo 100mhz unterschied.
Aber der FX4300 ist schneller als der Phenom II X4 965, und daher Logischerweise auch schneller als der Kaveri.

Also ein FX4300 ist schneller, und das obwohl er 10-20% weniger IPC haben soll ? Kann dann ja nur bedeuten, das der L3 Chache diese 10-20% ausmacht.

Und bevor du mir jetzt Rosenpickerei unterstellst weil ich gerade mit "Games" Argumentiere.

Hier hast du noch einen Allgemein Bench wo Games und Anwendungen mit eingeflossen sind, wo der FX4300 wieder Deutlich überlegen ist.

Leistungsindex Prozessoren - Die aktuelle Rangliste

Also entweder der L3 bringt bis zu 20% mehr IPC, oder der Kaveri hat keine 20% mehr IPC ;)

- - - Updated - - -

Edit:

mir wird grad klar wie wenig IPC Kaveri hat :fresse:

bei 400mhz mehr, und in games dennoch langsamer als ein Phenom II :fresse:

und wenn man da noch 5% von Excavator mit draufrechnet, hat man immernoch keine Phenom II ipc :fresse:

Also ist AMD mit dem Letzten Bulldozer aus dem Jahre 2015, IPC technisch immernoch nicht so schnell wie Intels Core 2 von 2006 :fresse:
 
Was ist denn nun an den Folien dran, gibts dazu Infos?
Mich wundern nämlich diese vier Core "Module" etwas... 2x4 Cores, 2x L3 Cache und das ganze auf einem Träger hat irgendwie den Touch von Pentium D bzw. Core2... Mit allen Vor- und Nachteilen... Allerdings sind die Vorteile in heutiger Zeit wohl nicht mehr wirklich von Relevanz, die Nachteile bleiben allerdings... Ein Vorteil wäre, dass es einfach ist sowas zu fertigen. Zur Not sogar mit zwei DIEs auf einem Träger. Aber braucht man diesen Vorteil heute noch? Mir schmeckt da eher der mögliche Nachteil daraus nicht, der auch schon auf dem Core2 gelastet hat, wenn es um MT Performance ging. Nämlich dass das L3 Cache Doppelpack der Skalierung etwas im Wege stehen könnte... Weil eben 2x8MB nicht gleichbedeutend mit 1x16MB sind/währen in dem Fall. Passt was nicht in den Cache, gibts Quadzugriffe über den Interconnect oder gar Zugriffe über den RAM hintenraus.



Wäre eventuell realistisch gewesen, zumindest Nehalem Ebene. Allerdings vielleicht auch nur Single Threaded ... denn ein i5 hat ja doch noch 4 echte Kerne im Vergleich zu 2 Modulen / 4 Kernen.
Die Modulbauweise war kein so schlechtes Konzept, vor allem weil man leichter in die Breite gehen konnte als bei vollwertigen Kernen. Für den Desktopmarkt war das damals allerdings nicht die richtige Wahl wie sich rausgestellt hat da hier doch noch Single Threaded Anwendungen große Verbreitung hatten und haben.

Neja, ihr müsst euch halt mal entscheiden, wie ihr die Vergleiche anstellen wollt ;)
IPC kann sich auf die ganze CPU oder auch auf ein Modul/Core beziehen... Das steht nicht festgeschreiben. Rein im Vergleich hat eine CPU von AMD in "CMT Bauweise" einen IPC Vorteil ggü. der von Intel mit SMT Bauweise bei gleicher Threadanzahl. Einfach weil CMT bedeutend besser als SMT skaliert.
Die Frage ist, ist das der Part den ihr ausdrücken wollt?

Ein Intel Haswell Core ist stark, zusammen mit SMT sinkt die "IPC pro Thread" allerdings zusammen auf ~125%/2. Bei AMDs Bulldozer Ablegern ist es halt ein "schwächerer" Core, der als Modul betrachtet zusammen irgendwo um die 160-170% erreicht. Allerdings, pro zwei Threads im Vergleich, also den Intel Core mit SMT ggü. dem AMD Modul mit CMT hat Intel aktuell etwas die Nase vorn, was im Schnitt wohl reine Leistung angeht. Der Unterschied ist allerdings nicht extrem groß.
Der große Vorteil bei Intel stand heute ist, dass die CPUs in ihren jeweiligen Märkten breit genug sind um SMT idR nicht bemühen zu müssen. Gerade in Games merkt man das teils extrem... Wenn auch da langsam aber sicher ein Schwenk auf die CPU Breite einsetzt!

PS: was die Modulbauweise angeht. Hier solltest du unterscheiden. Modulbauweise ist nicht automatisch CMT. Letzteres wird zwar ebenso Modul geschimpft bei AMD, allerdings sind das zwei paar Schuhe. Auch native Cores ohne SMT/CMT können Modular aufgebaut sein. Wie "leicht" man in die Breite gehen kann, hängt doch in erster Linie davon ab, wie modular der Spaß aufgebaut ist. Kann man einfach die Einheiten in der Anzahl skalieren, dann hast du ein modulares Konzept. Ob das nun gepaart mit SMT, CMT oder nichts dergleichen ist, ist nebensächlich... Soll heißen, nicht CMT macht das Ding einfach in die Breite zu skalieren, sondern der generelle Aufbau ansich. Genau so wie es bei Intel bspw. und anderen ebenso getätigt wird. Haswell-E geht von 6 bis 18 Cores + SMT, modular in einzelnen Schritten zu skalieren... Beim Haswell Mainstream wären es immerhin noch 1-4 Cores (+ SMT). Selbst ein drei Core (+ SMT) wäre technisch möglich, wenn man wollen würde, allerdings ggü. einem Quadcore ohne SMT eher unsinnig.

So ein Excavator FX4 mit L3 wäre wohl IPC Technisch schneller als ein Nehalem i5, und evtl schon auf Sandy Bridge i5 Niveau.

Ich hätte mir davon dann defenetiv einen FX8 gekauft und behalten, weil ich ein Mega fan von der Modulbauweise bin.

Dann vergleich halt die APUs miteinander... Der L3 Cache Performancevorteil lässt sich ja bei allen Probanten draufrechnen, wenn Bedarf besteht ;) Ob das Teil am Ende Nehalem i5 Niveau erreicht, bleibt halt abzuwarten. Pro Modul ggf. ja, aber auf alle vier Threads ggü. vier Intel Threads hingegen? Abwarten... Nehalem i5 wäre im Grunde Lynnfield i5. Das heist aber auch, vier Cores ohne SMT. Ob man den taktbereinigt packt mit zwei Modulen + CMT? Der Sprung müsste schon relativ fett ausfallen...


Also entweder der L3 bringt bis zu 20% mehr IPC, oder der Kaveri hat keine 20% mehr IPC ;)

Lass den Cache mal aus dem Vergleich raus. Entweder du vergleichst mit oder ohne Cache...
Auch die K10(.5) CPUs gabs doch ohne L3 Cache in Form der Athlon X4 CPUs ;) -> die würden sich da eher für einen Vergleich anbieten...

Kaveri kann schon seine 15-20% mehr wie Richland pro Takt leisten. Zumindest in Benchmarks geht das durchaus in diese Region. Ggü. dem FX43xx CPUs nutzt der IPC Vorteil halt nur bedingt etwas, wenn der Cache zur Performance beiträgt. Was gerade in Games durchaus der Fall sein kann.
 
Zuletzt bearbeitet:
Ich sag ja, der L3 Chache macht den FX4300 schneller als den Kaveri was die IPC angeht. der L3 Chache bringt ergo 15-20%.

- - - Updated - - -

Das ein Excavator mit L3 auf nehalem niveau kommt, daran habe ich nie gezweifelt.

es war wohl auch etwas übertrieben von mir zu sagen das der Excavator auf Core 2 IPC agiert.

Ich denke aber das ein Kaveri ohne L3 nicht wirklich mehr IPC hat als ein Core 2 was zb games angeht.
 
Neja, würde ich jetzt klugscheißen wollen, dann würde ich dir sagen, das es eben NICHT IPC ist ;) Weil der L3 nicht bestandteil einer IPC Messung sein soll... Der L3 macht die CPU im allgemeinen nicht schneller, viel eher ist es so, dass ohne den L3 die CPU langsamer wird, als sie sein sollte. Kleiner aber feiner Unterschied :wink:

PS: und was Nehalem (Lynnfield i5) IPC angeht, das bleibt halt abzuwarten... Rechne nurmal einfach nach.
Geht man von Lynnfield i5 aus, wären wir bei ~30% IPC Vorteil pro Haswell zzgl. ~20% für mehr Takt eines aktuellen i5 Haswell Refreshs.
Gehen wir von ~4GHz für den Exavator aus, würde das alleine den IPC Vorteil aufwiegen. Bleiben die ~20% Taktvorteil hinten über... Ein Kaveri ist allerdings heute faktisch deutlich weiter hinter einem i5 zurück und ensprechend riesig wäre der Sprung am Ende, wenn es dann nur noch ~20% wären.

Ob das so kommt, ist aus meiner Sicht eher fraglich... Wo doch ein Unterschied von gerade mal ~20% für zwei Module inkl. CMT vs. vier Intel Cores ohne SMT durchaus konkurenzfähig sind, selbst ohne extrem den Preis drücken zu müssen. Zumal der Zen ja ebenso kommt in dem Zeitraum... Würde man aus dem Bulldozer doch derartige Leistungsregionen rausquetschen können, dann stellt sich eher die Frage, warum man das nicht schon getätigt hat. ;)
Verdoppelt man den Spaß dann sogar noch, also eine acht Thread/vier Modul CPU, würde man durch eben jenen CMT Vorteil ggü. SMT die Intel i7 Haswalls alt aussehen lassen... Denn aus ~20% Vorteil von oben + ~25% SMT kommen nur knappe 50% mehr gesamt Performance raus. Mit vier Modulen anstatt zwei wären aber annähernd 100% mehr Performance drin, ergo deutlich größer i7 Haswell Niveau. Könnte sogar für den i7-4790K reichen... Machbar? -> ggf. schon, allerdings eher unwarscheinlich...
 
Zuletzt bearbeitet:
Das hat nicht mit klugscheißen zu tun, das was Nighteye immer als IPC bezeichnet hat in 99,99% der Fälle null Komma gar nichts mit IPC zu tun!

Und ich würde es, wie ihm schon mal gesagt wurde, begrüßen, wenn er mit dem Scheiß aufhören würde. Es trägt leider nur zur Verwirrung bei, wenn mit Begriffen im falschen Kontext um sich geworfen wird. Siehe mr.dude oben, der eben die IPC meint und nicht wie Nighteye die Spieleperformance.

Also Nighteye, bitte nutze Begriffe im richtigen Kontext, dann versteht man dich vielleicht auch!

E: Auf Wikipedia kann man das zB: auch noch mal nach lesen, wenn man nicht weiß, was IPC ist.
Instructions per cycle - Wikipedia, the free encyclopedia [Englisch]
Instructions per cycle [Deutsch]
 
Zuletzt bearbeitet:
Die IPC lässt sich laut meinem Wissen bei gleichem Takt der CPU Kerne vergleichen.
ZB ein Single Core bei 1000 mhz vs einen Single Core bei 1000 mhz oder halt 2 Module vs 2 Module. Ergo mache ich doch nichts falsch.
Ergo habe ich nichts falsches geschrieben und war im Kontext, denn der FX4300 und Kaveri laufen bei ca gleichem Takt, und der FX4300 ist schneller.
Wenn man jetzt die 100mhz mehr die der FX4300 hat abzieht, wird sich am ergebniss nicht groß was ändern, dann ist der FX4300 höchstens nicht mehr schneller, sondern genau so schnell.

Wenn mr Dude jetzt sagt, Kaveri hat 20% mehr IPC, dann muss es ja am fehlenden L3 Chache liegen das diese 20% nicht in meinen Durchschnitts Spiele Benchs sichtbar sind.
 
Zuletzt bearbeitet:
Das hat nicht mit klugscheißen zu tun, das was Nighteye immer als IPC bezeichnet hat in 99,99% der Fälle null Komma gar nichts mit IPC zu tun!

Und ich würde es, wie ihm schon mal gesagt wurde, begrüßen, wenn er mit dem Scheiß aufhören würde. Es trägt leider nur zur Verwirrung bei, wenn mit Begriffen im falschen Kontext um sich geworfen wird. Siehe mr.dude oben, der eben die IPC meint und nicht wie Nighteye die Spieleperformance.

Also Nighteye, bitte nutze Begriffe im richtigen Kontext, dann versteht man dich vielleicht auch!

E: Auf Wikipedia kann man das zB: auch noch mal nach lesen, wenn man nicht weiß, was IPC ist.
Instructions per cycle - Wikipedia, the free encyclopedia [Englisch]
Instructions per cycle [Deutsch]
Also ich sehe da nicht wirklich wo Nighteye den Begriff falsch verwendet.
Im Artikel steht auch:
the average number of instructions executed for each clock cycle.
Also die durchschnittliche Anzahl der Instruktionen pro Zyklus die die CPU leistet. Diese Zahl ist logischerweise auch vom L3 abhängig, denn wenn die CPU zur Ausführung einer Instruktion, auf Daten aus dem RAM warten muss, dauert das länger als wenn ein L3 Cache da ist. Entsprechend reduziert sich in der Praxis die Zahl der Instruktionen.
Die IPC beschreibt eben nicht den Optimalfall, wenn alle Daten schon im L1 Cache sind.

Sicher, Gamingperformance ist dann nochmal was anderes...
 
Sicher, Gamingperformance ist dann nochmal was anderes...

Ja, aber ich habe auch einen Allgemeinen Bench gepostet wo auch nicht Spiele drin waren, und auch da war der FX4300 Schneller.

- - - Updated - - -

wenn ein FX4300 also in 99 von 100 unterschiedlichen und verschiedensten Anwendungen schneller ist, kann er garnicht 20% weniger IPC haben oder ?
 
Hm, also doch kein AM4? Interessant dürfte auch sein ob Summit Ridge eine High-End oder ein nachfolger für die FM2+ Athlon wird, jedenfalls bin ich sehr gespannt was da rauskommt.
 
Also die durchschnittliche Anzahl der Instruktionen pro Zyklus die die CPU leistet. Diese Zahl ist logischerweise auch vom L3 abhängig, denn wenn die CPU zur Ausführung einer Instruktion, auf Daten aus dem RAM warten muss, dauert das länger als wenn ein L3 Cache da ist. Entsprechend reduziert sich in der Praxis die Zahl der Instruktionen.
Die IPC beschreibt eben nicht den Optimalfall, wenn alle Daten schon im L1 Cache sind.

Generell ja, allerdings sollte man das nicht an Anwendungen messen... Wenn der fehlende L3 Cache Performance liegen lässt, dann sinkt nicht der IPC Wert der Technik drunter, sondern er lässt einfach Leistung liegen.
Wenn du permanente HDD Zugriffe hast zwischen deinen Berechnungen, dann sinkt doch auch nicht die Leistung des Prozessors ;) Sondern die HDD limitiert die Geschwindigkeit der Ausführung.

Zumal immernoch das Problem besteht, dass man sich offenbar nicht einigt, was man mit IPC messen will. Einen Core? Ein Modul? Einen Core + SMT? Die ganze CPU? Und dann noch vergleichen?
Wie oben schon erwähnt, die pro Thread IPC Leistung wäre bei einem Intel Core + SMT und Last auf beiden niedriger als bei einem Intel Core ohne SMT. Ohne Klarstellung, was am Ende überhaupt verglichen wird, macht das Rumschmeißen mit diesen Zahlen wenig Sinn.
Wenn du dir mal Vergleiche von Single Thread Benches vs. Multithread Benches ansiehst und dann mal den Unterschied zwischen einer aktuellen Bulldozer CPU ggü. einem aktuellen Haswell vergleichst, siehst du denke ich auch klar, dass geklärt werden muss, was man überhaupt meint. Als einzelner Thread betrachtet liegt ein Haswell >50% vor dem Piledriver. Beim MT sinds deutlich weniger -> weil SMT anders skaliert als CMT.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh