Nun mit 12 E-Kernen: Intels Core i7-14700K ist etwa 17% schneller als der 13700K

Es geht aber um Vollasteffizienz. Die E-Cores können deutlich effizienter arbeiten
Warum hat dann im R20 Bench ein 13900K auf 253W gedeckelt eine um 65W höhere Leistungsaufnahme, bei einem nur um 1% besserem Ergebnis, als ein 7950X?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Warum hat dann im R20 Bench ein 13900K auf 253W gedeckelt eine um 65W höhere Leistungsaufnahme, bei einem nur um 1% besserem Ergebnis, als ein 7950X?
Du betrachtest das Problem zu sehr unter dem Aspekt Intel vs. AMD – darum geht es mir nicht.

Wenn man Software hat, die gut über die Zahl der Kerne skaliert, dann ist es besser eine CPU zu nutzen, die möglichst viele Kerne hat, die im optimalen Arbeitspunkt der jeweiligen Architektur betrieben werden. Weder ein Core i9 13900K noch ein Ryzen 7590X werden im optimalen Arbeitspunkt betrieben, sondern weit darüber. Der Wert von 253W, den Du hier für den Core i9 anführst, zeigt sehr deutlich, dass er in diesem Benchmark weit oberhalb der TDP von 125W betrieben wurde. Zum Vergleich ein Xeon 8454+ (56 Kerne) hat eine Basistaktrate von 2.0GHz, ein Xeon 9480 (56 Kerne) 64GB HBM2 Speicher sogar nur 1.9GHz. Ein EPYC 9754 (128 Kerne) hat einen Basistakt von 2,25GHz, ein EPY 9684X (96 Kerne 3D V Cache) von 2.55GHz. Das liegt alles sehr deutlich unter den Taktraten von Core i9 13900K und Ryzen 7590X.

D.h. es ist sinnvoller anstatt der tatsächlichen Core i9 13900K CPU mit 8P+16E Kerne doch eher eine 4P+32E CPU zu nehmen, und dann lieber die Taktrate abzusenken. Analog dazu böte es sich an statt eines Ryzen 9 7590X eine CPU zu nehmen, die mit 16 Core Chipletts aus den Zen 4C EPYCs bestückt ist und dafür die Taktrate abzusenken. D.h. der neue Ryzen 9 hatte dann vielleicht nur 3GHz aber dafü 32 Cores statt der aktuell 16.
 
Es geht aber um Vollasteffizienz. Die E-Cores können deutlich effizienter arbeiten, so dass bei gleichem Stromverbrauch mehr parallele Rechenleistung zur Verfügung steht. Die P-Cores sind nur bei Single-Thread-Aufgaben besser, und für einige Workloads bei denen sich die Aufgaben nur schlecht parallelisieren lassen. Mit anderen Worten es lässt sich parallelisieren, aber nur mit wenigen Cores da sonst der Code eher langsamer läuft. Dann hat man Vorteile vom P-Cores Ansatz. Für alle anderen Workloads sind die E-Cores besser, da sie effizienter Leistung zur Verfügung stellen. Das ist salopp formuliert der Ansatz der Beschleuniger Karten von AMD oder nVidia, bei denen ebenfalls mit recht simplen Einheiten und dafür sehr vielen die hohe Rechenleistung erzielt wird. AMD hat bei den neuen Zen 4c allerdings geschafft relativ komplexe Cores in Massen in die CPU (EPYC aktuell bis zu 128 Cores) zu verbauen. Man wird sehen, ob die Zen 4c Cores auch in die Desktop Plattform von AMD Einzug hält.
Und was ist dann der Unterschied zu HT und SMT? (Mir das schon klar, wie das geht, mehr Alus und so, wirkt sich nicht so toll aus usw...)
Also ich versteh schon.
Aber wenn ich mich an den Task Manager aus 2003 mit dem Northwood erinnere, waren das auch schon 2 "Kerne".

Provokante, bissl scherzhafte Frage:
Verkauft intel nen P Core als 2 E Cores? :d
Ich mein vom Windows aus kann ich den Unterschied nicht erkennen, in die DIE schauen kann ich nicht.

... jetzt fliegen gleich die Steine nach mir :d...


Aber hey, so abwegig ist das nicht.
Wo P-Cores gefragt ist (Singlethread) ist das Intel Zeug ganz gut (auch der I5), beim Rest so najaaa... pro Watt dann eher meh.

Für mich sieht dieses E-Core Zeug eher nach so nem Alibi für "Guck mal, wir haben auch ganz viele Cores!!111einself" aus, weil 5900x, 5950x und Nachfolger halt schon unbequem sind.
Macht sich gut, wenn man 20 Core und 24 Core aufn RGB Kacknoob PC im Kaufhaus schreiben kann.


AMD kann dann Bulldozerlike zurückschießen und den 16 core mit SMT als 32 e-core ohne SMT verticken, lol, sind eben E cores, die sind aus Effizienzgründen in 1 Core zusammengefasst, blablub, irgend ein pseudotechnischer Marketingbullshit lässt sich schon herbeischwurbeln, wo dann Leute wie der Holzi ganz hart werden davon.

Roast me...:d


edit:
... und wäre an dem E-Core Zeug viel mehr dran als Snakeoil, würde es doch tiefer in die Architektur greifen, den Scheduler... wenn das doch so eine große Sache wäre, das doch nicht so unauffällig zwischendurch in der Modellpflege zu implementieren... oder doch?
Ich mein nur... bei so großen Dingen hat man ja doch gern die Namen der Produkte gewechselt, von Pentium auf Core, auf Core-i, ihr wisst schon.


In der Praxis sehe ich halt die Bedeutungslosigkeit der E-Cores... den Sinn kann man sich ja einreden, theoretisch ist das ja auch super praktisch, in der Praxis, hm...
 
Zuletzt bearbeitet:
Es geht aber um Vollasteffizienz.
Die man aber über die Einstellung der Power Limits, vor allem von PL1, selbst in der Hand hat.

AMD hat bei den neuen Zen 4c allerdings geschafft relativ komplexe Cores in Massen in die CPU (EPYC aktuell bis zu 128 Cores) zu verbauen. Man wird sehen, ob die Zen 4c Cores auch in die Desktop Plattform von AMD Einzug hält.
Wobei die Zen4c Kerne aber nur so 35% kleiner als die Zen4 Kerne sind:
Golem beschreibt auch genauer wie dies erreicht wurde:
Wenn man bedenkt das bei Alder und Raptor Lake 4 e-Kerne den gleichen Platz wie ein P Kern einnehmen, also ein e-Kern 75% kleiner als ein P-Kern ist, so der Unterschied schon gewaltig und ich würde nicht erwarten, dass AMD Desktop CPUs mit den Zen3c Kernen bringen wird, aber wer weiß.

Weder ein Core i9 13900K noch ein Ryzen 7590X werden im optimalen Arbeitspunkt betrieben, sondern weit darüber. Der Wert von 253W, den Du hier für den Core i9 anführst, zeigt sehr deutlich, dass er in diesem Benchmark weit oberhalb der TDP von 125W betrieben wurde.
Eben und wer seinen 13900K mit PL1 von 253W betreibt, der interessiert sich offensichtlich nicht für die Effizienz, sondern will Höchstleistung und beides zusammen gibt es eben nicht. Ich habe meinen 13900K mal mit PL1=PL2 bei CB23 Multithread gebencht:

35W: 15656 pts P-Cores: 4 auf 2,0GHz alle anderen 2,1GHz, alle e-Kerne 1,8GHz
65W: 23501 pts P-Cores: 2 auf 3,0GHz alle anderen 3,1GHz, alle e-Kerne 2,7GHz
88W: 27369 pts P-Cores: alle 3,6GHz, alle e-Kerne 3,1GHz
105W: 28948 pts P-Cores: alle 3,9GHz, alle e-Kerne 3,3GHz
125W: 31330 pts P-Cores: alle 4,3GHz, alle e-Kerne 3,4GHz
180W: 34588 pts P-Cores: alle 4,7GHz, alle e-Kerne 3,8GHz

Bei Singlethread gibt es praktisch keine Unterschiede, da der einen Kerne nur auf so 30 bis 33W kommt, bei 5,5GHz bis 5,8GHz, je nach Kern. Wer Wert auf eine gute Effizienz legt, kann ja seine CPU selbst mal mit seinem Lieblingsbenchmark bei verschiedenen Power Limits durchbenchen und mit HWInfo64 Sensors kann man ja auch prüfen ob die Package Power stimmt, die lag bei mit dann im Schnitt etwa 1W unter dem Power Limit, denn am Ende jeder Runde sind ja nicht mehr alle Kerne voll ausgelastet. Bei AMD CPUs muss man mit dem ECO Modus nämlich beachten, dass dieser sich auf die Leistungsaufnahme nur der Kerne bezieht, die gesamte Package Power liegt dann aber deutlich höher beim 65W ECO Modus gewöhnlich so bei 88W.
 
E-Cores sind schneller als ein zusätzlicher Thread. Aktuell ist maximal 15-25% drin je nach Anwendung und Optimierung bezüglich der Performance in IPC per HT/SMT. Was beim dem Hybridmodell von Intel immer ein Problem ist und das hat auch AMD mit Chipletts auch ist der Transfer von einer Gruppe auf die Andere verursacht Latenzen. Viele Anwendungen sind okay damit z. B sowas wie Cinebench, aber Games betrafen das halt hart, weil alles andere z. B mit 3ms läuft aber eine Operation auf dem Ecore 10ms braucht. Das Zieht halt die gesamte Performance runter, weil auch die Grafikkarte länger auf Verarbeitung warten müsste. Du kannst aber auch einen Prozess komplett auf Ecores auslagern, dann ist die Leistung auch besser weil die Latenzen wieder besser sind.
 
E-Cores sind schneller als ein zusätzlicher Thread. Aktuell ist maximal 15-25% drin je nach Anwendung und Optimierung bezüglich der Performance in IPC per HT/SMT.
Das Problem von HT/SMT ist, dass es mal dazu entwickelt wurde die Verarbeitungseinheiten des Kerns auch dann auslasten zu können, wenn ein Thread eben auf I/O wie z.B. RAM Zugriffe warten muss. Aber die Architekturverbesserungen zielen ja auf die Steigerung der IPC ab und damit auch darauf diese Wartezyklen in denen eben HT/SMT dann den anderen Thread laufen lässt, zu reduzieren. Z.B. indem man größere Caches nimmt, bessere Sprungvorhersagen, besseres RAM Prefetching, etc. und bei einer idealen Architektur wäre Gewinn durch HT/SMT damit genau Null, eben weil es dann gelungen wäre die Recheneinheiten permanent auch mit nur einem Thread voll auszulasten. Das wird man natürlich nie erreichen, aber die Tendenz geht halt in diese Richtung und damit das HT/SMT immer weniger bringt.

Bei den ersten Atoms brauchte HT noch im die 60%, die hatten aber noch nicht einmal Out-of-Order Architekturen und irgendwann in der Zeit gab es auch mal die Aussage das HT den Kern um so 5% größer macht. Wenn die Architekturen also so gut geworden sind das HT/SMT keine 5% oder wie viel Fläche des Kerns es inzwischen einnimmt, an Mehrleistung mehr bringt, dann wird es wohl verschwinden.

Aber ja, ein e-Kern bringt grob halb so viel Performance wie ein P-Kern bei grob einem Viertel der Leistungsaufnahme und damit bringt ein Cluster aus 4 e-Kernen etwa doppelt so viel Performance bei gleicher Leistungsaufnahme wie ein P-Kern und belegt eben den gleichen Platz auf dem Die.
Was beim dem Hybridmodell von Intel immer ein Problem ist und das hat auch AMD mit Chipletts auch ist der Transfer von einer Gruppe auf die Andere verursacht Latenzen.

Also wenn ich mir die Core-to-Core Latenz des 13900K im Review bei Anandtech ansehe und sie mit der des 7950X vergleiche, so ist der Unterschied in der Latenz zwischen den e- und P-Kernen nicht so groß wie der zwischen den CPU unterschiedlicher CCX. Tatsächlich ist der Unterschied in der Latenz zwischen den P-Kernen zu den e-Kernen nicht wirklich nennenswert größer als der zu bestimmten anderen P-Kernen, es hängt eben davon ab wo welcher Kerne am Ringbus angebunden ist.
 
Und was ist dann der Unterschied zu HT und SMT?
Es gibt keinen, es ist das gleiche. HT ist nur Intels geschützter Name für SMT.

Provokante, bissl scherzhafte Frage:
Verkauft intel nen P Core als 2 E Cores? :d
Nein, es sind zwei unterschiedliche Typen von Cores.
Für mich sieht dieses E-Core Zeug eher nach so nem Alibi für "Guck mal, wir haben auch ganz viele Cores!!111einself" aus, weil 5900x, 5950x und Nachfolger halt schon unbequem sind.
Die E-Cores sind ein Ansatz die Effizienz bei Parallelverarbeitung zu verbessern. Intel plant auch Xeons mit E-Cores, bisher haben alle Xeons nur P-Cores.
AMD kann dann Bulldozerlike zurückschießen und den 16 core mit SMT als 32 e-core ohne SMT verticken,
Nein, Bulldozer war absoluter Schrott und hat AMD beinahe zerstört. Und SMT ersetzt keine Cores, da SMT nur dann sinnvoll ist, wenn die Cores nicht vollständig ausgelastet sind. Beim HPC pinnt man extra Threads an Cores, und dann ist SMT komplett sinnfrei und kostet eher Leistung als das es was bringt. AMD liefert den neuste EPYC mit 128 Cores extra in zwei Versionen: eine mit SMT 9754 und eine ohne SMT 9754S. Die Hyperscaler wollen oftmals kein SMT mehr, weil das mehr Probleme macht, als das als was bringt.
... und wäre an dem E-Core Zeug viel mehr dran als Snakeoil, würde es doch tiefer in die Architektur greifen, den Scheduler... wenn das doch so eine große Sache wäre, das doch nicht so unauffällig zwischendurch in der Modellpflege zu implementieren... oder doch?
Der Scheduler ist Teil des OS. Wenn es also Probleme gibt, ist das ein Problem des OS Herstellers.

… und bei einer idealen Architektur wäre Gewinn durch HT/SMT damit genau Null, eben weil es dann gelungen wäre die Recheneinheiten permanent auch mit nur einem Thread voll auszulasten. Das wird man natürlich nie erreichen, aber die Tendenz geht halt in diese Richtung und damit das HT/SMT immer weniger bringt.
Beim HPC pinnt man Threads an Cores, weil sonst der Scheduler Threads von Cores verlagert, obwohl es dafür keinen Grund gibt. Dadurch werden die Caches invalidiert und alles muss neu geladen werden.
 
Beim HPC pinnt man Threads an Cores, weil sonst der Scheduler Threads von Cores verlagert, obwohl es dafür keinen Grund gibt. Dadurch werden die Caches invalidiert und alles muss neu geladen werden.
Weiß ich und SMT bringt bei bestimmten Anwendungen Nachteile, eben weil man ja effektiv pro Thread nur halb so viel Cache hat wie ohne SMT, da sich ja die Daten und der Programmcode von zwei Threads die Caches teilen müssen.
 
MSI nennt nur 3% Mehrleistung für den Raptor Lake Refresh:
Ja 3 % schneller in was? Erbsenzählen, Bilder malen oder einfach allgemein? Wenn das allgemein ist, klingt das erstmal wenig könnte aber denke ich in Bilder malen was werden. Schließlich soll der Cache auch etwas größer sein und der MC soll ja über 8000er Speicher ermöglichen. Ich vermute diese Generation gehört Intel der OC über Speicher. Also wird es meiner Vermutung nach das Preiswerteste sich ein B760 Board zu holen und memory OC zu betreiben.
 
MSI nennt nur 3% Mehrleistung für den Raptor Lake Refresh:
*SCNR* Das + die zu erwartende Performance Penalty durch Microcodeupdates bei Ryzen 7000 = Gamingkrone ist back :fresse:
 
Intel sagt sich das die 3% nun reichen werden für die AMD CPU's nach ein Sicherheitsfix :fresse:
 
Was Intel tatsächlich sagt: "Das war nicht der Plan und das ist das Beste, was wir kurzfristig tun können."
 
Die 3% beziehen sich doch nur auf RpL Refresh allgemein und sind dem höheren Base-/Turbotakt geschuldet.
Bei den 17% des 14700k bleibt es trozdem und die vier E-Cores mehr, scheinen ja so verkehrt auch nicht zu sein.

..ansonsten AdL/RpL = Downfall_lock -> ergo safe! Intels Plan geht auf. (y)

ps: Ich sehe schon, wie Holzi sich heimlich auf den zweiten Monitor bei MF eine "himmelblaue" ..und_die_Harfen_spielen_nur_dich RpL Refresh Kombi zusammen bastelt und das "Interception" AGESA "Down"grade sorgt dann für den automatisierten "Artikel im Warenkorb jetzt vorbestellen" Zeigefingerreflex! :bigok:
 
Zuletzt bearbeitet:
Außerdem heißen die jetzt 14xxx, ergo neu und besser, das reicht doch 8-)
 
Die 3% beziehen sich doch nur auf RpL Refresh allgemein und sind dem höheren Base-/Turbotakt geschuldet.
Bei den 17% des 14700k bleibt es trozdem und die vier E-Cores mehr, scheinen ja so verkehrt auch nicht zu sein.

..ansonsten AdL/RpL = Downfall_lock -> ergo safe! Intels Plan geht auf. (y)

ps: Ich sehe schon, wie Holzi sich heimlich auf den zweiten Monitor bei MF eine "himmelblaue" ..und_die_Harfen_spielen_nur_dich RpL Refresh Kombi zusammen bastelt und das "Interception" AGESA "Down"grade sorgt dann für den automatisierten "Artikel im Warenkorb jetzt vorbestellen" Zeigefingerreflex! :bigok:
Naja, nein ich glaube wirklich das in der Refresh Generation das Performance Uplift durch den optimierten memory controller kommt in punkto vollgas DDR5.
Ggf. etwas mehr L3 cache bedingt durch zusätzliche Kerne. Die sich insgesamt positiv auf Gaming auswirken werden.
 
urch den optimierten memory controller kommt in punkto vollgas DDR5.

Hat es denn da schon leaks gegeben, was an Speicher Takt erreicht werden kann?

Könnte mir auch vorstellen, dass sich Intel einen optimierten IMC für den 14900KS aufhebt.
 
dass sich Intel einen optimierten IMC für den 14900KS aufhebt.

Die 13700K IMC sind überwiegend nicht so prall, und dass Intel jetzt schon am 14900KS binnen ist dürfte klar sein.

Ob der reguläre 14900K merklich besser sein wird als ein gutes 13900KS Sample wenn die besten Dies in das Töpfchen für die 14900KS wandern ? :unsure:

Das sich Intel die Mehrleistung schön rechnet ist ja klar, von den 17% mehr werden die wenigsten was merken, außer die Cinebenchfraktion. :sneaky:
 
Hat es denn da schon leaks gegeben, was an Speicher Takt erreicht werden kann?

Könnte mir auch vorstellen, dass sich Intel einen optimierten IMC für den 14900KS aufhebt.
Ich meine was von 8000+ gelesen zu haben, müsste die quelle nochmal suchen.
 
EDIT: AMD Prozessoren werden nicht mal bei QVL erwähnt weil sie es eben nicht schaffen.

Also 6400 geht mit dem neusten Agesa jetzt auch im gekoppeltem Modus, Gskill hat dafür bereits ein Expo Kit angekündigt.

 
Zuletzt bearbeitet:
Also 6400 geht mit dem neusten Agesa jetzt auch im gekoppeltem Modus, Gskill hat dafür bereits ein Expo Kit angekündigt.

Das ist ja eine Bananen-Methode die keine Performance bringt.
Natürlich kann man sich das so kaufen für "vielleicht/wahrscheinlich später" aber warum sollte man?
Es macht den Speicher zwar kompatible aber außer Spesen nichts gewesen, das bringt nichts mehr an Performance.
 
Holzi, du kannst es dir wenden, drehen, bunt rechnen (nimm blau, schöne Farbe!) wie du möchtest: Willst du mit 8000+ über die Maps flitzen -> Make my next Time with
Interception Killer.png
(y)


Außerdem, dass schaut doch very very nice'r aus:

Screenshot 2023-08-25 at 15-49-28 UEFI Editor.png


..schon alleine das "i" davor, wenn da jetzt nicht der Zeigefinger die Enter Taste des WK streicheln möchte, dann weiß ich auch nicht mehr.
 
Kommst aber nicht an Intels Leistung ran.
 
Da ist es wieder, das holtogrammatische 'Mit Kanonen auf Spatzen Schießen'. Da sagt jemand ganz moderat und unaufgeregt:

Oha, das klingt etwas enttäuschend. Ich hatte mir etwas mehr erhofft.

Folgt hier - instant - der holtlowsche Reflex...


Das total übertriebene Erwartungen nicht erfüllt werden, war halt klar, aber dann sollte man sich doch mal fragen wo derart übertriebene Erwartungen den hergekommen sind.

Und daher jetzt der enstsprechende kaloreansche Reflex, extra für den Holt:

1.) 'Das' markiert in deutscher Grammatik entweder den neutralen Artikel eines Nomens oder ein Pronomen, steht damit also anstelle des betreffenden Substantives.
NIEMALS, auch nicht zu Beginn eines Satzes, kann es als konsekutive Konjunktion innerhalb eines Nebensatzes stehen. 'Dass' wäre die entsprechend korrekte Wortwahl gewesen.

2.) Auch hier: Konjunktion 'denn' != Akkusativ Artikel Sing. 'den'.

Vielleicht klappt's ja im nächsten Beitrag. Einfach weniger Worte schreiben. Vermindert die Fehleranfälligkeit.


Gern geschehen,

Kalorean
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh