Kern-Monster: Intel Xeon E5-2600 v4 - Neue Server-CPUs mit bis zu 22 Kernen

Als nicht parallelisierbaren Hauptthread bezeichne ich jene Prozessstruktur die iterativ oder rekursiv komplett auf die Ergebnisse der vorangegangenen Berechnung angewiesen ist. Eben genau weil so gut wie alle Spiele in Echtzeit berechnet werden, wird es immer eine solche Prozessstruktur geben, optimierbar einzig und allein durch eine immer höhere Singlethreadleistung.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Öhm, nö ein Sockel hat 32 Kerne a 64 Threads und ist bis 4P geplant also 256 Threads mit 4x Eight Channel DDR4.
Schau doch mal was Du zitiert hast:
und außerdem hat die geplante AMD 32 Kern CPU ja auch nicht alle 32 Kerne auf einem Die, sondern ist praktisch eine Dual-CPU Konfiguration mit beiden CPUs in einem Gehäuse/Sockel.
Und nun schau mal in den von dir geposteten Link:
AMD is supposedly planning a 32-core CPU with an eight-channel DDR4 interface | ExtremeTech
Even if the company uses dual 16-core chips and joins them on one package
 
Zuletzt bearbeitet:
Als nicht parallelisierbaren Hauptthread bezeichne ich jene Prozessstruktur die iterativ oder rekursiv komplett auf die Ergebnisse der vorangegangenen Berechnung angewiesen ist. Eben genau weil so gut wie alle Spiele in Echtzeit berechnet werden, wird es immer eine solche Prozessstruktur geben, optimierbar einzig und allein durch eine immer höhere Singlethreadleistung.

Nur mit dem kleinen Unterschied, dass viele Spiele nicht mehr durch den Hauptthread limitiert werden, sondern durch die Draw-calls. Dieser Flaschenhals fällt jetzt weg.
 
Nur mit dem kleinen Unterschied, dass viele Spiele nicht mehr durch den Hauptthread limitiert werden, sondern durch die Draw-calls. Dieser Flaschenhals fällt jetzt weg.

Kurzzeitig ja, langfristig nein. Sobald DX12 der "Standart" ist ohne alte Zöpfe supporten zu müssen werden die Entwickler ein Teufel tun Draw Call Leistung ungenutzt liegen zu lassen. Den die High Poly Modelle sind ja heute schon gang und gebe und müssen aufwendig optimiert werden damit es spielbar ist. Wenn ich also 30 Minuten Aufwand spare indem ich dein Ingame Haus jeden Stein einzeln Berechnen lasse anstatt ein extra Low poly anzufertigen würde ich es als Entwickler auch tun den Zeit ist Geld.
 
8 Numa Knoten vs 4 Numa Knoten, Tellerrand?

Gesendet von meinem A0001 mit der Hardwareluxx App
 
Früher kostete das Xeon Spitzenmodell für 2-Sockel Server immer so um die 1300€, jetzt muss man 5000€ dafür hinlegen. OK, der Euro ist gegenüber dem Dollar gefallen - aber das macht nur den geringsten Anteil aus. Und wenn man den Fortschritt daran misst, was man pro Euro bekommt, dann bin ich nicht begeistert.

Nunja auf Ebay und Kleinanzeigen bekommt man aber auch schon gebrauchte E5-2699/2696 V3 18Kerner Servermodelle (es sind keine ES gemeint) für gute 1400€. Wenn man mit der geballten Leistung etwas anfangen kann, dann nur zu.:bigok:

Resultat des ganzen ist aber, dass die Kerne auf einmal wichtig werden. 4 Kerne war einmal - in einem Jahr sind die ersten Spiele draussen, die ohne Probleme 8, 10, 12 oder 20 auslasten können, wenn man sie lässt.

Wir werden sehen. Mehr wie 64 ausgelastete Threads wird man aber nicht zu Gesicht bekommen, da Windows nur nur 64 Kerne bzw. Threads erlaubt. Sind mehr Kerne/Threads vorhanden wird eine weitere Prozessorgruppe (Numa-Node) erstellt in welcher die restlichen Kerne verbleiben. Im Taskmanager lassen sich normale Programme immer nur jeweils einer Prozessorgruppe zuweisen aber nicht beiden gleichzeitig, daher kann nicht optimierte Software im Falle eines 44C/88T System nur maximal 64Threads nutzen. Software muss dies explizit unterstützen und das ist in der Regel eher selten.
 
Warum eigentlich dieser Mist (Gerüchte über AMD Vaporware) in einem Thread zu den neuen Xeon E5v4?
Ja und nun? Es sind trotzdem 32 Kerne in einem Sockel, und Octa-Channel DDR4. 4P sind dann 4x Sockel wie bisher beim G34 Sockel.
Es wäre so schön, wenn Du dich mal wirklich mit dem Thema auseinandersetzen würdest. Ich habe schon auf Opteron 6100 (Sockel G34) Programme geschrieben sowie Benchmarks durchlaufen lassen. Fakt ist, das ist zwar physikalisch ein Sockel, aber effektiv sind es zwei CPUs, die nur einem Gehäuse verbaut wurden. Effektiv verhält sich ein Opteron 6100 Quadsocket System sowie ein altes Opteron 800 System mit acht Sockeln.
 
8 Numa Knoten vs 4 Numa Knoten, Tellerrand?

Gesendet von meinem A0001 mit der Hardwareluxx App
Ach das meint ihr, ok das stimmt natürlich es sind zwei unabhängige Cores, die auf einem Träger sitzen.
Das ist ja nicht neues, gibt es schon seit Core Duo.


Warum eigentlich dieser Mist (Gerüchte über AMD Vaporware) in einem Thread zu den neuen Xeon E5v4?

Es wäre so schön, wenn Du dich mal wirklich mit dem Thema auseinandersetzen würdest. Ich habe schon auf Opteron 6100 (Sockel G34) Programme geschrieben sowie Benchmarks durchlaufen lassen. Fakt ist, das ist zwar physikalisch ein Sockel, aber effektiv sind es zwei CPUs, die nur einem Gehäuse verbaut wurden. Effektiv verhält sich ein Opteron 6100 Quadsocket System sowie ein altes Opteron 800 System mit acht Sockeln.
Warum nicht? Die Überschrift beinhaltet Kern-Monster.
Also wird sich der ZEN Opteron mit diesen Xeon E5v4 messen müssen.
AMD will ja zurück in das Server Geschäft, das klappt aber nicht mit der hälfte der Threads! ;)
 
Mehr wie 64 ausgelastete Threads wird man aber nicht zu Gesicht bekommen, da Windows nur nur 64 Kerne bzw. Threads erlaubt.
Der Trend geht ohnehin dahin, daß man ein Windows Programm nutzt und der HPC Codeteil auf einem Linux Cluster läuft und da existiert das Problem mit der maximalen Threadzahl oder dem maximalen Speicherausbau (Win10 max 2TB, Win8 Enterprise 0,5 TB, Win7 Enterprise 192GB, Win Server 2012 Datacenter 4TB) nicht. Die hier vorgestellten Xeon E5v4 2600 unterstützen nun max. 3TB RAM. Entsprechend wird sich der max Speicherausbau bei den E5v4-4600 und dann den E7v4 verdoppeln. Bisher kann ein Xeon E7v3 8 Sockel System maximal 12TB RAM aufnehmen. (Das ist z.B. für SAP HANA von Interesse.) Wie man leicht sieht, werden solche Systeme jetzt schon nicht unter Windows betrieben.

- - - Updated - - -

Also wird sich der ZEN Opteron mit diesen Xeon E5v4 messen müssen.
Darüber können wir gerne diskutieren, wenn AMD das Produkt auch vorstellt. Momentan ist es nur heiße Luft.
 
Zuletzt bearbeitet:
Bei Server Hardware kann man halt in die Breite gehen (was man ja auch tut) und je nach Anwendungsbereich macht sich das bezahlt. Gerade in Zeiten von VMs ist das eine tolle Sache. Leider steigt die Single Thread Leistung in den letzten Jahren auch bzw. gerade im Serverbereich nicht so stark an.
Die ist da aber auch nicht so wichtig und für die paar Anwendungen wo sie wichtig ist, gibt es spezielle Versionen mit wenigen Kernen und hohem Takt, die brauchen aber dann auch sehr viel Leistung und liefern eben wirklich nur bei Singlethread eine gute Performance. Anandtech hat es schön so zusammengefasst:
Man bringt bei den meisten Modellen lieber mehr Kerne, so viele wie man bei der Leistungsaufnahme noch unterbringen kann ohne die Singlethread Performance wirklich leiden zu lassen. Das ist z.B. bei den Xeon-D anders, die haben sehr geringe Taktraten und damit eine schlechte Singlethread Performance, dafür aber viel weniger TDP und noch klarer auf Multithreadanwendungen optimiert. Man muss sich eben entscheiden ob Singlethread oder Multithread Priorität haben soll und mit den Turbotakten versucht man ja ein wenig eine Brücke zwischen beiden Anforderungen zu bauen, aber letztlich ist auch das nur ein unvollständiger Kompromiss.

Und die Taktraten werden auch nur moderat angehoben da man sich hier anscheinend an der Effizienzgrenze bewegt.
Das ist wohl eindeutig so, man schaue sich mal die Xeon-D Familie an, was für TDP mit welchen Kernzahlen und Taktraten die haben, dann sieht was etwas weniger Takt da ausmacht und auch wenn man mal die ganze Palette der E5 v4 betrachtet, sieht man z.B. einen E5-2650L v4 mit 14 Kernen@1,7GHz und 65W TDP, währen der E5-2660 v4 ebenfalls 14 Kerne bei 2GHz laufen lässt und 105W TDP hat. Beim E5-2680 v4 laufen die 14 Kerne mit 2,4GHz und die TDP ist 120W, beim E5-2690 v4 sind es 135€ um die Kerne bei 2,6GHz Grundtakt laufen zu lassen. Da scheint es noch relativ gut zu skalieren, aber wenn eine 3 vorne stehen soll, dann sind beim E5-2667 v4 8 Kerne schon mit 135W TDP dabei und beim E5-2643 v4 werden bei 135W TDP nur noch 6 Kerne auf 3,4GHz gebraucht, beim E5-2637 v4 nur noch 4 Kerne auf 3,5GHz. Dabei kommen die 4 Kerne des E5-2623 v4 @2,6GHz mit 85W TDP aus, also knapp 60% mehr TDP für 35% mehr Takt und dabei ist die Leistungsaufnahme des ganzes Uncore Bereiches mit drin und dürfte bei beiden sehr ähnlich sein, womit der Unterschied bei den Kernen selbst also noch viel größer ist. Irgendwo umbei 3GHz dürfte damit die Leistungsaufnahme anfangen deutlich überproportional zu steigen.

Was immer gerne in den Foren übersehen wird, sind die Detailverbesserungen, wie z.B. Posted Interrupts die natürlich nur in bestimmten Anwendungen zum Tragen kommen, dort aber eben eine Menge ausmachen, wie eben z.B. damals die AES Befehlserweiterung von der auch viele Heimanwender profitiert haben.
Beim Übertakten kann man ja schon froh sein 10-25% mehr Takt zu erreichen. Und große Übertaktungsergebnisse wie früher kann man eh kaum noch erreichen da man die meisten kleinen Modelle gar nicht mehr (viel) übertakten kann.
Das Übertakten hat sich mehr oder weniger überlebt, zumal Intel ja auch bei den i7 K für den S. 115x inzwischen ab Werk schon mehr Takt verwendet als bei denen ohne K und damit recht weit an die Grenzen geht. Das fing mit dem i7-4790K an und auch der i7-6700K bietet mehr Takt als der ohne K, hat aber wohl auch noch etwas mehr OC-Potential als der 4790K.


Schau doch mal was Du zitiert hast:

Und nun schau mal in den von dir geposteten Link:
AMD is supposedly planning a 32-core CPU with an eight-channel DDR4 interface | ExtremeTech
Das war ein von mit zitiertet Link und damit nicht wirklich ein von mir geposteter Link. Das es 2 Dies sein werden, kann man aber wohl als gegeben annehmen.

Öhm, nö ein Sockel hat 32 Kerne a 64 Threads und ist bis 4P geplant also 256 Threads mit 4x Eight Channel DDR4.
Von 4P hatte ich jetzt noch nichts gelesen, aber das würde dann bei 8 Channel RAM ein richtig großes Mainboard werden.

Ach das meint ihr, ok das stimmt natürlich es sind zwei unabhängige Cores, die auf einem Träger sitzen.
Das ist ja nicht neues, gibt es schon seit Core Duo.
Eben und schon damals wurde es nicht als echter 4 Kerner akzeptiert. Es sind 32 Kerne in einem Sockel, aber es ist dann kein echter 32 Kerner und außerdem alles noch Gerüchte, warten wir die Vorstellung und die ersten Reviews ab.
Also wird sich der ZEN Opteron mit diesen Xeon E5v4 messen müssen.
Oder mit den Xeon E7 v4 oder sogar schon mit deren Nachfolgern, der v5 Generation, je nachdem wann er denn auf den Markt kommt.
 
Das war ein von mit zitiertet Link und damit nicht wirklich ein von mir geposteter Link. Das es 2 Dies sein werden, kann man aber wohl als gegeben annehmen.
Ich weiss und ich weiss :d
Mein ganzer Kommentar #32 galt auch Phantomias88, weil er dich vorher zitiert hatte.
War von mit unklar formuliert und ist nicht korrekt bei dir angekommen.
 
Zuletzt bearbeitet:
Von 4P hatte ich jetzt noch nichts gelesen, aber das würde dann bei 8 Channel RAM ein richtig großes Mainboard werden.

Eben und schon damals wurde es nicht als echter 4 Kerner akzeptiert. Es sind 32 Kerne in einem Sockel, aber es ist dann kein echter 32 Kerner und außerdem alles noch Gerüchte, warten wir die Vorstellung und die ersten Reviews ab.
Oder mit den Xeon E7 v4 oder sogar schon mit deren Nachfolgern, der v5 Generation, je nachdem wann er denn auf den Markt kommt.
Die Quadrat Millimeter sind beim "stacking" auch eher vernachlässigbar, aka 3D Transistoren.

OB echt oder nicht entscheiden die Entwickler, egal welches Layer. :angel:
8x 128Bit sind nicht zuviel verlangt. ;)
 
Kurzzeitig ja, langfristig nein. Sobald DX12 der "Standart" ist ohne alte Zöpfe supporten zu müssen werden die Entwickler ein Teufel tun Draw Call Leistung ungenutzt liegen zu lassen. Den die High Poly Modelle sind ja heute schon gang und gebe und müssen aufwendig optimiert werden damit es spielbar ist. Wenn ich also 30 Minuten Aufwand spare indem ich dein Ingame Haus jeden Stein einzeln Berechnen lasse anstatt ein extra Low poly anzufertigen würde ich es als Entwickler auch tun den Zeit ist Geld.

Bin ich mir nicht so sicher - auch die Tools werden weiterentwickelt. Saubere 3D Modelle + Tesselation und schon kannst du auf deine dedizierten LODs verzichten, wenn du genügend Kerne hast (spart nebenbei auch etwas Speicher, aber das ist marginal)

Auch gehen wir so langsam auf den Trend "fotorealistisch" zu - da werden die Entwickler nen Teufel tun um auf biegen und brechen Low-Poly "Artefakte" einzubauen... ich denke, die zusätzliche Rechenpower wird eher in sowas wie Licht und Schatteneffekte gesteckt, welche die Szene Kinofilm-artig macht und sie noch beeindruckender wirken lässt, als sie es in der Realität wirklich ist. Auch erweiterte Partikelsimulationen (Beispiel Wasserfall) kann ich mir gut als zusätzlichen Punkt vorstellen, wo man Performance reinwerfen wird. (inklusive Rauch/Feuereffekte - halt Partikel...)

Das alles kann durch die Anwesenheit zusätzlicher Kerne praktisch linear skalierbar hinzugeschaltet werden, so dass die CPU-Limitierung für die nächsten Paar Jahre erst einmal Geschichte sein wird - abgesehen natürlich vom richtig erwähnten Hauptthread. Aber auch da kann man optimieren, wenn auch nur mit mehr Hirnschmalz und Aufwand. (Entkoppelte Prozesse [eher Aufwändig, das man das gesamte Spieldesign damit verhackstücken kann], Interpolationen [so dass ich nicht mehr auf ein Ergebnis warten muss], Vorwärtsberechnungen [In der Zeit, wo ein Ergebnis berechnet wird, kennt man deren Abhängigkeiten und kann sie mit einem Vorschub verlangen])

Aber zum Thema: Die zusätzlichen Kerne werden vor allem dem Grafikbereich der Spiele helfen, dafür sind die neuen APIs ja auch da und der Hauptthread wird kaum mehr limitieren, als er es jetzt schon tut.
 
Wann ungefähr werden die neuen EPs mit stabilem Preis im Handel erhältlich sein?
 
Zuletzt bearbeitet:
Im Thermal Guide wird eine Offroad Map CPU E5-2689v4 angegeben: 165W TDP und 10 Cores. Was wieder mal ärgerlich empfinde, wieso integriert Intel die Speedbin Übersicht nicht in die Doku? So muß man erstmal im Netz suchen, um eine Übersicht um die Turbotaktstufen zu sehen. Wer hohe Single Thread Leistung braucht ist mit E5v4 frequency optimized Modellen am besten beraten (E5-2667v4, E5-2643v4 und E5-2637v4) am besten beraten. Diese Modelle halten faktisch ihren Maximaltakt auch beim Allcoretubro durch, solange man die CPUs ausreichend kühlt. Da fällt selbst die Workstation CPU ab.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh