4 reale Kerne und 4 SMT Kerne. Maximal bringt so ein SMT Kern 30% mehr Leistung und keine 100% wie es ein realer Kern realisieren würde. Insofern ist es lächerlich davon zu reden das es 8 Kerne sind, weil es auch Situationen gibt in der SMT Kerne die Leistung sogar ausbremsen.
So gesehen wird ein realer 6 Kern gegen einen realen vier Kern mit 4 SMT Kerne kaum das Nachsehen haben.
Es hat ja auch niemand etwas von 8 Kernen gesagt. Ich mag eigentlich die Formulierung "4 reale + 4 SMT Kerne" nicht. Man sollte sich in diesem Zusammenhang von der Denkweise der strikten Kerne lösen. Auf Ebene des Betriebssystems sind es erstmal 8 gleichberechtigte logische Prozessoren, die mit 8 Threads gefüttert werden können. Und so ist es im Grunde auch auf Hardware Ebene. Lediglich mit dem Unterschied, dass sich 2 Threads diverse Ressourcen eines Kerns teilen müssen. Und genau deswegen wird es hier auch nie eine Skalierung von 100% geben.
Wie ich schon erwähnte, was wo das Nachsehen hat, hängt von der jeweiligen Anwendung ab. HPC Workloads lasten die Ressourcen eines Kerns so schon gut aus. Dort bringt SMT nicht viel und führt teilweise sogar zu Performance Verlusten. Gut zu sehen bei Linpack. Hier dreht Istanbul einsam seine Kreise. Und das trotz alter Plattform. Intel empfiehlt hier sogar, SMT abzuschalten. Das ist unter anderem ein Grund, warum ich kein Fan von Intels SMT Implementierung bin.
Andere Workloads, die weniger stark die geteilten Ressourcen fordern bzw die Last besser verteilen, können hingegen gut von SMT profitieren. Dummerweise widerspricht das einem heute sehr gebräuchlichen Paradigma von Multithreading, Partitionierung. Hinzu kommt noch, dass Nehalem einen IPC Vorteil gegenüber Shanghai pro logischem Kern hat. Der ist zwar nicht gross. Den muss man aber trotzdem noch in die Rechnung mit einbeziehen.
Bisher ist das aber alles noch sehr viel Stochern im Dunkeln. Interessant wird es eigentlich erst mit Lisbon. Dann wird man besser sehen können, wie ein 6-Kerner ohne SMT gegenüber einem 4-Kerner mit SMT abschneidet. Momentan kränkelt Istanbul, wenn überhaupt, ja vor allem noch an seiner Bandbreite aufgrund von lediglich HT1. Indirekt stimme ich dir aber zu. Ein 2,6 GHz 6-Kern Opteron sollte es im Grunde mit mehr als nur einem 2,66 GHz Nehalem Xeon aufnehmen können.
Wie auch immer. Es sollte letztendlich klar werden, dass es wenig Sinn macht, Deneb und Bloomfield technologisch zu vergleichen. Sie bedienen nicht zuletzt auch zwei unterschiedliche Marktsegmente.
Und was sagt uns das? Der P2 hat nebenbei noch 600mhz Nb-Takt mehr und einen Ramvorteil, kann man nicht mal ansatzweise vergleichen, findest du nicht?
Nein. Wenn du mal genau hinschaust, es gibt auf AMD Seite ebenfalls Nachteile. ZB hatte das AMD System einen älteren Kernel. Es war lediglich ein DDR2 Phenom 2. Ein DDR3 Phenom 2 hat eine NB von 2 GHz. Opterons laufen grundsätzlich sogar mit 2,2 GHz NB. Der Unterschied gegenüber den eingestellten 2,4 GHz NB ist dann relativ marginal. Usw.
Das ist aber nicht der Punkt. Der Punkt ist, alle diese Unterschiede sind bis zu einem gewissen Grad abschätzbar.
Kleines Beispiel, nimm einfach mal die Lame Ergebnisse von Phoronix (Ubuntu GCC):
i7 965 @ 3,33 GHz (3,2 + TM?) = 30,27 sec
X4 940 @ 3 GHz = 32,14
Wie du im zuvor verlinkten Artikel sehen kannst, sind hier die Unterschiede zwischen 32 und 64 Bit sehr gering. 32 Bit zeigen sogar einen Vorteil von etwa 5%. Rechne von mir aus noch 5% durch den erhöhten NB Takt beim Phenom 2 weg. Damit kommst du auf gut 10% Vorsprung für den i7. Also ziemlich exakt das, was er höher taktet. Die IPC ist praktisch identisch. Man sollte noch erwähnen, Lame nutzt lediglich einen logischen Prozessor. SMT greift hier also nicht. Nur dass sich niemand wundert.
Nun schauen wir uns mal typische Windows Ergebnisse an, wie zB hier bei
Au-Ja!:
i7 965 @ 3,2 GHz = 233 sec
X4 940 @ 3 GHz = 297 sec
Das ergibt einen Unterschied pro Takt von etwa 20%. Und damit ebenso 20% zu dem Verhältnis von oben.
Es geht hier nicht um einzelne Prozente, und auch nicht um generelle Schlussfolgerungen, sondern um spezifische Gewichtungen. Und dass da eine Diskrepanz vorhanden ist, ist dir nun hoffentlich klar geworden.
Ich sage es gerne nochmal, die Hardware ist die gleiche, der Quellcode ebenfalls, lediglich die erstellten Binarys nicht.
Ich hatte übrigens im letzten Jahr schon mal mehrere Beiträge zu den Unterschieden diverser Compiler geschrieben, ebenfalls anhand von Lame. Und das ist bei weitem kein Einzelfall.
Dann darf man also auch nicht mehr sagen, dass ein Porsche einen Golf versägt?
Doch, das darfst du ruhig. Das ist schliesslich keine Wertung bezogen auf den Golf, "miserabel" ist das hingegen sehr wohl.
Und jetzt lass langsam mal gut sein. Jeder ausser dir fand die Formulierung überzogen. Und das völlig zurecht. Das sollte dir genug zu denken geben.
Der X58 verkraftet maximal eine CPU und ist eine reine Desktop-Plattform.
Nein, ist er nicht. Die Basis entspringt der Server Plattform Gainestown.
Zusätzlich gibt es den gleichen Sockel, LGA1366, auch im 2-Sockel Workstationbereich. Ein i7 System ist definitiv kein Server, schau dir mal an womit X58-Boards beworben werden. Da tauchen so Dinge wie "OC" und "Gaming" auf, such das mal bei einem Istanbul System...
Du scheinst wieder mal überhaupt nicht zu verstehen, worum es geht. Niemand hat behauptet, dass i7 Server wäre. Genauso wenig, dass Istanbul Desktop wäre. Es ging überhaupt nicht um Plattformen, sondern nur um die Prozessoren selbst. Und das Silizium ist letztendlich bei AMD und Intel das gleiche, egal ob Server oder Desktop. Rest siehe oben.
Was ist das jetzt für eine Argumentation? Dann war auch der P4 mit HT nicht vergleichbar mit dem kleineren und SMT-freien Athlon-Kernen dieser Zeit?
Korrekt. Wie kommst du eigentlich auf diesen Gedanken?
Dann hat also ein PDC E6300 auch ein besseres P/L als ein X4 955?
Natürlich. Genauso der X2 250.
Prozessoren nach unten hin haben meistens ein besseres P/L Verhältnis. Das sollte eigentlich bekannt sein.
Genau das stand doch auch im Review... "Nice Bang for the Bucks". Das ist doch der Punkt, genau diese unterschiedliche Preisklasse und das gute P/L wurden mehrfach erwähnt.
Das macht die deplatzierte Aussage aber nun mal nicht besser und ist einfach unseriös.
Da fragt man sich doch glatt, was 32Bit vs. 64Bit sowie OC vs. non-OC Vergleiche bei verschiedenen Softwareversionen wie oben bei mr. dude sollen...
Schon lustig, das ausgerechnet aus deinem Mund zu hören nach deinem peinlichen "IPC Vergleich". Wenigstens kolportiere ich nicht mit an den Haaren herbeigezogenen Bewertungen oder einem lächerlichen Fazit. Du weisst schon, 50% und so. Eigentlich bin ich nicht jemand, der sowas in der Öffentlichkeit breit tritt, aber du hast es ja nicht mal für notwendig gehalten, auf meine PN bezüglich des Turbo Mode zu antworten.
Sowas lässt jeden rational denkenden Menschen nur zu einem Schluss kommen. Aber das kannst du dir vermutlich selbst ausrechnen.