[News] AMD´s FX 8350 vor i7 3770K in Crysis 3

dann frage ich mich halt wie es sein kann, dass der 6 kerner 20% skaliert und SMT bremst.
Ich habe dafür keine Erklärung.
Die pauschalaussage SMT bringt nur dann etwas, wenn der 6 Kerner gut sklaiert ist quatsch und überhaupt nicht i.dR. so, denn vielmehr kann beides gleichoft auftreten.

Nur wo tut ein Sechskerner das nachweislich? Die 19%, die Dochurt dir gezeigt hat sind nur ein Nachweis für schlechtes Benchen. Bei Intel steht da nämlich der 3570k vor dem 3960x, was auch vier vs sechs Kerne sind...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Optimalerweise sollte SMT 1/2 soviel bringen wie 50% mehr Kerne, nicht 1/5, ich hab keine Ahnung wie du das zusammenrechnest.

SMT im Optimalfall 25%, 50% mehr Kerne im Optimalfall 50%.

Auf das 1/5 kommst du, wenn das Spiel z.B. nur bis 6 Kerne skaliert. Nehmen wir der Einfachheit halber mal an, dass der 6-Kerner perfekt ausgelastet wird und volle 50% Mehrleistung erreicht. Alle Threads erzeugen die gleiche Last und werden entsprechend auf den Kernen/Threads hin- und hergeschoben, um eine bestmögliche Auslastung zu erreichen.

Auslastung 6-Kerner:
Kern 1: 100% der Zeit mit Thread 1 ausgelastet
Kern 2: 100% der Zeit mit Thread 2 ausgelastet
...
Kern 6: 100% der Zeit mit Thread 6 ausgelastet

-> Jeder Thread bekommt also volle 100% Rechenzeit.

Auslastung 4-Kerner:
Kern 1: 66% der Zeit mit Thread 1 ausgelastet, 33% der Zeit mit Thread 2 ausgelastet
Kern 2: 33% der Zeit mit Thread 2 ausgelastet, 66% der Zeit mit Thread 3 ausgelastet
Kern 3: 66% der Zeit mit Thread 4 ausgelastet, 33% der Zeit mit Thread 5 ausgelastet
Kern 3: 33% der Zeit mit Thread 5 ausgelastet, 66% der Zeit mit Thread 6 ausgelastet

-> Wie man sehr schön erkennt, hat nun jeder Thread nur noch 66% der Rechenzeit zur Verfügung -> darum ist der native 6-Kerner auch volle 50% schneller.

Auslastung 4-Kerner mit SMT - jetzt wird es etwas komplizierter: Um die möglichen ~20% SMT-Gewinn zu berücksichtigen, liefert jetzt jeder Thread bei aktiviertem SMT 60%-Rechenzeit. Damit hat ein gesamter Kern in dieser Rechnung wiederum 120% "Gesamtkapazität", was dem SMT-Gewinn entspricht. Kerne ohne SMT haben weiterhin 100%. Weiterhin werden die Lastthreads genau so verteilt, das jeder das gleiche Stückchen der verfügbaren Gesamtrechenzeit bekommt.

Kern 1, Thread 1: 73% der Zeit mit Thread 1 ausgelastet, 27% der Zeit mit Thread 2 ausgelastet
Kern 1, Thread 2: inaktiv (da die Anwendung zeitgleich nur 6 Threads auslasten kann)
Kern 2, Thread 1: 46% der Zeit mit Thread 2 ausgelastet, 54% der Zeit mit Thread 3 ausgelastet
Kern 2, Thread 2: inaktiv (da die Anwendung zeitgleich nur 6 Threads auslasten kann)
Kern 3, Thread 1: 19% der Zeit mit Thread 3 ausgelastet, 41% der Zeit mit Thread 4 ausgelastet
Kern 3, Thread 2: 32% der Zeit mit Thread 4 ausgelastet, 28% der Zeit mit Thread 5 ausgelastet
Kern 4, Thread 1: 45% der Zeit mit Thread 5 ausgelastet, 15% der Zeit mit Thread 6 ausgelastet
Kern 4, Thread 2: 60% der Zeit mit Thread 6 ausgelastet

-> Wie man sieht, stehen nun jedem Thread 73% Rechenzeit zur Verfügung (durch Rundungsfehler hier bei Thread 6 75%, darüber mal hinwegsehen). Damit beträgt der SMT-Gewinn gegenüber dem 4-Kerner 10% (73% zu 66% Rechenzeit pro Lastthread). Oder anders gesagt: Der SMT-Gewinn ist 1/5 so groß wie der Zuwachs von 4 auf 6 Kerne.

Erst wenn mehr als 6 Threads zur Verfügung stehen, kann der SMT-Gewinn mehr als 10% betragen. Genauergesagt wächst die Steigerung bei diesen Rechenparametern linear bis auf maximal 20%, sobald mindestens 8 Threads ausgelastet werden.

Profitiert der 6-Kerner weniger stark, sinkt der SMT-Gewinn proportional mit ab. Beispiel: Das Spiel lastet immernoch 6 Threads aus, davon aber nur 4 Hauptthreads vollständig, die beiden anderen erzeugen nur eine kleinere Last. Wenn der 6-Kerner dadurch nur 20% zulegt, bleiben für den 4-Kerner mit SMT noch mickrige 4%. Und mehr als 20%-Gewinn durch einen 6-Kerner zeigt wohl kaum ein aktuelles Spiel, wenn ich mal so die verfügbaren Benchmarks betrachte.
 
Zuletzt bearbeitet:
Weiß nicht ob sich das alles immer so ausrechnen/berechnen lässt, hier mal ein Beispiel mit Lynfield :

lyfield.jpg

Hundert Prozent ist der i5-750, rechne ich ca. 8% durch Cache/Takt/Turbo Vorteil ab, komme ich auf 35% Leistungszuwachs in Anno2070 durch SMT ;)

Richtig Lustig wird es, wenn man den 25K mit 27K vergleicht - 7% mehr für 27K durch Takt/Cache/SMT. Oder auch 3570K vers. 3770K, da erlaubt es sich glatt der i5 durch weniger Takt/Cache/Turbo/nonSMT 12% schneller zu sein :d

Und was sagt der Realist, entscheidend ist das was bei einen zu Hause hinten raus kommt - Wer weiß was ein anderer Depp mit den bei CB zu Verfügung stehenden CPUs so an Ergebnisse bekommt, höchst wahrscheinlich komplett andere :d


P.S. Zieht euch mal ganz Nonchalant in die Rübe, dass der Alte Lynfield alle Nachfolger-CPUs mit SMT ala 27K/37K hinter sich lässt ^^
 
Zuletzt bearbeitet:
Geil ist auch, dass der i7-870 6% vor dem i7 2700k - mit 600 Mhz weniger Takt.... :d
 
Mick_Foley schrieb:
Nur wo tut ein Sechskerner das nachweislich? Die 19%, die Dochurt dir gezeigt hat sind nur ein Nachweis für schlechtes Benchen. Bei Intel steht da nämlich der 3570k vor dem 3960x, was auch vier vs sechs Kerne sind...

Keine Ahnung ich habe mehrfach solche Szenarien verlinkt und könnte nochmal 10 heraussuchen.
Jetzt ist es schon schlechtes Benchen... haha.

Undertaker 1 schrieb:
Auf das 1/5 kommst du, wenn das Spiel z.B. nur bis 6 Kerne skaliert
Ja unter der Vorraussetzung schon.
 
Keine Ahnung ich habe mehrfach solche Szenarien verlinkt und könnte nochmal 10 heraussuchen.
Jetzt ist es schon schlechtes Benchen... haha.

Dann liefere doch mal 10 Szenarien in denen ein Sechskerner immer deutlich vor einem Vierkerner ist und zwar analog bei AMD UND Intel! Und wenn du findest, dass ein Bench gut gemacht ist, wenn ein Phenom X6 20% vor einem Phenom x4 steht, aber ein 3570k vor einem 3960x (Im selben Spiel wohl gemerkt!), dann ist dir wirklich nicht mehr zu helfen...:hmm: Oder bremst das SMT beim 3960x jetzt schon so sehr, dass die beiden zusätzlichen nativen Kerne gar nichts mehr bringen? :fresse::rofl:
 
Zuletzt bearbeitet:
Wenn die Intel-CPUs durch ihre hohe Performance so langsam in ein GPU-Limit rutschen, können die Gewinne durch zusätzliche Kerne dort schon etwas anders aussehen. Wollte ich nur mal anmerken :)
 
Das kommt ja noch dazu. Deswegen sag ich ja auch das es am einfachsten ist, den i3 zur Untersuchung der SMT-Profite heranzuziehen. Und bei dem sehen wir im Mittel(!) locker 20% Leistungszuwachs, in Einzelfällen sogar noch mehr. Beim i7 ist das durch GPU-Limits und fehlende Parallelisierung nur in Anwendungen möglich, in Spielen müssen wir wohl noch mehrere Jahre darauf warten.
 
@boxleitnerb: Dem würde ich auch nicht widersprechen. ;) Nur taugt so ein Ergebnis halt nichts für die Diskussion. Die Gründe hat Undertaker1 mir ja quasi schon vorweg genommen. :d

P.S.: Im zuvor von mir monierten Test steht, wie schon geschrieben ein i7 870 vor einem i7 2700k. Das hat nichts mehr mit Kernen zu tun und ist nur noch Blödsinn, man muss sich aolche Ergebniss auch immer etwas genauer angucken...
 
Zuletzt bearbeitet:
@Schaffe 89

Wie zufrieden bist mit Deinem AMD FX 8350 und lässt jenen auf Standard Takt 4,0 Turbo 4,2 laufen.
Zieht er echt so viel Strom beim Zocken, oder ausnahmslos nur bei voller Auslasung aller 8 Kerne, welches sehr selten gegeben ist.
Dank Dir!
 
Mick_Foley schrieb:
Und wenn du findest, dass ein Bench gut gemacht ist, wenn ein Phenom X6 20% vor einem Phenom x4 steht, aber ein 3570k vor einem 3960x (Im selben Spiel wohl gemerkt!)

Wieso sollte er schlecht gemacht sein? Irgendwelche Argumente? Du weißt schon, dass prinzipiell schwächere Prozessoren von mehr Kernen eher profitieren, als grundsätzlich stärkere? Außerdem welchen Benchmark meinst du konkret, bitte verlinken.!
Teste mal ein Spiel mit einem 6 Kern Prozessor und takte diesen nicht auf 4ghz, sondern auf 2,0 ghz runter und du siehst eine viel bessere multithreadingskalierung.

Undertaker 1 schrieb:
Das kommt ja noch dazu. Deswegen sag ich ja auch das es am einfachsten ist, den i3 zur Untersuchung der SMT-Profite heranzuziehen.

Was Käse ist. Das Spiel lastet die ersten beiden Prozessoren komplett aus und so schafft es der i3 auch SMT komplett in der Pipeline unterzubringen.
Bei den 4 oder 6 Kern prozessoren ist das viel schweriger und der Overhead steigt an, solche Erklärungen findest du bei jeder vernünftigen SMT Analyse, selbst bei Wikipedia.

Und nein das liegt nicht daran, weil das Spiel nicht mehr Kerne unterstützt, sondern weil Intels Implementierung nicht in der Lage ist bei nicht vorhersehbaren Anwendungen wie Spielen die Performance durch SMT stark zu erhöhen.
Wie kann es denn sein, dass der 6 Kerner 20% vor dem 4 Kerner ist und SMT bremst?

Das sagt, dir dass SMT nicht das gleiche ist wie weitere Einheiten, ergo kann es sich auch nicht genauso verhalten.

Berni_ATI schrieb:
Wie zufrieden bist mit Deinem AMD FX 8350 und lässt jenen auf Standard Takt 4,0 Turbo 4,2 laufen.
Zieht er echt so viel Strom beim Zocken, oder ausnahmslos nur bei voller Auslasung aller 8 Kerne, welches sehr selten gegeben ist.

Ich hab ein gutes Strommessgerät an der Steckdose und das sagt ( inkl. Monitor) wenn man Prime 95 + Heaven laufen hat, dass der Stromverbrauch beim Spielen rund 80 Watt geringer ist.

Heißt für mich dass der Vishera, vor allem im GPU Limit, oder auch generell bei Spielen bei weitem nicht soviel Strom benötigt, wie kollportiert.

Ich kenne keine Seite die sowas je gemessen hat.

Nur taugt so ein Ergebnis halt nichts für die Diskussion. Die Gründe hat Undertaker1 mir ja quasi schon vorweg genommen.

Das problem ist, dass eurer Meinung nach nie ein ergebnis taugt, und ihr selbst nicht in der Lage seit überhaupt irgendetwas zu verlinken.
 
Zuletzt bearbeitet:
@Schaffe 89

Wie zufrieden bist mit Deinem AMD FX 8350 und lässt jenen auf Standard Takt 4,0 Turbo 4,2 laufen.
Zieht er echt so viel Strom beim Zocken, oder ausnahmslos nur bei voller Auslasung aller 8 Kerne, welches sehr selten gegeben ist.
Dank Dir!

Wenn du ihn bei 4 Ghz laufen lässt ist einiges möglich.Link
 
Wieso sollte er schlecht gemacht sein? Irgendwelche Argumente? Du weißt schon, dass prinzipiell schwächere Prozessoren von mehr Kernen eher profitieren, als grundsätzlich stärkere? Außerdem welchen Benchmark meinst du konkret, bitte verlinken.!
Teste mal ein Spiel mit einem 6 Kern Prozessor und takte diesen nicht auf 4ghz, sondern auf 2,0 ghz runter und du siehst eine viel bessere multithreadingskalierung.

Test: Test: AMD FX-8350 Man beachte auch wo der i7 870 steht! P.S.: Man beachte mal generell wo welche i5s und i7s mit welchen Abstand stehen...^^

Ansonsten musst du mir das mit schwachen und starken Kernen nicht erklären, nur ist so ein Spaß dann auch kein Beweis für deine Aussage, das SMT in Spielen nichts bringt. Wäre der Parallelisierungsgrad in einem Spiel hoch genug würde es was bringen. Das es nichts bringt oder gar bremst, hat nichts mit dem funktionieren der Technik, sondern mit der Software zu tun. Das beweist ja schon ein i3, wo das SMT greift, weil sich das innerhalb der magischen vier Thread-Grenze bewegt.

Und Berni_ATI solltest du vielleicht konkrete Zahlen nennen, wie viel OC und wie viel Verbrauch, 80 Watt geringer sagt irgendwie nicht viel. ;)
 
Zuletzt bearbeitet:
Was Käse ist. Das Spiel lastet die ersten beiden Prozessoren komplett aus und so schafft es der i3 auch SMT komplett in der Pipeline unterzubringen.
Bei den 4 oder 6 Kern prozessoren ist das viel schweriger und der Overhead steigt an, solche Erklärungen findest du bei jeder vernünftigen SMT Analyse, selbst bei Wikipedia.

Ich bezweifle sehr stark das irgendjemand außer dir jemals behauptet, geschrieben bzw. nachgewiesen hat, dass das Verhältnis von SMT- zu CMP-Skalierung in irgendeiner Abhängigkeit von der Kernzahl steht. Denn das ist vollkommener Unfug. Du wirfst das vermutlich schon wieder damit durcheinander, dass die Skalierung mit steigender absoluter Threadzahl – egal ob durch SMT, CMT oder CMP - sinkt. Das ist mehr als logisch, für die Bewertung von SMT aber ebenso irrelevant.

Und nein das liegt nicht daran, weil das Spiel nicht mehr Kerne unterstützt, sondern weil Intels Implementierung nicht in der Lage ist bei nicht vorhersehbaren Anwendungen wie Spielen die Performance durch SMT stark zu erhöhen.

Das diese Behauptung Unfug ist, belegt dir jeder i3. Dieser erreicht locker einen durchschnittlichen SMT-Gewinn von gut 20%. Und was meinst du mit unvorhersehbar? Schlechte Ergebnisse der Branch Prediction in Spielen? Dann hast du deine eigene Theorie gerade ad absurdum geführt – je mehr falsche Sprünge Stalls in der Pipeline erzeugen, desto besser kann SMT die entstehenden Lücken wieder füllen und die Pipelineauslastung verbessern. LOL, dass war mal wieder ein schönes Eigentor. :d Damit hast du gerade begründet, dass SMT in Spielen besonders große Gewinne bringen sollte.

Wie kann es denn sein, dass der 6 Kerner 20% vor dem 4 Kerner ist und SMT bremst?

Redest du jetzt wieder von dem tollen Benchmark, wo der 3960X noch hinter dem 3570K liegt? Ah ja, 20% 6-Kern-Gewinn, glaub ich aufs Wort. :d
 
Zuletzt bearbeitet:
Mick_Foley schrieb:
Ansonsten musst du mir das mit schwachen und starken Kernen nicht erklären, nur ist so ein Spaß dann auch kein Beweis für deine Aussage, das SMT in Spielen nichts bringt.
Bei dem Benchmark kann in der Tat nichts stimmen, ich dachte du meinst einen anderen.
Ich bezweifle sehr stark das irgendjemand außer dir jemals behauptet, geschrieben bzw. nachgewiesen hat, dass das Verhältnis von SMT- zu CMP-Skalierung in irgendeiner Abhängigkeit von der Kernzahl steht.

Mir geht es gar nicht um das Verhältnis vom SMT zu CMP Skalerierung, denn solche Werte findet man nirgends im Netz.
 
Mir geht es gar nicht um das Verhältnis vom SMT zu CMP Skalerierung, denn solche Werte findet man nirgends im Netz.

Dann weißt du offensichtlich selbst nicht, worum es dir geht? Das SMT bei vier physischen Kernen (edit: in Spielen!) nichts bringt liegt an der fehlenden Parallelisierung ist ist bei CMT (im Verhältnis ~1:3) und CMP (im Verhältnis ~1:5) exakt genauso. Und was ist eigentlich aus deiner tollen Vorhersagbarkeits-Theorie geworden? :d
 
Zuletzt bearbeitet:
Schaffe die Zeit arbeit für dich.Crysis 3 ist noch nicht mal ein Next Generation Game. 8 Jaguar Kerne (IPC Bulldozer Niveau) in allen wichtigen Konsolen.Mal sehn was passiert.
 
Nur mal so nebenbei: Die PS3 hatte bereits 7 aktive SPEs, die 360 3 Kerne + SMT also 6 Threads.
 
Was hat die Speichermenge mit der Parallelisierung zu tun?
Ab einer gewissen Menge nix mehr.

Wenn aber mehr als ich sag mal 2GB da sind, kann man einfach mehr parallel be-/abarbeiten, weil der Speicher nicht spontan überläuft.
 
Auf Konsolen geht es nicht um Multitasking, sondern um die Parallelisierung einer bestehenden Aufgabe. Ob ich ein und dasselbe Problem nur auf einen, zwei oder 8 Threads auslege (falls das denn möglich ist), ändert am Arbeitsspeicherbedarf nicht wirklich viel. Schon eher an den CPU-internen Caches, aber die wachsen idR eh mit der Kern/Thread-Zahl mehr oder weniger linear mit.

Also nochmal zusammenfassend: Auch die noch aktuelle Konsolengeneration bot bereits 6-7 Threads, sodass sich bzgl. Parallelisierung mit PS4/720 nicht auf auf einmal schlagartig etwas ändern wird. Zumal das nicht nur eine Frage des Wollens ist, sondern auch des Könnens bzw. des notwendigen Aufwandes.
 
Undertaker 1 schrieb:
Dann weißt du offensichtlich selbst nicht, worum es dir geht? Das SMT bei vier physischen Kernen (edit: in Spielen!) nichts bringt liegt an der fehlenden Parallelisierung ist ist bei CMT (im Verhältnis ~1:3) und CMP (im Verhältnis ~1:5) exakt genauso. Und was ist eigentlich aus deiner tollen Vorhersagbarkeits-Theorie geworden?

Ich hab doch schon im ersten Post zu deine Forderung gesagt, dass sie nicht erfüllbar ist und dass dies nur ein Vorschub ist, damit du weiterhin recht behalten kannst.
Siehe die Aussage aus dem Planet3Dnow Forum.

Ich will SMT mit weiteren Kernen vergleichen. Eine Skalierung von 4 auf 8 Kernen setzt nicht vorraus, dass SMT profitieren muss, siehe Crysis 3 oder anderen Beispiele welche ich verlinkt habe, wo SMT einfach limitierend wirkt oder eben gar nichts bringt.

Ab Windows 7 war das Threadmanagement für die Intel Prozessore gefixed.

Noch mal ein Beispiel:

Intel Core i7 3960X Extreme Edition im Test - Far Cry 2 (Seite 37) - HT4U.net

Taktbereinigt ist der i7 3960 etwa knapp 20% vor dem i7 2600k.
Der 2500k ist nur 1% hinter dem 2600k, aufgrund SMT und Takt müssten es eher 7 oder 8% sein und HT4u macht mehrere Durchläufe um die Ergebnisse zu verifizieren.

Scheinbar bremst hier SMT wieder etwas.
 
Zuletzt bearbeitet:
Noch mal ein Beispiel:

Intel Core i7 3960X Extreme Edition im Test - Far Cry 2 (Seite 37) - HT4U.net

Taktbereinigt ist der i7 3960 etwa knapp 20% vor dem i7 2600k.
Der 2500k ist nur 1% hinter dem 2600k, aufgrund SMT und Takt müssten es eher 7 oder 8% sein und HT4u macht mehrere Durchläufe um die Ergebnisse zu verifizieren.

Scheinbar bremst hier SMT wieder etwas.

Jo genauso wie die zwei nativen Kerne des Phenom II x6 ihn hinter den X4 bremsen und das zusätzliche Modul des FX-6100 ihn hinter den FX-4100... Da ist schon wieder ab dem vierten Thread Ende im Gelände...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh