[News] AMD´s FX 8350 vor i7 3770K in Crysis 3

Ich hab doch schon im ersten Post zu deine Forderung gesagt, dass sie nicht erfüllbar ist

Natürlich ist sie erfüllbar und ich habe bereits unzählige Links zu entsprechenden i3-Benchmarks gezeigt, die perfekt die SMT-Profite belegen. Und nochmal, der i7 ist in dieser Hinsicht prinzipiell nichts anderes als ein etwa verdoppelter i3. Stattdessen kannst du nur leugnen, bringst technisch unsinnige Erklärungen (ich muss immer noch über deine Vorhersagbarkeits-Theorie lachen) und behauptest fest, dass es ja angeblich so toll parallelisierte Spiele gibt. Das auch dein jetzt gebrachter HT4U-Link nichts entsprechendes zeigt, hat Mick schon umfassend erklärt: X6 und X4 liegen taktbereinigt nur 9% auseinander, dementsprechend minimal ist der mögliche SMT-Gewinn. Da SMT und CMT zunächst ein paar Prozentpünktchen Overhead erzeugen reicht das nicht aus, um im Endeffekt eine Mehrleistung zu erzeugen. Ich würde mal tippen, das wir bei CMT vielleicht 0-5% Performancevorteil sehen würden.

Edit: Um dir die Sache mit dem i3 <-> i7 nochmal zu zeigen:

2C/4T: 24% SMT-Gewinn http://www.computerbase.de/artikel/prozessoren/2011/test-intel-core-i3-2100t/16/
6C/12T: 22-25% SMT-Gewinn http://www.computerbase.de/artikel/prozessoren/2011/test-intel-sandy-bridge-e/27/

Man sieht, bei entsprechend nahezu perfekter Parallelisierung sind die Zugewinne absolut identisch. Der Nutzen oder nicht-Nutzen von SMT ist unabhängig von Kernzahl des Prozessors sondern hängt rein von der Software ab. Das relevante Verhältnis von SMT-Gewinn zu CMP-Gewinn ist konstant.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Mick_Foley schrieb:
Jo genauso wie die zwei nativen Kerne des Phenom II x6 ihn hinter den X4 bremsen und das zusätzliche Modul des FX-6100 ihn hinter den FX-4100... Da ist schon wieder ab dem vierten Thread Ende im Gelände...

Ein vergleich zwischen zwei unterschiedlichen Architekturen funktioniert nie.
Zudem hängen alle AMD Prozessoren so ziemlich in einer Reihe fest, da scheint bei AMD wohl was anderes zu limitieren. eventuell NB? Keine Ahnung hier gehts aber eigentlich um Intel ne?

Undertaker 1 schrieb:
Natürlich ist sie erfüllbar und ich habe bereits unzählige Links zu entsprechenden i3-Benchmarks gezeigt, die perfekt die SMT-Profite belegen.

Werde dir mal klar was ich hier konkret gemeint habe.
Einen skalierungsvergleich von CMT mit SMT geht nur wenn jeder Prozessor für sich beides Unterstützen würde, dann kan man von mir aus hier etwas zu sagen.

Es gibt im ganzen Netz keine klaren SMT CMT on off Vergleiche zwischen Intel und AMD, also unterlasse es out of context zu antworten.
Der i3 tut da nichts zur Sache, der hat ja auch fast gar keinen Overhead, der wird so uns so gut ausgelastet bei nur 2 Threads.

Der Nutzen oder nicht-Nutzen von SMT ist unabhängig von Kernzahl des Prozessors sondern hängt rein von der Software ab. Das relevante Verhältnis von SMT-Gewinn zu CMP-Gewinn ist konstant.

Das es an der Software hängt ist ja nicht bestreitbar. Bei Spielen funktioniert es aber nicht wie es soll, und skaliert nicht dementsprechend wie einfach mehr Kerne es tun würden.
 
Zuletzt bearbeitet:
Natürlich ist sie erfüllbar und ich habe bereits unzählige Links zu entsprechenden i3-Benchmarks gezeigt, die perfekt die SMT-Profite belegen. Und nochmal, der i7 ist in dieser Hinsicht prinzipiell nichts anderes als ein etwa verdoppelter i3. Stattdessen kannst du nur leugnen, bringst technisch unsinnige Erklärungen (ich muss immer noch über deine Vorhersagbarkeits-Theorie lachen) und behauptest fest, dass es ja angeblich so toll parallelisierte Spiele gibt. Das auch dein jetzt gebrachter HT4U-Link nichts entsprechendes zeigt, hat Mick schon umfassend erklärt: X6 und X4 liegen taktbereinigt nur 9% auseinander, dementsprechend minimal ist der mögliche SMT-Gewinn. Da SMT und CMT zunächst ein paar Prozentpünktchen Overhead erzeugen reicht das nicht aus, um im Endeffekt eine Mehrleistung zu erzeugen. Ich würde mal tippen, das wir bei CMT vielleicht 0-5% Performancevorteil sehen würden.

Edit: Um dir die Sache mit dem i3 <-> i7 nochmal zu zeigen:

2C/4T: 24% SMT-Gewinn Test: Intel Core i3-2100T (Anhang 3) - ComputerBase
6C/12T: 22-25% SMT-Gewinn Test: Intel

Man sieht, bei entsprechend nahezu perfekter Parallelisierung sind die Zugewinne absolut identisch. Der Nutzen oder nicht-Nutzen von SMT ist unabhängig von Kernzahl des Prozessors sondern hängt rein von der Software ab. Das relevante Verhältnis von SMT-Gewinn zu CMP-Gewinn ist konstant.


Das funzt bei SMT aber nur ohne Kohärenz, wie bei Cinebench. Das ist bei CMT etwas ganz anderes. Bei Spielen spielt die Korhärenz immer eine Rolle, selbst bei perfekter Parallelisierung und da kannst du SMT einfach in die Tonne hauen. Es wird nachteilhaft.
 
Zuletzt bearbeitet:
Auch dir empfehle ich die entsprechenden i3-Benchmarks, die du sogar in meinem zitierten Posting finden kannst.

Lustiges Detail am Rande:

SMT-Profit im Anwendungsmittel: 14% Test: Intel Core i3-2100T (Seite 4) - ComputerBase
SMT-Profit im Spielemittel: 21% Test: Intel Core i3-2100T (Seite 6) - ComputerBase

Bei entsprechender Parallelisierung - bei maximal 4 Threads ist die heute weitestgehend gegeben - skaliert SMT in Spielen ziemlich gut. Tendenziell womöglich sogar etwas besser als in Anwenungen, da hier Grundlast- und Branch-Prediction-Effekte mit hineinspielen.

Bei vorhanden 4 Kernen kannst du CMT wie SMT idR vergessen. Mittlerer CMT-Performancegewinn hier bei Computerbase:

Bericht: AMDs

Exakt 0%. Wie soll da SMT, was von Natur aus geringere Zuwächse bringt, zu nennenswerten Vorteilen führen?
 
Das ist, war der falsche Weg. Wie konnten Smartphones so populär werden? Weil sie das bessere Gesamtkonzept bieten.

Das heißt das man im PC-Bereich schauen muss was tatsächlich MIkroruckler hervorruft bzw. wie man das System runder machen kann....
 
Ein vergleich zwischen zwei unterschiedlichen Architekturen funktioniert nie.
Zudem hängen alle AMD Prozessoren so ziemlich in einer Reihe fest, da scheint bei AMD wohl was anderes zu limitieren. eventuell NB? Keine Ahnung hier gehts aber eigentlich um Intel ne?

Nein es geht um die Wirkung von SMT und dafür müssen die SMT Threads auch ausgelastet werden. Wie beide AMD-Generationen zeigen gibt es keinerlei Leistungszuwachs nach dem vierten Thread. Leider ist kein Intel Pentium im Test, dann könnt man sehen ob SMT beim i3 was bringt.
 
Undertaker 1 schrieb:
Lustiges Detail am Rande:

SMT-Profit im Anwendungsmittel: 14% Test: Intel Core i3-2100T (Seite 4) - ComputerBase
SMT-Profit im Spielemittel: 21% Test: Intel Core i3-2100T (Seite 6) - ComputerBase

Ja, wie gesagt der i3 kann aufgrund des geringen Overheads in Spielen richtig profitieren, da beide Threads immer voll ausgelastet werden und die Verwaltung einfach ist.

Beim i7 ist das nicht der Fall. Der i3 gewinnt in jedem Spiel durch SMT.

Test: Intel Core i3-2100/2120 (Anhang 18) - ComputerBase

Die i3 Prozessoren profitieren extrem von SMT, beide um satte 46%.
Der Bench profitiert auf jeden Fall von mehr Kernen, der Intel x6 ist wieder knapp 20% schneller.

Den i5 2500k trennt 1% vom 2600k, ergo weniger als der Mehrtakt. Es sieht wieder nach einer SMT Bremse bei den 4 Kernern aus, während die i3 locker flockig davon ziehe.
25% SMT Skalierung ist von den i7 x4 möglich, Multithreaeded skaliert das Spiel 20%, von 4 auf 6 Kerne, die eventuelle SMT Bremse des i7 980 ist da noch gar nicht bedacht, der könnte vll noch schneller sein.

Ergo müsste SMT hier knapp 10% herausreißen, oder wenigstens 5 oder 6%, wenn das Spiel nur bis 6 kerne skaliert.


Der zweite Benchmark sagt genau das Gegenteil aus. Also was stimmt jetzt bitte? Das Verhältnis zwischen i7 960 und i7 980 bleibt überraschend gleich.

Viel eher doch dass SMT je nach Spiel einfach einen Overhead hat.

Mick_Foley schrieb:
Wie beide AMD-Generationen zeigen gibt es keinerlei Leistungszuwachs nach dem vierten Thread. Leider ist kein Intel Pentium im Test, dann könnt man sehen ob SMT beim i3 was bringt.

Man kommt ohne fetten SMT Artikel hier eh nicht mehr weiter, es gibt aus meiner Sicht einfach viel zu viele Widersprüche um das Beurteilen zu können.

Jedenfalls kann man sich diesen Käse denk ich sparen, dass Crytek hier irgendetwas pro AMD programmiert hat, wenn AMD erst zum Schluss sich das Spiel geschnappt hat für Gaming Evolved.
 
Zuletzt bearbeitet:
Ja, wie gesagt der i3 kann aufgrund des geringen Overheads in Spielen richtig profitieren, da beide Threads immer voll ausgelastet werden und die Verwaltung einfach ist.

Diese abstruse Theorie kannst du mir gerne mal erklären. Wenn dann ist der i7 im Vorteil, da er bei einem Spiel mit >4 Threads weniger Tasks auf einem Kern hin- und herswitchen muss. Der i7 hat sogar pro Kern und Thread mehr Cache zur Verfügung. Und wie wir in Benchmarks parallelisierter Anwendungen sehen, ist die SMT-Skalierung beim i7 nicht schlechter.

Beim i7 ist das nicht der Fall. Der i3 gewinnt in jedem Spiel durch SMT.

Weil fast jedes Spiel mehr als zwei Kerne/Threads nutzen kann. Zum x. Male mittlerweile.

Test: Intel Core i3-2100/2120 (Anhang 18) - ComputerBase

Die i3 Prozessoren profitieren extrem von SMT, beide um satte 46%.
Der Bench profitiert auf jeden Fall von mehr Kernen, der Intel x6 ist wieder knapp 20% schneller.

Lass doch endlich mal diese unsinnigen Vergleiche zwischen verschiedenen Plattformen.

Wenn das Spiel Takt- und Cache-bereinigt ~10-15% von 6 Kernen profitiert - siehe dazu die Phenom-X4/X6-Modelle - und im worst-case vielleicht nur maximal 6 Threads nutzt, lässt das einen SMT-Gewinn von <1,5% erwarten. Das ist weniger, als der Overhead bei SMT und CMT wegfrisst.

Man kommt ohne fetten SMT Artikel hier eh nicht mehr weiter, es gibt aus meiner Sicht einfach viel zu viele Widersprüche um das Beurteilen zu können.

Das Thema ist prinzipiell sogar sehr simpel.

a) Es gibt derzeit praktisch kaum Spiele, welche nennenswert von >4 Kernen profitieren.
a) SMT und CMT verursachen oftmals einen minimalen Performancehit von 0-5%.
b) Um diesen möglichen Performancehit zu kompensieren, bedarf es einer Parallelisierung auf >4 Threads. Da SMT (~1/5) und CMT (~2/3) weniger als CMP bringen, muss die Parallelisierung schon ziemlich stark sein, um eine wirkliche Mehrleistung zu bringen
d) i3 und FX-4 sind davon kaum betroffen, da die Parallelisierung hier fast immer vorhanden ist.
 
Zuletzt bearbeitet:
Man kommt ohne fetten SMT Artikel hier eh nicht mehr weiter, es gibt aus meiner Sicht einfach viel zu viele Widersprüche um das Beurteilen zu können.
Um sowas vorweg zunehmen, da werden trotz allem jede Menge Widersprüche bleiben ....

Klick Dich doch durch die verschiedenen CB-Benches : Test: Intel Core i7-3820 (Anhang 25) - ComputerBase Da tauchen Pentium, Clarkdale´s ala i3/i5, 2100T/2100/2120 auf.

Ein Appetizer :

smt-cb.jpg

Ein 2100T mit SMT und 2,5GHz ist schneller als der 2120 ebenfalls mit SMT aber mit 800MHz Taktvorteil ^^
 
Undertaker 1 schrieb:
Lass doch endlich mal diese unsinnigen Vergleiche zwischen verschiedenen Plattformen.

Lol, ich glaub ich fall um vor Lachen.
Du bist derjenige der ständig CMT vs. SMT Vergleiche fordert auf völlig unterschiedlichen Platformen.?!
Und jetzt beschwerst du dich weil ich einfach Szenen suche in denen der 980 20% vor dem I7 960 liegt und eine multithreadskalierung somit gegeben ist und SMT beim 2500k auf 2600K scheinbar 2% bremst.

Der i7 hat sogar pro Kern und Thread mehr Cache zur Verfügung. Und wie wir in Benchmarks parallelisierter Anwendungen sehen, ist die SMT-Skalierung beim i7 nicht schlechter.

Nicht schlechter? Der i3 skaliert in diesem Spiel bis zu 46% mit SMT.

Weil fast jedes Spiel mehr als zwei Kerne/Threads nutzen kann. Zum x. Male mittlerweile.

Ja das und weil das Threadmanagement wesentlich einfacher ist.

Wenn das Spiel Takt- und Cache-bereinigt ~10-15% von 6 Kernen profitiert

Bist du dir sicher wieviel der Cache ausmacht? Ich habe erst kürzlich im gleichen Parcours einen i7 Sockel 2011 4 kerner mit i7 Sockel 1155 4 kerner verglichen, und dabei sprang bei 33% mehr Cache bei gleichem Takt nichts für den Sockel 2011 Prozessor raus.

vielleicht nur maximal 6 Threads nutzt, lässt das einen SMT-Gewinn von <1,5%

Hä? Scheinbar haben wir hier 20% Skalierung. Wieviel der cache ausmacht weißt du nicht, wahrscheinlich aber irrelevant.
Also muss SMT mit mindestens 5% skalieren und der i7 2600k mindestens 7 oder 8% vorne sein, ist er aber komischerweise nicht.

Scheinbar gibt es einen Overhead der das verhindert und bei der Crysis 3 programmierung ist es wohl deutlich schlimmer.

Das Thema ist prinzipiell sogar sehr simpel.

a) Es gibt derzeit praktisch kaum Spiele, welche nennenswert von >4 Kernen profitieren.
a) SMT und CMT verursachen oftmals einen minimalen Performancehit von 0-5%.
b) Um diesen möglichen Performancehit zu kompensieren, bedarf es einer Parallelisierung auf >4 Threads. Da SMT (~1/5) und CMT (~2/3) weniger als CMP bringen, muss die Parallelisierung schon ziemlich stark sein, um eine wirkliche Mehrleistung zu bringen
d) i3 und FX-4 sind davon kaum betroffen, da die Parallelisierung hier fast immer vorhanden ist.

So simpel dass du nicht in der Lage bist für deine Theorie außer den i3 Verlinkungen eine Quelle vorzulegen?

Ich stimme doch mit deinen Punkten die du nennst eh überein, außer a.

Und vielleicht noch b:

SMT ein fünftel weniger als CMP? Vergleiche mal i3 und i5 Der i3 Gewinnt durch SMT 46% in der Spitze, wo wir wieder bei deinen Abschweifungen zum i3 wären. Das ist nicht 1/5.
Das trifft auch nicht zu wenn du den 4 kerner meinst, dann dort ist es maximal 1/4 zu einer Verdopplung der Kerne, bei einem 50%igen Ansteig der Kerne immernoch 1/2.
 
Vom 2500k zum X6 sind es mal so nebenbei riesige 7%. Und wo sind denn die ganzen Spiele, die signifikant von mehr als vier Threads profitieren? Ich finde keins...^^
 
Lol, ich glaub ich fall um vor Lachen.
Du bist derjenige der ständig CMT vs. SMT Vergleiche fordert auf völlig unterschiedlichen Platformen.?!

Und das nächste Eigentor. Wir vergleichen nicht die absolute Performance von SMT und CMT, sondern die jeweilige Skalierung gegenüber CMP. Ich kann natürlich nicht SB mit SBe vergleichen und daraus einen wenige Prozent großen 6-Kern Gewinn bestimmen, sehr wohl aber die gleiche CPU mit SMT on/off bzw. CMT on/off und dann den relativen Zuwachs gegenüberstellen.

Nicht schlechter? Der i3 skaliert in diesem Spiel bis zu 46% mit SMT.

Ich sehe nicht, wo der i3 in Anwendungen 46% skaliert. Wenn du jetzt von Spielen redest überprüfe bitte nochmal, was du da von mir zitiert hast und worauf du gerade antwortest. Zu diesem speziellen Fall siehe weiter unten.

Ja das und weil das Threadmanagement wesentlich einfacher ist.

Wirf nicht mit Begriffen um dich, die du sowieso nicht verstehst. Das ging schon bei deiner "Vorhersagbarkeitstheorie" mächtig daneben. Wenn du ein Spiel mit >4 Threads hast, muss der i7 sogar weniger Tasks switchen als der i3.

Bist du dir sicher wieviel der Cache ausmacht? Ich habe erst kürzlich...

Na klar, und ich habe erst kürzlich einen i7 mit SMT vermessen und in jedem Spiel >20% Gewinn ermittelt. Bleiben wir doch bei objektiven Werten. Wenn du den 6-Kern Gewinn wissen willst, nimm den Phenom II X4 und X6, da die bis auf den Takt identisch sind. Und nein, du konntest hier bislang kein Spiel zeigen, welches auch nur annähernd so hohe Zuwächse zeigte.

Scheinbar gibt es einen Overhead

Natürlich gibt es einen Overhead, der bei SMT und CMT bei fehlender Parallelisierung Leistung kosten kann. Du hast nunmal zwei Threads auf zum Teil geteilten Ressourcen laufen, die sich in die Quere kommen können. Weiterhin ist der SMT/CMT-Gewinn deutlich kleiner als bei CMP, sodass du erst ab einer gewissen Grenze Profite bekommst.

So simpel dass du nicht in der Lage bist für deine Theorie außer den i3 Verlinkungen eine Quelle vorzulegen?

Wenn du mir ein Spiel lieferst, welches entsprechend parallelisiert ist, wäre das möglich. Leider kennen wir beide da keines.

SMT ein fünftel weniger als CMP? Vergleiche mal i3 und i5 Der i3 Gewinnt durch SMT 46% in der Spitze, wo wir wieder bei deinen Abschweifungen zum i3 wären. Das ist nicht 1/5.
Das trifft auch nicht zu wenn du den 4 kerner meinst, dann dort ist es maximal 1/4 zu einer Verdopplung der Kerne, bei einem 50%igen Ansteig der Kerne immernoch 1/2.

[Edit: Diesen Benchmark kannst du wohl eh vergessen. Wenn die Parallelisierung so gut ist, warum liegt dann der PII X3 740 auf dem Level des X4 840?]

Ich glaube wir hatten auch schon Spiele, die durch SMT fast 70% gewinnen. Das kann z.B. durch Grundlasteffekte kommen. Siehe z.B. hier BC2:

Bericht: AMDs

Weit über 100% Leistungsgewinn von 1M/2C auf 2M/4C. Das bedeutet nicht, dass 2M/4C mehr als die doppelte Rechenleistung bereitstellt, sondern nur, dass mehr als die doppelte Rechenleistung zur Bildberechnung zur Verfügung steht (da ein fester Betrag z.B. für Physik oder KI weggeht).

Abseits solcher Effekte liegt der SMT-Gewinn bei etwa 20 bis 25%, egal ob i3, i7 oder 6-Kerner.

Edit: Da CMT hier so schön skaliert und damit gut parallelisiert schein, habe ich auch mal nach SMT gesucht. Und schau an:

http://www.computerbase.de/artikel/grafikkarten/2011/bericht-gpu-braucht-cpu/11/

Trotz leichtem GPU-Limit bei HD 6990 und 1680x1050 11% zwischen 2500K und 2600K. Hier sehen wir also wohl tatsächlich mal einen Fall wo die Parallelisierung so gut ist, dass SMT auch bei einem 4-Kerner noch weitere Zuwächse bringt.
 
Zuletzt bearbeitet:
Wenn du den 6-Kern Gewinn wissen willst, nimm den Phenom II X4 und X6, da die bis auf den Takt identisch sind. Und nein, du konntest hier bislang kein Spiel zeigen, welches auch nur annähernd so hohe Zuwächse zeigte.

Leider hinkt der Vergleich ein wenig. Der PhenomII X4 ist ein bisschen schneller als der X6 bei gleichem Takt, wodurch die Skalierung nichtmehr ganz so schön ausfällt.
Ohne einen crysis3 bench run mit 4m/4t ist die Diskussion über "Skalierung" absolut Banane...
 
Leider hinkt der Vergleich ein wenig. Der PhenomII X4 ist ein bisschen schneller als der X6 bei gleichem Takt, wodurch die Skalierung nichtmehr ganz so schön ausfällt.

Darum geht es ihm doch, da ist schon wieder nach Thread vier quasi Ende im Gelände. Da kann SMT gar nichts bringen. ;)
 
Schaffe und Undertaker ihr wisst schon, dass ihr beide seit 20 Seiten aneinander Vorbeiredet?

Und Schaffe hat recht, denn seine Aussage war von Anfanang an, dass SMT bremsen KANN.

Und du Undertaker hast daraus hergeleitet, dass es dass immer macht und bringst ständig vergleiche mit einem i3, der wie du gerade richtig erkannt hast viel häufiger threads schieben muss. Und wovon profitiert SMT? Vom warten des Hauptkerns auf Daten.....

Und wie du auch richtig erkannt hast, der i7 muss viel weniger threads schieben, was zu Problemen führen kann, wenn die threads untereinander auf Ergebnisse warten.

Beispiel, 8 Threads:
Thread 1 läuft auf Core 1 Thread 2 auf dem "SMT-Core 1" usw.

Wenn jetzt Thread 1 auf ein Ergebniss von Thread 4 wartet, Thread 4 aber nicht abgearbeitet werden kann, da Thread 3 keine Pause einlegt/einlegen muss, bremst das. Das kannst du versuchen schönzureden, wie du willst, das ist einfach so.

Solange die Threads nicht voneinander Abhängig sind, ist es egal, wie schnell oder langsam die SMT-Threads laufen, wichtig ist, dass irgendwann ein Ergebniss dabei rauskommt.


Ihr könnt mich gerne Korrigieren, wenn ich Falsch liege, aber bitte nicht mit solchen Zitierorgien.
 
Schaffe und Undertaker ihr wisst schon, dass ihr beide seit 20 Seiten aneinander Vorbeiredet?

Und Schaffe hat recht, denn seine Aussage war von Anfanang an, dass SMT bremsen KANN.

Das ist nicht wirklich das Thema um das es hier ging. SMT und CMT erzeugen Overhead, der idR einen minimalen Performancehit zur Folge hat. Das ist unstrittig, mit Benchmarks belegt und nicht das Thema.

Und wie du auch richtig erkannt hast, der i7 muss viel weniger threads schieben, was zu Problemen führen kann, wenn die threads untereinander auf Ergebnisse warten.

Beispiel, 8 Threads:
Thread 1 läuft auf Core 1 Thread 2 auf dem "SMT-Core 1" usw.

Wenn jetzt Thread 1 auf ein Ergebniss von Thread 4 wartet, Thread 4 aber nicht abgearbeitet werden kann, da Thread 3 keine Pause einlegt/einlegen muss, bremst das. Das kannst du versuchen schönzureden, wie du willst, das ist einfach so.

Ich glaube du hast hier eine ziemlich falsche Vorstellung von der Funktionsweise von SMT. Es gibt keine "SMT-Cores"; wenn zwei Threads per SMT auf einem Kern laufen, dann tun sie dies vollkommen gleichberechtigt. Die Folge von Abhängigkeiten zwischen einzelnen Threads ist, egal ob CMT, SMT, oder CMP, absolut die gleiche.
 
Das Problem ist nicht, dass SMT bremsen kann, dass zeigt ja gerade Crysis 3. Das Problem ist folgende Aussage:

Die Tatsache dass massiv multithreaded Games nicht mehr von SMT profitieren als Games die nur max. auf 3 oder 4 Kerne setzen ist dir auch bewusst?

Das Problem ist, dass sich hier bisher kein Spiel gefunden hat, was diesem Kriterium entspricht. Extreme parallelisierste Software wie Cinebench zeigt ja, dass SMT was bringt. Deine Ausführung ist natürlich ein weiter Grund, der die Wirkung drücken kann. aber, dass SMT nichts oder selten etwas bringt liegt an der fehlenden Software in Form von Spielen.
 
Blabla, ich wollte auch nochmal meinen Senf zu diesen haarspalterisch-wichtigen Themen geben, blabla.
 
Zuletzt bearbeitet:
Und das nächste Eigentor. Wir vergleichen nicht die absolute Performance von SMT und CMT, sondern die jeweilige Skalierung gegenüber CMP. Ich kann natürlich nicht SB mit SBe vergleichen und daraus einen wenige Prozent großen 6-Kern Gewinn bestimmen, sehr wohl aber die gleiche CPU mit SMT on/off bzw. CMT on/off und dann den relativen Zuwachs gegenüberstellen.

Eigentor? Und woher willst du wissen wie die wirkliche CMT Skalierug ist, wenn Intel und AMD CPU völlig unterschiedlich sind?
Wenn ich CMT und SMT in ihrem Nutzen vergleichen will, dann muss jede CPU beides können.
Mir geht es nur um die SMT Skalierung, über die ich diskutieren will, CMT interessiert mich jetzt weniger.

Ich sehe nicht, wo der i3 in Anwendungen 46% skaliert. Wenn du jetzt von Spielen redest überprüfe bitte nochmal, was du da von mir zitiert hast und worauf du gerade antwortest. Zu diesem speziellen Fall siehe weiter unten.[/QUOTE

Test: Intel Core i3-2100/2120 (Anhang 6) - ComputerBase

Ich seh es schon, nämlich teils noch mehr als in Spielen.

Wirf nicht mit Begriffen um dich, die du sowieso nicht verstehst. Das ging schon bei deiner "Vorhersagbarkeitstheorie" mächtig daneben. Wenn du ein Spiel mit >4 Threads hast, muss der i7 sogar weniger Tasks switchen als der i3.

Und wieso bremst dann SMT offensichtlich bei den von mir verlinkten Beispiel? Muss es ja irgend einen Overhead geben, der bei dem Versuch die Lücken in der Pipeline mit den Befehlen aus einem anderen Thread aufzufüllen.
Oder warum bremst SMT in Crysis 3?

Da scheint es halt Software oder Hardwarebedingt Konfilkte zu geben.

Wenn du ein Spiel mit >4 Threads hast, muss der i7 sogar weniger Tasks switchen als der i3.

Das viele Taskswitchen ist doch die Grundlage dass SMT die Lücken in der Pipeline auffüllt. Und auch der Grund warum der i3 so stark profitiert.
Siehe die Aussage von why-me.

Wenn der X6 20% skaliert, dann kann es sein dass SMT aufgrund dieser Problematik gar nichts bringt ( Konflikte und Warterei).

Undertaker 1 schrieb:
Das ist nicht wirklich das Thema um das es hier ging.

Doch das ist genau das Thema um das es ging und habe dich schon mehrmals darauf hingewiesen, vielleicht solltest du einfach besser llesen.
Du willst dir die ganze Zeit nicht eingestehen, dass SMT bremsen kann und schiebst es immer auf die mangelnde multithreadingunterstützung, oder Caches und sonstiges.

Mick_Foley schrieb:
Das Problem ist, dass sich hier bisher kein Spiel gefunden hat, was diesem Kriterium entspricht. Extreme parallelisierste Software wie Cinebench zeigt ja, dass SMT was bringt.

Ähm, genau das zeigen doch meine Verlinkungen. Das Ignorieren der Verlinkungen ist wohl auch deine Stärke oder?
Die Aussage ist aber etwas extrem ( die Möglichkeit dass beides möglich ist je nach Szenario sollte klar sein), ich habe schon lange klargestellt dass es verschiedene ergebnisse geben kann, dort wo das Spiel von SMT profitiert und dort wo es nicht profitiert.

Der Ursprung allen Übels, warum ich diese Thematik verfolgt habe, lag eigentlich nur daran, dass man gesagt hat, hier hätte man irgendetwas falsch progammiert und AMD hätte die Finger im Spiel, was Käse ist.
 
Zuletzt bearbeitet:
Ähm, genau das zeigen doch meine Verlinkungen. Das Ignorieren der Verlinkungen ist wohl auch deine Stärke oder?
Die Aussage ist aber etwas extrem ( die Möglichkeit dass beides möglich ist je nach Szenario sollte klar sein), ich habe schon lange klargestellt dass es verschiedene ergebnisse geben kann, dort wo das Spiel von SMT profitiert und dort wo es nicht profitiert.

Der Ursprung allen Übels, warum ich diese Thematik verfolgt habe, lag eigentlich nur daran, dass man gesagt hat, hier hätte man irgendetwas falsch progammiert und AMD hätte die Finger im Spiel, was Käse ist.

Nein ich ignoriere deine Links nicht, nur willst du bisher deine zuvor von mir gequotete These damit belegen. Und deine Links beweisen eigentlich nur, dass es keine massive multithreaded optimierten spiele gibt. also kein Beweis, dass SMT generell in solchen Spielen nichts bringt.

Was Crysis 3 angeht:

Du mischt da die Argumente die im Verlauf gekommen sind irgendwie munter durch einander. Dass Crytek für AMD optimiert hat, war obsolet nach dem man mal andere Level gebencht hat. Wobei es auch legitim wäre, wenn AMD für eine Optimierung bezahlt hätte, das ist im GPU-Bereich auch gang und gäbe. Und fürs schlechte Programmieren gibt es genug Anzeichen: Die bescheidene FPS-Rate von 200€+ GPUs, die schwankende CPU-Leistung, die schräge CPU-Auslastung bei Intel und AMD (Selbst wenn SMT nichts bringt oder bremst ist es absurd, dass ein 3970x mit acht Threads belastet wird und ein 2700k nur mit sechs Threads). Und da bin ich im übrigen bei weitem nicht der einzige der das Spiel als schlecht progrmmiert/gemacht bezeichnet. Man kann nicht alles mit den Eye Candy-Effekten entschuldigen, das ist zu simpel und zeigt nur wie sehr wir gewohnt sind gebotene Produkte als gegeben zu nehmen.
 
Anhand mehrerer Benchmarks die ich schon hier verlinkt habe, kann man sehr gut feststellen, vieles wird heißer gekocht als es gegessen wird.

Solange ein Spiel eher gpu-lastig ist, wie es nunmal Crysis ist, ist das Benchen mit dem Spiele eher Witzlos, oder bringt zu viele Kuriositäten zutage - Selbst wenn man
cpu-lastige Spiele zum Vergleich nimmt, dass führt das ganze in ein reductio ad absurdum. Allerdings wird es auch in der Zukunft Menschen geben, die sich danach ein Stück
Hardware kaufen, warum auch nicht :d

P.S. Was ich allerdings noch bemerkenswerter finde, dass in letzter zeit nur noch fehlerfreie Software auf dem Markt erscheint und dann die Harte Ware schuld am Dilemma ist ^^
 
Zuletzt bearbeitet:
Ich habe zwar den ganzen Thread noch nicht gelesen, doch eigentlich ist es egal. Ich freue mich das AMD endlich mal mit seiner "Modul" Technologie endlich mal zeigen kann was es kann.
Auch wenn es nur ein Game ist, doch es zeigt wohin es dank der kommenden Xbox720 hin gehen kann.

Ich finde es gut :)
 
Eigentor? Und woher willst du wissen wie die wirkliche CMT Skalierug ist, wenn Intel und AMD CPU völlig unterschiedlich sind?
Wenn ich CMT und SMT in ihrem Nutzen vergleichen will, dann muss jede CPU beides können.

Wir vergleichen hier immer noch Intels SMT-Implementierung (Core-Serie, Atom wäre nochmal was anderes) mit AMDs CMT-Implementierung sowie CMP. Du kannst den Speedup auch nicht unabhängig von der Architektur bewerten. Schau mal, wie ein Atom mit In-Order Kernen zulegt.

Ich seh es schon, nämlich teils noch mehr als in Spielen.

Ähm ja. Hast du mal einen Blick auf den realen WinRAR-Test geworfen?

Test: Intel Core i3-2100/2120 (Anhang 10) - ComputerBase

Und wieso bremst dann SMT offensichtlich bei den von mir verlinkten Beispiel? Muss es ja irgend einen Overhead geben,

Ich habe mittlerweile gefühlt ein dutzend mal betont, das SMT und CMT natürlich einen gewissen Overhead erzeugen. Erst ab einer gewissen Parallelisierung kann man bei beiden Techniken darum Performancevorteile erkennen. In Spielen ist das nun einmal kaum gegeben, bei maximal 4 Threads ist idR Schluss. Ich habe dir ja vorhin schon BF:BC2 als eines der wenigen Beispiele gezeigt, wo sich SMT und CMT (naturgemäß mit deutlicherem Zuwachs) auch bei 4->8 Threads wirklich einmal auszahlen.

Das viele Taskswitchen ist doch die Grundlage dass SMT die Lücken in der Pipeline auffüllt. Und auch der Grund warum der i3 so stark profitiert.

Irgendwie haust du einfach nur noch alles durcheinander. :fresse:

Bei SMT werden zwei Threads pro Kern ausgeführt, um damit den Leerlauf in der Pipeline zu reduzieren. Zwei Threads, um das noch einmal zu betonen.
Wenn du jetzt einen i3 mit 8 Threads fütterst, wird dieser davon nur 4 "parallel" ausführen können. Diese 4 Threads müssen sich mit den anderen 4 Threads abwechseln, d.h. hin- und hergeswitcht werden, was zusätzlichen Verwaltungsaufwand und damit einen gewissen Leistungsverlust erzeugt (wenn auch vermutlich höchst minimal). Wenn du aber schon mit irgendwelchen Verwaltungstheorien kommst, dann ist der i3 bei vielen Threads im Nachteil, nicht der i7.

Wenn der X6 20% skaliert, dann kann es sein dass SMT aufgrund dieser Problematik gar nichts bringt

Wo genau bringt der X6 20% und SMT nichts?

Du willst dir die ganze Zeit nicht eingestehen, dass SMT bremsen kann und schiebst es immer auf die mangelnde multithreadingunterstützung, oder Caches und sonstiges.

Ich werde jetzt nicht zum 100. Male schreiben, das SMT und CMT zusätzlichen Verwaltungsaufwand erzeugen; da hättest du mal auch meine letzten Postings lesen können. Du bist derjenige, der hier eine Theorie aufstellt - i3 und i7 verhalten sich aus SMT-Sicht unterschiedlich (obwohl das durch Anwendungen bereits widerlegt wird) und konntest aber bislang noch kein Spiel präsentieren, welches überhaupt entsprechend gut auf 8 Threads ausgelegt ist.

Ähm, genau das zeigen doch meine Verlinkungen.

Welcher deiner Links zeigt mir auch nur ein Spiel, welches von einem Phenom II X4 auf einen X6 sagen wir mal wenigstens 25% zulegt? Da du noch nicht einmal das zeigen kannst - was einer perfekten Auslastung von mickrigen 5(!) Kernen entspricht - wie sollen dann insgesamt 8 Threads mit SMT sinnvoll ausgelastet werden?
 
Zuletzt bearbeitet:
Welcher deiner Links zeigt mir auch nur ein Spiel, welches von einem Phenom II X4 auf einen X6 sagen wir mal wenigstens 25% zulegt? Da du noch nicht einmal das zeigen kannst - was einer perfekten Auslastung von mickrigen 5(!) Kernen entspricht - wie sollen dann insgesamt 8 Threads mit SMT sinnvoll ausgelastet werden?

space invaders vielleicht...
 
Ich würde auf Starruler tippen, dass zeigt HisN immer wenn es um CPU-Auslastung geht, nur findet sich dazu kein Bench im Netz, habe schon geguckt...
 
Na das würde sich ja geradezu für einen Benchmarktest anbieten. :) Falls jemand mit nem i7 ein bisschen Zeit opfert und dort mal nachmisst, wäre das sicher sehr aufschlussreich.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh