[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

boxleitnerb schrieb:
Solange da keine zusätzlichen Sachen berechnet werden, ist das zwar theoretisch schön, aber irgendwie sinnlos. Min-fps steigen nicht mit der Kernzahl

Was natürlich pauschal Unsinn ist, wie man an vielen Beispielen sehen kann.
Wenn man die Last geschickt auf mehr Kerne verteilt steigen die minimum FPS, single Thread Performance ist nicht alles.

Erste Bulldozer samples kommen laut CB erst im Oktober auf den Markt.
Langsam wird mir die Wartezeit zu lange, das B2 Stepping ist wohl auch für die Tonne.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Was natürlich pauschal Unsinn ist, wie man an vielen Beispielen sehen kann.
Wenn man die Last geschickt auf mehr Kerne verteilt steigen die minimum FPS, single Thread Performance ist nicht alles.

Erste Bulldozer samples kommen laut CB erst im Oktober auf den Markt.
Langsam wird mir die Wartezeit zu lange, das B2 Stepping ist wohl auch für die Tonne.

Junge, fang nicht an wie mr. dude Zitate aus dem Zusammenhang zu reißen. Es ging um dem geposteten BFBC2 Bench und bei Intel tut sich da gar nix bei den min fps (bei 4 Cores vs. 6 Cores).
 
Zuletzt bearbeitet:
Hoffentlich kommt der nicht vor Dezember.
 
boxleitnerb schrieb:
Junge, fang nicht an wie mr. dude Zitate aus dem Zusammenhang zu reißen

Hab mich ja auf Battlefield Bad Company 2 bezogen und da skalieren die Intelprozessoren nicht mehr, weil evtl. ein GPU limit vorliegt, soviel sollte man schon herauslesen können.
Es gibt andere Beispiele, CPU lastigere Szenarios, da skalieren auch 6 Kerne bei Intel besser und man sieht ja, dass der I7 980x gleichauf mit dem i7 2600k liegt, also müssen da auch bei den minimum FPS mit 6 Kernen skalieren.

bei Intel tut sich da gar nix bei den min fps (bei 4 Cores vs. 6 Cores).

Sandy hat ~ 15 % mehr IPC in Spielen als Gulftown.
 
Zuletzt bearbeitet:
vergleich einfach mal den X4 955 und den X6 1090T....haben beide den gleichen takt.
Trotzdem sind das nur gut 25%. Als super würde ich das bei 50% mehr Kernen nicht gerade bezeichnen. Super ist da eher 40+%, wie man bei einigen Anwendungen sehen kann.

Junge, fang nicht an wie mr. dude Zitate aus dem Zusammenhang zu reißen.
Das hat er genauso wenig gemacht wie ich das tue, im Gegensatz zu dir.

Es ging um dem geposteten BFBC2 Bench und bei Intel tut sich da gar nix bei den min fps (bei 4 Cores vs. 6 Cores).
Es gibt auf Softwareebene auch keine Kerne mehr. Wann kapiert ihr das endlich mal? Auf Softwareebene gibt's nur noch logische Prozessoren / Threads. Wie diese zustande kommen, CMP, SMT, CMT oder was auch immer, ist im Endeffekt nebensächlich. Das wird erst für Compilerbauer & Co zwecks Optimierung interessant. Wie auch immer. Man sieht zumindest beim geposteten BFBC2 Diagramm eine deutliche Skalierung durch SMT, zB zwischen i5 760 und i7 860. Da hat Schaffe89 also nicht ganz Unrecht.


Lass mich hier aus dem Spiel
Dass du dich angesprochen fühlst, spricht Bände. :fresse:
 
Hab mich ja auf Battlefield Bad Company 2 bezogen und da skalieren die Intelprozessoren nicht mehr, weil ein GPU limit vorliegt, soviel sollte man schon herauslesen können.
Es gibt andere Beispiele, CPU lastigere Szenarios, da skalieren auch 6 Kerne bei Intel besser.

Oder man senkt die Auflösung *SCNR* ;)
Aus meinem Post konnte man schon herauslesen, dass es um den Bench weiter oben ging. Du kennst mich gut genug, als Pauschalaussagen von mir zu erwarten. Also nächstes Mal bitte keine solchen Unterstellungen mehr, danke ;)
 
Ja und der Bench oben zeigt eine Skalierung von 6 Kernen, das pauschal bezog sich auch nur auf das Spiel, unterschiedliche Szenen etc..
Missverständnisse will ich nicht erzeugen. :)
 
AMD braucht nur pro Integer Core 10% mehr IPC als ein K10 Core & 4,2Ghz Takt auf 8 Kernen

Dann hat man:
27% mehr CPU Takt als X6-1100T (3,3 vs. 4,2Ghz)
20% mehr Northbridge als X6-1100T (2,0 vs. 2,4Ghz)
33% mehr Kerne als ein X6-1100T (6 vs. 8)

Dann wäre Bulldozer besser als erwartet!!!
 
Ja, nur dass er höchstwahrscheinlich eher mit 3,6 ghz auf allen Kernen daherkommt.
Der FX- 8190 dürfte dann schon an die 4,2 ghz standardtakt heranreichen können. ^^
 
Es gibt auf Softwareebene auch keine Kerne mehr. Wann kapiert ihr das endlich mal? Auf Softwareebene gibt's nur noch logische Prozessoren / Threads. Wie diese zustande kommen, CMP, SMT, CMT oder was auch immer, ist im Endeffekt nebensächlich. Das wird erst für Compilerbauer & Co zwecks Optimierung interessant. Wie auch immer. Man sieht zumindest beim geposteten BFBC2 Diagramm eine deutliche Skalierung durch SMT, zB zwischen i5 760 und i7 860. Da hat Schaffe89 also nicht ganz Unrecht.

Irgendwie ist das Diagramm seitens PCGH ziemlich verwirrend.
Wieso skalliert der 980X zum 860 gerade mal um 13,9%, wenn 50% mehr Recheneinheiten (oder von mir aus logische Prozessoren) vorhanden sind und allein der Taktunterschied schon 17,9% beträgt.
Desweiteren, der 860er zum 2600K (beides vier Cores + SMT) skalliert ebenso um 15,8% wohingegen der 760 zum 2500K (beides vier Cores ohne SMT) nur mit 9,5% skalliert, bei ner Taktsteigerung von ebenso 17,9%.
Auch profitiert der 2600K durch SMT im Gegensatz zum 2500K um riesige 31,7%. Was allein durch SMT so nicht zu stande kommen kann.

Das wiederspricht sich in sich selbst... SMT müsste in dem Fall beim 2600K irgendwie auf wundersame weise deutlich besser funktionieren als die echten Recheneinheiten + SMT beim 980X.

Jemand ne Erklärung für?
 
Scheint alles ziemlich verwirrend zu sein.
Ich habe die Vermutung, dass da stark ein GPU limit reinspielt und die Werte dementsprechend durcheinanderwürfelt.
Dass 6 Kerne durchaus mehr bringen zeigen ja die Phenoms.
 
Die beiden X6 scheinen auch mit dem Takt zu skallieren, wohingegen die Intels das nicht machen...
 
Es wäre schön wenn wir beim Thema bleiben können, SMT Skalierung von Intel hat hier nichts verloren!
 
SMT bringt aber nun mal in BFBC2 eine menge das wird dir jeder mit einem SMT CPU bestätigen fdsonne.

Grundsätzlich gibts dagegen ja nichts einzuwenden. Aber SMT kann (in der gleichen CPU Generation betrachtet) nicht besser skallieren wie echte physisch vorhandene Cores. Und das tuts in dem Fall bei dem Bild... Sonst müsste der 980X ganz oben stehen. Denn der bringt mit sechs echten Cores deutlich mehr Leistung mit.
Da bei allen Tests Windows 7 im Einsatz war, ist auch ziemlich ausgeschlossen, das das OS hier fälschlicherweise die Threads ungünstig verteilt.
Das heist unterm Strich, irgendwas passt dort nicht am Bild. Entweder waren die Szenen nicht 100% vergleichbar oder weis der Geier...

Es wäre schön wenn wir beim Thema bleiben können, SMT Skalierung von Intel hat hier nichts verloren!

Es geht eher um die Aussagekraft des Benches... SMT Skallierung dient da eher zum Zweck Beweisung.
 
Zuletzt bearbeitet:
JA die 6200 Opterons sind Bulldozer

Die 35% sind schon durchgekaut worden -> Ergebnis, man weiß nicht, bei welchem Workload sie entstanden sind. und deshalb relativ aussage los.

Die 50% können immer noch stimmen und beide reden nur von was anderem.
 
Ich glaube gehört zu haben das der Magny Cours (K10) deutlich mehr CPU Takt als der Bulldozer Opteron hatte, deshalb sind es nur 35%.

Dann hat man aber wohl ein kleines Modell getestet.
Scheinbar kommen die 8 Modul BDs gleichsam bis 2,3GHz wie die aktuellen 12 Kern Many Cours. Zudem wird der BD nen Turbo haben, den der Magny Cours nicht hat (soweit mir bekannt)
 
Wieso skalliert der 980X zum 860 gerade mal um 13,9%, wenn 50% mehr Recheneinheiten (oder von mir aus logische Prozessoren) vorhanden sind und allein der Taktunterschied schon 17,9% beträgt.
Da musst du PCGH fragen und wie sie getestet haben. Es bestätigt aber nur das, was ich immer wieder sage. Spiele sind nicht unbedingt geeignet, um CPU Performance zu messen. Spiele sind eher ein Indikator für Systemperformance. Und da gibt's mehr Komponenten als nur die Prozessorkerne, die Einfluss auf das Ergebnis haben.

Desweiteren, der 860er zum 2600K (beides vier Cores + SMT) skalliert ebenso um 15,8% wohingegen der 760 zum 2500K (beides vier Cores ohne SMT) nur mit 9,5% skalliert, bei ner Taktsteigerung von ebenso 17,9%.
Erstmal haben wir hier 3,4 vs 2,8 und 3,3 vs 2,8 GHz. Die Taktsteigerung ist also nicht gleich. Und zweitens, der i5-2500K hat im Gegensatz zu den anderen Modellen nur 6 MiB L3. Aus dem Bauch heraus würde ich sagen, das passt schon.

Auch profitiert der 2600K durch SMT im Gegensatz zum 2500K um riesige 31,7%. Was allein durch SMT so nicht zu stande kommen kann.
Kommt es ja auch nicht. Wie gesagt, der i5-2500K hat weniger L3. Und bis zu 30% kann SMT durchaus bringen. Im Schnitt natürlich nicht.

SMT müsste in dem Fall beim 2600K irgendwie auf wundersame weise deutlich besser funktionieren als die echten Recheneinheiten + SMT beim 980X.
Die Frage ist halt, ob das Spiel überhaupt mit 12 Threads (i7-980X) skaliert und inwiefern vorher schon andere Komponenten zum Flaschenhals werden.


AMD hat offensichtlich die Leistungsprognose für den 16 "Kern" Opteron nach unten korrigiert
Nein, haben sie nicht. Das Thema wurde nun schon diskutiert. Thread mitlesen!


Dann hat man aber wohl ein kleines Modell getestet.
Scheinbar kommen die 8 Modul BDs gleichsam bis 2,3GHz wie die aktuellen 12 Kern Many Cours.
Es gibt hier verschiedene Erklärungsmöglichkeiten. Tatsache ist, als die 50% Aussage getroffen wurde, war der 2,3 GHz Magny Cours aktuell. Mittlerweile gibt es aber einen 2,5 GHz Magny Cours. 1,35 * 2,5/2,3 = ~47%. Ein weiterer Punkt ist, die 50% bezogen sich auf Durchsatz, die 35% Aussage wurde jedoch im Zusammenhang mit HPC gemacht. Das sind zwei verschiedene Paar Schuhe.

Zudem wird der BD nen Turbo haben, den der Magny Cours nicht hat (soweit mir bekannt)
Ob der Turbo bei diesen Leistungsprognosen allerdings berücksichtigt wird, ist fraglich. Zumal Turbo auch nicht immer greift. JF meinte mal, dass bei FP-Workloads weniger Spielraum zur Verfügung steht. Und bei HPC reden wir meist von intensiven FP-Workloads.
 
Zuletzt bearbeitet:
Die Frage ist halt, ob das Spiel überhaupt mit 12 Threads (i7-980X) skaliert und inwiefern vorher schon andere Komponenten zum Flaschenhals werden.

Muss es ja nicht zwingend. Da zwischen 2500K und 2600K über 30% liegen. Muss also die skallierung bei 8 Threads mindestens drin sein. Viel viel schlussendlich der Cache ausmacht, lässt sich nicht beantworten, die 3% mehr Takt des 2600K reißen es aber definitiv nicht. (sieht man an den niedriger getakteten Sandys im Vergleich)
Das heist also, der Großteil wird wohl durch SMT kommen. Und das klappt nur, wenn mindestens 8 Threads gleichzeitig rechnen. Denn die SMT Performanceskallierung kommt erst dann hoch, wenn auch wirklich die doppelte Anzahl (im Vergleich zur Coreanzahl) an Threads gleichzeitig arbeitet.
Und hier frag ich mich, warum dann eben der 980X nicht weiter skalliert. Er hat mehr Ausführungseinheiten. Bei Windows 7 wird die Last erst auf die Cores gelegt, dann auf den SMT Part. Was man schön am Taskmanager erkennen kann. Es wird nur jeder zweite logische Prozessor ausgelastet, es sei denn, es arbeiten genügend Threads.

OK man könnte von nem GPU Limit in den FPS Regionen ausgehen... Aber dann ist die Szene leider ziemlich ungeeignet für den Vergleich...

Es gibt hier verschiedene Erklärungsmöglichkeiten. Tatsache ist, als die 50% Aussage getroffen wurde, war der 2,3 GHz Magny Cours aktuell. Mittlerweile gibt es aber einen 2,5 GHz Magny Cours. 1,35 * 2,5/2,3 = ~47%. Ein weiterer Punkt ist, die 50% bezogen sich auf Durchsatz, die 35% Aussage wurde jedoch im Zusammenhang mit HPC gemacht. Das sind zwei verschiedene Paar Schuhe.
OK das war mir nicht bewusst...


Ob der Turbo bei diesen Leistungsprognosen allerdings berücksichtigt wird, ist fraglich. Zumal Turbo auch nicht immer greift. JF meinte mal, dass bei FP-Workloads weniger Spielraum zur Verfügung steht. Und bei HPC reden wir meist von intensiven FP-Workloads.

Ich denke TurboCore 2.0 kann auch bei Auslastung aller Einheiten den Takt erhöhen?
Das würde ja bedeuten, das bei Volllast mit FP-Workloads der Turbo gar nicht greift...
 
Zuletzt bearbeitet:
Inwiefern wird dies durch die TDP limitiert?
Wird da die Leistungsaufnahme berechnet oder wird auf die aktuelle Temperatur geachtet?
Hat man evtl mit einer guten WaKü einen Vorteil?
 
Kann er. Es wird trotzdem durch die TDP limitiert.

Ja schon klar, aber dennoch müsste er wirken und wenns nur um eine Multi Stufe ist bei allen Cores...
Aber ich denke wir brauchen uns hier nicht wegen 100 oder 200MHz die Köpfe einschlagen. ;) Das reist am Ende wohl so extrem nicht viel raus.
 
Inwiefern wird dies durch die TDP limitiert?
Wird da die Leistungsaufnahme berechnet oder wird auf die aktuelle Temperatur geachtet?
Die Leistungsaufnahme wird mittels digitaler Signale berechnet, siehe auch das neu implementierte Clock-Grid. Temperatursensoren spielen meines Wissens dabei keine Rolle.


Ja schon klar, aber dennoch müsste er wirken und wenns nur um eine Multi Stufe ist bei allen Cores...
Das hängt halt immer von der/den jeweiligen Anwendung(en) ab. Möglich sind grundsätzlich erstmal 0-500 MHz Turbo auf allen Kernen.
 
Temperatur wird auch eine Rolle spielen, aber eine eher untergeordnete. Die können die CPU ja nicht den max. Strom geben und dabei abrauchen lassen.

Aber wie mr.dude schon schrieb, BD kann recht genau seinen aktuellen Verbrauch berechnen/messen und passt den Takt daran an. Gibt sogar (wohl nur bei Servern) die Möglichkeit den TDP im Bios selbst zu bestimmen und die CPU passt sich daran an.
 
Neues von der Verschiebungsfront.

roadmapao0q.jpg

AMD: Bulldozer FX i


Das ändert sich fast täglich, so richtig sicher ist sich AMD hier noch nicht.
 
Temperatur wird auch eine Rolle spielen, aber eine eher untergeordnete. Die können die CPU ja nicht den max. Strom geben und dabei abrauchen lassen.
Klar wird auch Temperatur eine Rolle spielen. Halt ähnlich wie bei den bisherigen Prozessoren. Das betrifft dann aber eher die Abschaltung aufgrund von Überhitzung. Bei der diskutierten Turbo Problematik spielt das meines Wissens aber keine Rolle.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh