[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

Obrovsky hat mittlerweile in seinem Blog weitere "Benches"/Ergebnisse von Bulli veröffentlicht...Naja... war's glaubt... Blender ist ja ganz OK für AMD-Verhältnisse, wenn auch nicht überragend, ABER im Quake deutlich schlechter als alte Prozzies? Da stimmt wohl was nicht...


Bulldozer wird im Client Umfeld eine Graupe. Mehr als 269 USD kann AMD dafür nicht verlangen. Aber auch nur weil multithread schneller als 2500k ist. Maximalleistung auf Höhe des 2600k (dafür höherer Verbrauch), mit geringerer Kernauslastung stark abfallend.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
In Cinebench ist der X6-1100T 8% schneller als der i5-2500k Test: Intel

8 Kerne mit alter Architektur würden schon i7-2600 Leistung erreichen, Bulldozer soll aber besser als der alten Architektur werden, der kann nur besser als ein i7-2600 werden, einfach abwarten die Benches von OBR sind mit großer wahrscheinlichkeit Fakes, wenn Bulldozer nicht besser als den i7-2600 wird, dann wird sich sowieso niemand mehr dafür interessieren ;) und nach Launch ist alles vergessen :wink:
 
Zuletzt bearbeitet:
In Cinebench ist der X6-1100T 8% schneller als der i5-2500k Test: Intel

8 Kerne mit alter Architektur würden schon i7-2600 Leistung erreichen, Bulldozer soll aber besser als der alten Architektur werden, der kann nur besser als ein i7-2600 werden, einfach abwarten die Benches von OBR sind mit großer wahrscheinlichkeit Fakes, wenn Bulldozer nicht besser als den i7-2600 wird, dann wird sich sowieso niemand mehr dafür interessieren ;) und nach Launch ist alles vergessen :wink:

Ohne eine bestimmten Hersteller bevorzugen zu wollen: Bei gleichem Takt und gleicher Kernanzahl, ist die Intel CPU (6-Kerner) mal eben über 50% schneller. Mal sehen ob dieser Vorsprung aufgeholt werden kann...

Ich warte auch auf den BD, befürchte aber nach dem ganzen Warten das es ein riesen Truble um einen winzigen Vorsprung wird. (leider).
 
Ohne eine bestimmten Hersteller bevorzugen zu wollen: Bei gleichem Takt und gleicher Kernanzahl, ist die Intel CPU (6-Kerner) mal eben über 50% schneller. Mal sehen ob dieser Vorsprung aufgeholt werden kann...
Ähm, dir ist aber schon klar, dass der Intel 6-Kerner mehr als 50% mehr Kernlogik und doppelt so viele logische Prozessoren hat? Kern != Kern, das wurde doch nun schon öfters diskutiert. Man kann Kerne nicht mehr 1:1 vergleichen. Im Gegensatz zu den Aussagen des einen oder anderen unwissenden Provokateurs hier, wird Bulldozer im Client Markt ganz gewiss keine "Graupe". Man sollte aber auch keine Wunder erwarten. Bei wenigen Threads vermutlich ähnlich schnell wie SB, bei voller Auslastung schneller. Ob es dann auch für den 6C/12T Westmere reicht, wird man sehen. Und mit Bobcat/Llano als Referenz dürfte auch die Leistungsaufnahme dank der neuen Stromsparmechanismen recht gut werden. Auf OBR würde ich nichts mehr geben. Der hat in letzter Zeit genügend Glaubwürdigkeit verspielt.
 
Zuletzt bearbeitet:
Als Vergleichsbasis kann auch die benötigte Silizium-Fläche dienen. Intels 6-Kern Nehalem benötigt wohl ca. 250 mm², spielt also grob in der erwarteten Größenordnung von AMDs Bulldozer. Von der Leistungsaufnahme her, wird sich auch nicht viel nehmen.
 
Als Vergleichsbasis kann auch die benötigte Silizium-Fläche dienen. Intels 6-Kern Nehalem benötigt wohl ca. 250 mm², spielt also grob in der erwarteten Größenordnung von AMDs Bulldozer. Von der Leistungsaufnahme her, wird sich auch nicht viel nehmen.


Anand meint, es wären 240 mm² für Gulftown. Im Gespräch sind 280-290 mm² für Bulldozer.
 
In Cinebench ist der X6-1100T 8% schneller als der i5-2500k Test: Intel


Und im abschließenden Performancerating des gleichen Tests ist der 2500k je nach Auflösung 22% bis 32% schneller als der X6-1100T.

Letztendlich offenbart der Cinebench Test doch genau die Schwäche der AMD CPUs: sie bringen nur über die Anzahl der Kerne besondere Leistung. Nur unterstützt die Mehrzahl der Anwendungen diese angebotene Kernanzahl gar nicht. Meines Erachtens sollte sich AMD als nächstes mal auf die Steigerung der pro Thread Leistung konzentrieren. Aber vielleicht kommt das ja auch schon mit dem Bulldozer.
 
Ähm, dir ist aber schon klar, dass der Intel 6-Kerner mehr als 50% mehr Kernlogik und doppelt so viele logische Prozessoren hat? Kern != Kern, ....

Völlig klar, dennoch ist die Leistung pro Kern im Vergleich nicht konkurenzfähig. Dies wird besonders bei Anwendungen deutlich die nur mit wenigen Kernen klar kommen (wie heute noch viele Spiele) und gleichzeitigem Vergleich zur kleinen Sandys (i3 oder i5).

Es tut mir Leid das so zu sagen, aber in den letzten Jahren hat mich AMD immer wieder enttäuscht. :(
 
Sag doch sowas nicht - das artet gleich wieder in einen Kleinkrieg aus, weil gewisse Leute sowas nicht akzeptieren können ;)
Bulldozer könnte das mit dem hohen Takt und Turbo wettmachen. Finde ich keine sonderlich elegante Lösung, die beim Stromverbrauch recht bald ihre Grenzen erreichen könnte, aber besser als nix.
 
Letztendlich offenbart der Cinebench Test doch genau die Schwäche der AMD CPUs: sie bringen nur über die Anzahl der Kerne besondere Leistung. Nur unterstützt die Mehrzahl der Anwendungen diese angebotene Kernanzahl gar nicht. Meines Erachtens sollte sich AMD als nächstes mal auf die Steigerung der pro Thread Leistung konzentrieren.
Erst von Kernen reden, dann von Threads. Wie soll das zusammenpassen? Der i7 870 als grösster 45 nm Dual Channel Prozessor von Intel erreicht in dem Cinebench Test einen Score von 5,5 Punkten oder ~0,69 Punkten pro Thread. Der X6 1100T als grösster 45 nm Dual Channel Prozessor von AMD erreicht einen Score von 5,89 Punkten oder ~0,98 Punkten pro Thread. Also offenbar scheint die Pro-Thread Performance bei AMD in Cinebench alles andere als ein Problem zu sein.


Als Vergleichsbasis kann auch die benötigte Silizium-Fläche dienen. Intels 6-Kern Nehalem benötigt wohl ca. 250 mm², spielt also grob in der erwarteten Größenordnung von AMDs Bulldozer.
Grösser als der 6C/12T Westmere scheint Orochi schon zu werden. Ich bin aber kein Befürworter, das gesamte Die zu vergleichen, ohne auch die Unterschiede zu berücksichtigen. Der 6C/12T Westmere ist lediglich für bis zu 2P und Triple Channel ausgelegt, Orochi hingegen für bis zu 4P (mehr Interconnects) und Quad Channel. Zudem bringt Orochi zusätzliche Logik mit, wie mehr Cache, AVX, FMA, XOP, Clock-Grid, etc. Was das alles an Transistoren kostet, kann keiner von uns so genau einschätzen. Man sieht es ja auch an SB-E, dass Die-Vergleiche ohne Detailanalyse kaum eine Aussagekraft besitzen. SB-E wird im gleichen Fertigungsprozess wohl etwa 2/3 grösser als der 6C/12T Westmere bei lediglich 1/3 mehr Kernen.


Völlig klar, dennoch ist die Leistung pro Kern im Vergleich nicht konkurenzfähig.
Na wenn es dir klar ist, warum vergleichst du sie dann? Was konkurrenzfähig ist oder auch nicht, hängt doch von der Vergleichsbasis ab. Wenn ein Kern zB 20% weniger Performance liefert, dafür aber deutlich weniger Transistoren benötigt, so dass ich mit dem gleichen Transistorbudget 3 statt 2 Kerne liefern kann, dann ist das sehr wohl konkurrenzfähig. Man sollte die eigenen Prioritäten einfach nicht verallgemeinern. Wenn für dich "fette" Kerne wichtig sind, dann ist das deine Sache. Die Vergangenheit hat uns aber gelehrt, dass ein Design damit nicht effizienter wird. Bei Bulldozer zB wurde die Pipeline insofern verändert, dass sie entschlackt wurde, gleichzeitig aber auch eine höhere Auslastung als der Vorgänger erreichen soll. Dazu CMT, was zwei Threads ermöglicht, die recht nahe an ein CMP Design herankommen. Eine äusserst clevere und elegante Lösung, die einen sehr guten Kompromiss aus Single- und Multithreaded Workloads ermöglichen sollte. Zumindest vielversprechender als alles was es bisher im x86 Markt zu sehen gab.
 
Bulldozer könnte das mit dem hohen Takt und Turbo wettmachen. Finde ich keine sonderlich elegante Lösung, die beim Stromverbrauch recht bald ihre Grenzen erreichen könnte, aber besser als nix.

Das befürchte ich auch. Naja man muss erstmal abwarten wie hoch die IPC Steigerung ausfällt. Vor einem halben Jahr hätte ich auf Nehalem IPC spekuliert/gehofft, mittlerweile würde ich mich mit +10% zufrieden geben.
 
Vielleicht ist es AMD schlicht nicht so wichtig, die höchste IPC zu haben. Sie pappen halt mehr Kerne drauf und fahren damit im Servermarkt sicher sehr gut. Man muss auch mal so fair sein und sehen, dass im Desktopbereich vieles, wenn nicht das meiste, was richtig Leistung braucht, mehr oder weniger gut parallelisierbar ist (bzw. sein sollte). Wenn man den ein oder anderen Benchmark nicht gewinnt oder in Spielen wieder hintenliegt...was solls.
 
Klar im Serverbereich ist das weniger wichtig. Hier bezweifle ich nicht, dass Bulldozer einen Schritt nach vorne macht. Wenn ich ehrlich bin interessiert mich der Serverbereich nicht die Bohne als Desktop Benutzer.
 
Na, der Blender Bench sieht doch mal ganz OK aus.
Zieht nicht am 2600K vorbei, ist aber nah dran.
Wenn der Bench nicht gefaked ist, ist AMD doch ganz gut dabei.
Weiß gar nicht, was am BD anhand der Benches so schlecht sein soll.

Blender ist auch ein Bench der mich persönlich sehr interessiert...
allerdings ist der Testfall von OBR schlecht gewählt.
Bei den Daten ist mit Sicherheit ein gewisser Single-Core-Anteil dabei.
Man kann Blender auch so betreiben, dass es ziemlich linear mit der Kernzahl skaliert, d.h. der Abstand zwischen dem X4 und dem X6 könnte bei nem realistischen Testfall der alle Kerne konstant auf Volllast hält sehr viel größer sein... dafür müsste man aber nicht nur einen Frame rendern, sondern nen ganzen Film, dafür hatte OBR wohl keine Zeit...
Mein X6 gewinnt bei Blender übrigens um die 30-40% Leistung wenn ich es für die CPU optimiert selber aus den Quellen kompiliere.
Wenn das bei BD auch so läuft und der BD sich gut takten lässt wird's wirklich lustig...
 
Vielleicht ist es AMD schlicht nicht so wichtig, die höchste IPC zu haben. Sie pappen halt mehr Kerne drauf und fahren damit im Servermarkt sicher sehr gut.

Die Marktanteile sprechen nicht gerade dafür, auch wenn AMD im Serversegment bezogen auf Leistung und Effizienz momentan wohl noch am ehesten konkurrenzfähig ist, hier hakt es eher an anderen Stellen. Dennoch ist der Weg, etwas Diefläche und Taktrate für höhere Kernzahlen zu opfern das Beste was man bei unterlegener Pro-Kern Leistung machen kann: Nicht sonderlich aufwendig, steigert die Energieeffizienz, dem Media-Markt Käufer perfekt zu verkaufen.
 
mittlerweile muss ja der letzte Volldepp kapiert haben, das OBR Crap ist. Wer bis jetzt aber nicht den Schuss gehört hat, sollte damit Spaß haben:

OBRovsky Blog: AMD is in trouble, BIG trouble ...

Er demonstriert damit eigentlich nur, dass er aktuelle Tagesgeschehen nicht ummünzen kann auf vorhandene "Haßbilder" (so muss man es ja sehen). Die Börse kracht überall, aber AMD ist natürlich klar, weil BD Crap ist :fresse:

Wenn soviel Blödheit nicht von einigen Ernst genommen würde, würde ich jetzt lachen.....
 
Die IPC wird schon steigen.
Das Modul Design wäre ja sonst für die Katz.
 
Der i7 870 als grösster 45 nm Dual Channel Prozessor von Intel erreicht in dem Cinebench Test einen Score von 5,5 Punkten oder ~0,69 Punkten pro Thread. Der X6 1100T als grösster 45 nm Dual Channel Prozessor von AMD erreicht einen Score von 5,89 Punkten oder ~0,98 Punkten pro Thread. Also offenbar scheint die Pro-Thread Performance bei AMD in Cinebench alles andere als ein Problem zu sein.
Die Rechnung ist für das Milchmännchen. Die per Threadperformance ist ja genau das Problem, weil Intel schon mit vier davon richtig gut liegt.
Nebenbei bemerkt, ist Cinebench der RAM recht egal.



Grösser als der 6C/12T Westmere scheint Orochi schon zu werden. Ich bin aber kein Befürworter, das gesamte Die zu vergleichen, ohne auch die Unterschiede zu berücksichtigen.
Ist ja auch nur ein Hinweis auf die Herstellungskosten gewesen. Die Kosten für beide sind in der gleichen Größenordnung, Intel kann aber wesentlich mehr für verlangen.


Eine äusserst clevere und elegante Lösung, die einen sehr guten Kompromiss aus Single- und Multithreaded Workloads ermöglichen sollte. Zumindest vielversprechender als alles was es bisher im x86 Markt zu sehen gab.
Wenn man den Fokus auf Multithreading legt, richtig. Braucht man Single-Threaded Leistung, nicht unbedingt, da man nicht auf alle verbauten Resourcen eines Moduls Zugriff hat.
 
IPC-Steigerungen standen beim Modul-Konzept sicherlich nicht an vorderer Stelle, genau im Gegenteil sollen die Kerne eher entschlackt, höher taktbar und in größerer Zahl verbaut werden. Das bedeutet jetzt keine konkrete Aussage für Bulldozer, aber sehr wohl die Tendenz, dass IPC-Bestleistungen nicht zu erwarten sind. Bei vielleicht 5-10% Mehrtakt zu Sandy Bridge kann man das allerdings auch teils wieder ausgleichen.
 
Wenn die ersten Modelle 3,6-3,8Ghz Basistakt haben, dann gibt es anschließend wenn die Fertigung Optimal läuft auch 8 Kerne mit 4,2Ghz, das sind dann 27% mehr Takt als ein X6-1100T, 33% mehr Kerne, mehr IPC & mehr Speicher Durchsatz als K10 und das ding wird gut. Taktsteigerungen gibt es immer und diese neue Architektur sollte aufgrund der langen Pipeline deutlich mehr Reserven als die alte Pipeline bieten können, 32nm SOI mit HKMG hat große Vorteile gegenüber 45nm.
 
Zuletzt bearbeitet:
Die Rechnung ist für das Milchmännchen. Die per Threadperformance ist ja genau das Problem, weil Intel schon mit vier davon richtig gut liegt.
Was heisst schon? Ich habe doch auch von 4 Kernen bei Intel gesprochen. Bei Cinebench sieht man jedenfalls nicht, dass die Pro-Thread Performance bei AMD ein Problem wäre.

Wenn man den Fokus auf Multithreading legt, richtig. Braucht man Single-Threaded Leistung, nicht unbedingt, da man nicht auf alle verbauten Resourcen eines Moduls Zugriff hat.
Aber auf mehr Ressourcen als von einem herkömmlichen Kern. Ein Modul ist ja mal aus zwei herkömmlichen Kernen entstanden.
 
Die Rechnung ist für das Milchmännchen. Die per Threadperformance ist ja genau das Problem, weil Intel schon mit vier davon richtig gut liegt.

Bemühe dich nicht, das mr.dude zu erklären, denn je besser deine Argumente sind, um so stärker wird er dich persönlich angreifen, um von dem Thema abzulenken. Und seine Milchmädchenrechnung nimmt ihm doch eh niemand ab.

Obwohl es schon irgendwie süß ist, wie er um den x6 schönzurechnen, vom 2500k - von dem seit dem ersten Post von Duplex zu dieser Sache die Rede ist - ablenkt und so einen alten i7 ausgräbt. Der 2500k hat nämlich eine deutlich höhere pro Thread Performance von 1,36 (um in der Milchmädchenrechnung zu bleiben) gegenüber den 0,98 des X6.

Aber das ist ja eh tendentiell Off-Topic. Aber wenn es ein AMD Fan (Duplex) hier zur Sprache bringt, naja, dann musste es halt ins rechte Licht gerückt werden, oder nicht?

Und wie gesagt: vielleicht ist der Bulldozer in der pro Thread Leistung ja deutlich besser und schafft dort 1.4 oder 1,5 oder 2,0 pro Thread. Wäre doch super. Ich hätte nichts dagegen.
 
Zuletzt bearbeitet:
Hallo everybody! Ich bin neu hier und schpreche nicht sehr gut, so ich bitte um Verständnis.

Zu thema: Mann mus auch nicht vergessen, dass Bulldozer wird nicht mit 2600K, aber mit nächsten model kämpfen. Und Intel hat höhen übertaktungraum und können das sehr hoch takten in Abhängigkeit mit TDP. 130W 2610K oder 2700K kann sehr stark sein.

OFF TOPIC: Bitte, wo auf diesen forum kann ich über problem mit garantie reparatur bei deutschen computer handel schreiben und Rate bekommen?
 
Hier könnten dir die Leute höchstens sagen, wie du es selbst reparieren kannst. :d

Was heisst schon? Ich habe doch auch von 4 Kernen bei Intel gesprochen. Bei Cinebench sieht man jedenfalls nicht, dass die Pro-Thread Performance bei AMD ein Problem wäre.
Deshalb schlagen sich die AMDs K10-Modelle singlethreaded auch so toll und liegen mit den Intels (ohne Turbo) auf einer Linie. :lol:
Jetzt kannst du ja den logischen Fehler in der Argumentationskette suchen.

Aber auf mehr Ressourcen als von einem herkömmlichen Kern. Ein Modul ist ja mal aus zwei herkömmlichen Kernen entstanden.
Klar, besonders im Integerbereich hat ein Bulldozer-Kern (also ein halbes Modul) richtig zugelegt. Es wird sich erst noch zeigen müssen, ob die Streichung von Int-Pipelines im Vergleich zum alten K8 durch eine bessere Auslastung kompensiert werden kann. Mit genug Takt geht das, aber da muss AMD erst noch Beweise liefern.

Btw: Kennt sich hier irgendjemand mit SSE-Programmierung in Assembler aus?
 
Bemühe dich nicht, das mr.dude zu erklären, denn je besser deine Argumente sind, um so stärker wird er dich persönlich angreifen, um von dem Thema abzulenken. Und seine Milchmädchenrechnung nimmt ihm doch eh niemand ab.

Wenn du den Thead aufmerksam gelesen hättest, würdest du auch den Grund für diese Rechnung mitbekommen haben.
Und der Grund ist nämlich deine falsche Aussage selbst.
Aber immer gleich von persönlichen Angriffen sprechen, die nicht erfolgt sind, aber dann selbst Unterstellungen und die Person selbst im Thread mit eben jenen schädigen wollen.?:wayne:


Grummel schrieb:
Obwohl es schon irgendwie süß ist, wie er um den x6 schönzurechnen, vom 2500k - von dem seit dem ersten Post von Duplex zu dieser Sache die Rede ist - ablenkt und so einen alten i7 ausgräbt. Der 2500k hat nämlich eine deutlich höhere pro Thread Performance von 1,36 (um in der Milchmädchenrechnung zu bleiben) gegenüber den 0,98 des X6.

DAs liegt vielmehr daran, dass er den 45nm Prozess vergleichen hat, was aufgrund Bulk von AMD immernoch etwas unfair ist, bzw, weil du nicht zwischen Kern und Thread differenzierst, du hast seinen Beitrag also vom Sinn her nicht erfasst.

Obwohl es schon irgendwie süß ist, wie er um den x6 schönzurechnen, vom 2500k - von dem seit dem ersten Post von Duplex zu dieser Sache die Rede ist - ablenkt und so einen alten i7 ausgräbt.

Niemand lenkt hier ab, was hat das denn für einen Sinn?
Er will dir lediglich zeigen, dass deine Argumentation mit Thread/Kern nicht zusammenpasst und hat dazu ein Beispiel gebracht.

Bei Cinebench sieht man jedenfalls nicht, dass die Pro-Thread Performance bei AMD ein Problem wäre.

Beim 2500K sieht man es schon, beim I7 mit SMT ist das ne Milchmädchenrechnung, aber das war ja nicht das Ziel des Beispiels.
 
Zuletzt bearbeitet:
Hallo everybody! Ich bin neu hier und schpreche nicht sehr gut, so ich bitte um Verständnis.

Zu thema: Mann mus auch nicht vergessen, dass Bulldozer wird nicht mit 2600K, aber mit nächsten model kämpfen. Und Intel hat höhen übertaktungraum und können das sehr hoch takten in Abhängigkeit mit TDP. 130W 2610K oder 2700K kann sehr stark sein.

[...]

AFAIK kann die 1155-Plattform nur 100W TDP. Alles darüber findet sich auf dem LGA2011 wieder. Ich glaube auch nicht, dass bis Ivy noch neue Modelle für 1155 kommen werden. Sowas ist auch auf keiner mir bekannten Roadmap verzeichnet.
Mit wem sich BD messen kann, wissen wir leider erst wenn er verfügbar ist. Es gibt trotz des ganzen OBR-Schmarrns (mehr ist es ja letztendlich nicht) in Wahrheit nicht einen Anhaltspunkt für eine etwaige Leistungsbewertung - inclusive der ganzen fiktiven Preisangaben, weil man dort nicht weiss, welche Modelle es genau betreffen sollte. Man weiss ja lediglich, dass es ein BD-Modell um 300€ geben soll - was nur dafür spricht, dass er zum Sandy konkurrenzfähig sein muss. Inwieweit ist nicht bewertbar.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh