[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

Sieht sehr komisch aus, kann mir nicht vorstellen das der 8 Kern BD langsamer sein soll als der 1055T, auch wenn es nicht das leistungsstärkste Model ist.
Und die Vcore wird wieder anders ausgelesen, als auf den anderen Bildern mit 1,4V. Klar CPU-Z unterstützt die BD noch nicht, aber die Vcore spring doch nicht so stark, außer zwischen idle und last. Aber für idle sind die Taktraten zu hoch und das andere Bild ist auch nicht unter voll last entstanden.
Das ist nix neues, CPU-Z ist mitm Updateintervall nicht ganz so flott..

Bei meiner CPU steht in CPU-Z auch desöfteren 3.1GHz @ 0.92v oder 1.6GHz @ 1.17v, wenn man im unpassenden Moment den Screenshot macht ists halt so ;)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Selbst dafür, dass nur Cinebench R10 benutzt wurde, sind die Werte verdammt niedrig. Da erreicht ein 1055T schon ca. 16000 Punkte. Fehler oder Fake?
Wichtig ist die Unterscheidung zwischen der 32bit & der 64bit Version von CB R10. Angenommen das SingleThreaded-Ergebnis wäre ohne Turbo zustande gekommen (also bei 2,8 GHz), bedeutet dies ca. 835 Punkte / GHz / Kern. Das ist quasi die Leistung eines alten K8-Kernes (Brisbane).

Wenn man jetzt mal im Hintergrund behält, dass es a) ein niedrig getaktetes Ingenieursspielzeug ist und b) Bulldozer vor allem im Integerbereich zulegen soll (Inbetreff FP Leistung ist K10 schon recht gut), könnte das theoretisch schon halbwegs hinkommen. Mit höherem Endkunden-Takt schaut er dann auch ganz ordentlich aus. ;)

EDIT: Wobei mir der Multicore-Speedup etwas niedrig vorkommt. Hätte gedacht, man landet irgendwo bei 6fach.
 
Zuletzt bearbeitet:

Es könnte sich hier um eine abgespeckte "Vorab-Lizenz/Testversion" von Virtu handeln, die den Z68-Boardherstellern für ca. 4-5 $ verfügbar gemacht wird.

Lt. einem "Tom's Hardware" Testbereicht funktioniert "QuickSync" sowohl im "i" als auch im "d" Modus. Was fehlt, ist das jeweilige Treiber-Menu des jeweils anderen Modus (also AMD bzw. nVidia ODER Intel). "TH" bestätigte, daß die "Gespann-Performance" minimal (ca. 2-3%) geringer war als solo, und die Kompatibilitätsprobleme bei Spielen bei Benutzung der dedizierten Karte geringer waren.
Möglicherweise ist noch nicht klar, welcher der Z68-Boardhersteller welche "Virtu" Versionslizenz für welche Produktreihe nehmen wird. Die "Vollversion" (non-OEM) scheint jedenfalls gut zu funktionieren.
Falls aber auch hier wieder mal die Vollverarsche zuschlägt und man sich letztere zusätzlich kaufen muß um Z68 richtig nutzen zu können, so dürfen sie meinetwegen ihre "Sonstwie-Bridge" Sch€iße und ihre Mainboards gerne behalten - ich werde dann nix davon kaufen.

Dann gehe ich doch lieber (ohne IGP) auf AM3+ / "Zambezi" und erspare mir Kosten und Probleme.
 
Zuletzt bearbeitet:
Ich hab mir diese angeblichen Benches nichtmal angeschaut, wozu?
Entweder Bulldozer wird 50% schneller als Phenom II X6 bzw. i7 950 oder er wird schlecht :fresse2: :lol: :fresse2:
 
mhm ich denke 8core 300-400€ und trotzdem nur so schnell wie nen 2700k mit 4 core und HT...
und das wäre schon ne leistung für amd ;-)
wenn er doch schneller wird würde ich mich natürlich freuen, aber obs so wird?

beste grüße
 
Klar. Der Prozessor wird langsamer als das Konkurrenzprodukt und AMD soll den im Gegenzug für 25% mehr Öcken verkaufen...

Frag mich manchmal wo ihr alle lebt.

Wenn er langsamer wird, wird der auch günstiger als die Konkurrenz verkauft.
Wenn das nicht wirtschaftlich machbar ist, wird der Prozessor solange von AMD subventioniert bis man entweder nen besseren Nachfolger bringen kann oder man Pleite ist. Alles andere funktioniert nicht.
 
Klar. Der Prozessor wird langsamer als das Konkurrenzprodukt...

Wo lebst denn du, damit zu weist, dass BD langsamer als Sandy bridge wird?

Wenn du dich auf das aktuelle Benchmark beziehst.... wir hatte vor ein Paar Monaten auch einen anderen Fake, der zeigte, dass BD viel schneller ist.

So lange also noch nichts offiziell bekannt ist, würde ich mal den Ball flach halten.

@Duplex, alles unter 50% müssen nicht umbedingt lügen sein, aber alles langsamer als ein x6 auf jeden Fall, AMD wäre ja schon blöd, wenn sie eine Neue CPU architektur verkaufen wollen und diesem weniger Leistung als ihr aktuelles Topmodell verpassen. Vorallen, da mehr Kerne/Threads.
 
@ why_me: Wenn man nicht mal das Posting von Jirikii richtig deuten kann, dann sollte man von der aktiven Teilnahme in einem Forum absehen.
 
Man muss aber bedenken, dass BD nur 2 statt 3 Integer Pipelines pro Kern hat. Dazu habe ich mal ne Frage (oder auch Diskussionsanregung):

Weiß jemand, ob AMD sich dazu geäußert hat, warum es nur noch 2 Integer Pipelines gibt? Hat AMD dazu Simulationen betrieben und das jetzige BD Design als das Leistungs- und Auslastungstechnisch beste befunden (sprich die dritte Pipeline beim Phenom konnte sowieso kaum ausgelastet werden) oder ist die Reduzierung nur Platz und Stromaufnahme geschuldet, möglicherweise vor dem Hintergrund, dass das Design zuerst für einen gröberen Fertigungsprozess entwickelt wurde und jetzt die Zeit nicht mehr gereicht hat, die dritte Pipeline zu implementieren?

Ersteres wäre gut, Zweites würde die Überlegenheit des BD in Frage stellen.

Und noch eine andere Frage: Angenommen es käme ein Prozessor auf den Markt, der dank einer weit fortschrittlicheren Technologie in allen Disziplinen mindestens 3x so schnell wäre wie die bisher beste CPU, der Preis läge allerdings bei 3000€. Wer von euch würde ihn trotzdem kaufen?
 
Zuletzt bearbeitet:
Waren das nicht 3 statt 4 Integer Pipes? :hmm:
Oder hab ich das grad falsch in Erinnerung?
 
EDIT: Wobei mir der Multicore-Speedup etwas niedrig vorkommt. Hätte gedacht, man landet irgendwo bei 6fach.
Sollte man eigentlich auch, zumindest mit dem 4-Modul Bulldozer. Aber gut, die Frage ist, was Turbo ausmacht. Das beeinflusst ja ebenfalls den Speedup. Auf der anderen Seite, wenn Turbo aktiv war, dann müsste auch Super Pi mit mehr als 2,8 GHz gelaufen sein. Die Anwendung ist schliesslich singlethreaded. 27 Sekunden ist aber ziemlich genau die Zeit, die mein X2 240 @ 2,8 GHz mit Standard DDR2-800 schafft. Dh, das Sample müsste um einiges pro Takt langsamer sein. Insgesamt also alles sehr unglaubwürdig. Oder das System lief nicht auf vollen Touren. Das kennen wir ja schon von Phoronix.


Man muss aber bedenken, dass BD nur 2 statt 3 Integer Pipelines pro Kern hat.
Nein. Bulldozer hat 4 Integer Pipelines pro Cluster, K10 hat lediglich 3. Der Punkt ist, dass die Pipelines anders aufgebaut sind. Während beim K10 jede Pipeline ein ALU/AGU Pärchen enthält, was recht problematisch für eine konstante Auslastung sein kann, und hinter einem dedizierten Scheduler sitzt, hat jede Integer Pipeline beim Bulldozer nur noch eine Ausführungseinheit, die alle hinter einem gemeinsamen Scheduler sitzen.

Weiß jemand, ob AMD sich dazu geäußert hat, warum es nur noch 2 Integer Pipelines gibt? Hat AMD dazu Simulationen betrieben und das jetzige BD Design als das Leistungs- und Auslastungstechnisch beste befunden (sprich die dritte Pipeline beim Phenom konnte sowieso kaum ausgelastet werden) oder ist die Reduzierung nur Platz und Stromaufnahme geschuldet, möglicherweise vor dem Hintergrund, dass das Design zuerst für einen gröberen Fertigungsprozess entwickelt wurde und jetzt die Zeit nicht mehr gereicht hat, die dritte Pipeline zu implementieren?
Wie gesagt, es sind 4 Integer Pipelines pro Cluster. Ich nehme mal stark an, AMD wird ausreichend Simulationen betrieben haben. Es sind zwar weniger Ausführungseinheiten, dafür sollten die deutlich besser ausgelastet werden können. Sprich, die Anzahl der verarbeiteten Instruktionen pro Takt sollte mindestens gehalten werden können, dafür sinkt die Leistungsaufnahme. Ein weiterer Punkt ist, dass die K10 AGUs nicht viel mehr als Adressgenerierung konnten. Aus den AGUs wurden beim Bulldozer nun AGLUs, die wiederum einfache ALUs enthalten, welche ebenfalls arithmetische und logische Operationen durchführen können, siehe Software Optimization Guide für Family 15h.
The AGLUs contain a simple ALU to execute arithmetic and logical operations and generate effective addresses.
 
Zuletzt bearbeitet:
Wäre relativ schlecht wenn sich die IPC auf gleichem Niveau des Phenoms befinden würde. Dann muss man Billigheimerpreise fahren.
Man darf schließlich nicht vergessen, dass der Prozessor eigentlich schon 2009 hätte aufschlagen müssen.
Auch wenn der Benchmark vielleicht nicht echt sein mag.
Wenn Chiphell davor steht, kann man eigentlich meistens sicher sein, dass der in irgendeiner Form so stimmt.
 
Ja, schon. Aber 32nm, AVX, SSE4 beeinflusst nicht wirklich die IPC, besonders bei Spielen nicht. Weiß man denn was sich konkret an der Architektur geändert haben könnte?
Ich hab langsam das Gefühl das Bulldozer ein Rohrkrepierer wird und im Mittel kaum flotter bei gleichem Takt ist, als der Phenom. Die Mehr- IPC hat man sich einfach mit der Modulbauweise verbaut.
Hoffentlich braucht man keinen 8 Kerner damit 4 Module @4 Threads dann ausreichen um wenigstens die Sandy Quads beim Spielen zu gefährden.
 
Zuletzt bearbeitet:
Ja, schon. Aber 32nm, AVX, SSE4 beeinflusst nicht wirklich die IPC, besonders bei Spielen nicht.
Wenn AVX oder SSE4 genutzt wird, kann es auch die IPC beeinflussen. Ausserdem schrieb ich "usw". Wer weiss, was seitdem noch alles am Design verändert wurde.

Die Mehr- IPC hat man sich einfach mit der Modulbauweise verbaut.
Singlethread? Nein. Ganz im Gegenteil. ;)


w0mbat meint im XS, dass die Zahlen echt sind, die CPU durch einen Bug (BIOS?) aber immer nur mit Idle Taktraten läuft, also vermutlich 800 MHz. Dafür wären die Scores dann wiederum verdammt gut. Gut möglich, dass beim ES auch nur 3 Module aktiv waren. Zumindest zeigt ein weiterer Screen nur 6 Threads im Task-Manager. Das würde auch einen Cinebench Speedup von <5 ohne Turbo erklären.
 
Zuletzt bearbeitet:
Weiß jemand, ob AMD sich dazu geäußert hat, warum es nur noch 2 Integer Pipelines gibt?
Diesbezüglich interessante Literatur:
Von Latenzen und Compilern | c't
Wobei der gleiche Herr meinte, Bobcat sei ein aufpolierter K6. Was nicht so ganz richtig zu sein scheint, insofern mit etwas Skepsis zu lesen.

Wieviele 128 Bit breite FPU-Verarbeitungseinheiten hat eigentlich ein K10-Kern? Bei Bulldozer wären es single-threaded derer zwei, multithreaded nur noch eine.
 
Mr. Dude schrieb:
Singlethread? Nein. Ganz im Gegenteil.

Mein ich ja auch gar nicht. Man muss halt dann wohl 2 Module gegen die i3 stellen, die 3 Module gegen den i5 2400 und die 4 Module gegen i7 2500 und i7 2600 bei mehr benötigter Chipfäche und vermutlich weniger IPC.
Aber man weiß immeroch nicht konkret, ob AMD es gebacken bekommt, die LAst auf 4 Module zu verteilen und 4 Threads zu bearbeiten, auch wenn mehr als 4 Threads prinzipiell unterstützt würden, aber die vollen Ressourcen bei 4 Threads wiederum minimal mehr Performance bringen.
Oder weiß man da schon genaueres?
 
Zuletzt bearbeitet:
Wieviele 128 Bit breite FPU-Verarbeitungseinheiten hat eigentlich ein K10-Kern? Bei Bulldozer wären es single-threaded derer zwei, multithreaded nur noch eine.
K10 hat pro Kern 1x 128-bit FADD + 1x 128-bit FMUL. Bulldozer hat pro Modul 2x 128-bit FMAC. Also praktisch gleich viele Ressourcen pro Thread. Hinzu kommt, dass Bulldozer für Integer SIMD zusätzliche Rechenwerke besitzt.


Mein ich ja auch gar nicht. Man muss halt dann wohl 2 Module gegen die i3 stellen, die 3 Module gegen den i5 2400 und die 4 Module gegen i7 2500 und i7 2600 bei mehr benötigter Chipfäche und vermutlich weniger IPC.
Wie gross zB ein 2-Modul Bulldozer wird, wissen wir nicht. Noch gibt es ja Gerüchte, dass es ein separates Design wird. Und solange wir die Performance eines 3- und 4-Modul Bulldozers (Valencia @ C32, Zambezi @ AM3+) nicht kennen, ist die Diskussion über Chipflächen recht müszig.

Aber man weiß immeroch nicht konkret, ob AMD es gebacken bekommt, die LAst auf 4 Module zu verteilen und 4 Threads zu bearbeiten, auch wenn mehr als 4 Threads prinzipiell unterstützt würden, aber die vollen Ressourcen bei 4 Threads wiederum minimal mehr Performance bringen.
Wenn Windows, Linux oder welches OS auch immer es mittlerweile gebacken bekommen, Threads auf Prozessoren mit SMT weitestgehend vernünftig zu verteilen, wird das bei CMT auch kein Problem sein. Das ist doch das gleiche in Grün. AMD könnte sogar die selben CPUID Bits wie SMT verwenden.
 
Wow, die Single Thread Leistung ist ja unterirdisch. Das Ergebnis in Super Pi entspricht so ziemlich genau meinem Athlon II x2, wenn ich ihn auf die 2,8 Ghz takte - und das ist nach heutigen Maßstäben schon eine ziemliche Single Thread Gurke.

Merkwürdig, dass der mutiprocessor Speedup vom Zambezi nur bei 4,85 liegt - von einem 8-Kern Prozessor hätte ich in einem hervorragend skalierendem Programm deutlch mehr erwartet. Wenn man jetzt wieder die alten Rechnungen aufmacht, dass die 8-Kerne rechnerisch eigentlich nur 6,4 Kernen entsprechen könnte es evtl. passen.

Naja, ich hatte eh den Verdacht, dass der BD nicht ganz so gut wird, wie die AMD Marketing Abteilung ihn uns hier verkaufen möchte. Andererseits - vielleicht ist es auch nur ein Fake. Denn dass der BD noch nicht einmal die Hälfte der Punkte des Intel im Cinebench Single CPU Bench erreicht - so schlecht kann der BD doch gar nicht sein, oder?
 
Glaub ich auch nicht. Die Ergebnisse ergeben so keinen Sinn. Vielleicht kommt ja in den nächsten Tagen und Wochen noch etwas Kompetenteres.
 
Lies mal etwas weiter oben ;)
Idle Takt und evt. nur 3 aktive Module
 
@ Grummel

würde aber ev sinn machen wenn BD mit 4 ghz oder mehr ab werk in den verkauf geht :d
 
Zuletzt bearbeitet:
Ach als ob die Ergebnisse vom Idle Takt wären, das ist doch wieder nur eine Mutmaßung die sich eh als falsch herausstellen wird ;)
 
Lies mal etwas weiter oben ;)
Idle Takt und evt. nur 3 aktive Module

Das mit dem Idle kann ich mir nur schwer vorstellen, da CnQ deaktiviert war. Und wäre dies die Idle Score, dann wäre Super Pi mit 2,8 Ghz bei ca. 7 Sekunden bzw. bei ca. 5 Sekunden mit Turbo. Wünschenswert wäre dies, denn eine hohe single core Leistung ist m.E. der Schlüssel zu einem schnellen PC (wenn man nicht dauernd Videoschnitt macht).

EDIT: Ich habe eine Erklärung gefunden: das Ding ist überhaupt kein BD sondern ein 5-Kern Llano! Dann passt alles. :fresse:

EDIT2: Obwohl, vielleicht ist es doch Idle und Idle bedeutet einfach nicht mehr 800 Mhz. Selbst als begeisterter Idle-Stromsparer habe ich meine Idle Frequenz jüngst von 800 Mhz auf 1,2 Ghz hochgesetzt, weil es vom Stromverbrauch her im Idle gerade mal 0,3 Watt oder so Unterschied macht. Vielleicht hat AMD die Idle Frequenz auf 1,6 Ghz angehoben. Sinn machen würde es in meinen Augen. Das System würde deutlich schneller aus den Puschen kommen und nur marginal mehr verbrauchen / Hitze erzeugen.
 
Zuletzt bearbeitet:
Pro Intergercluster kann durchaus eine niedrigere Leistung herauskommen, wenn sie niedrig getaktet ist. Der Trick beim BD ist ja, dass die Cluster sehr hoch (4GHz+) getaktet werden können. Zudem ist BD nicht zwingend auf reine Integer-Leistung optimiert. Ein Cluster kann gleichzeitig ALU und AGU-Operationen durchführen. Der K9 wurde ja nicht grundlos zurückgezogen damals. AMD hatte mMn ganz einfach keinen passenden Fertigungsprozess, um ein solches Hochtaktdesign, was die Integercluster ja nunmal sind, zu fertigen. Damit war die Leistung des K9 mMn einfach schlechter als die eines K10.
Allerdings muss man zu den Benchmarks auch nochwas sagen. SuperPi setzt auf x87, was beim BD nurnoch notdürftig unterstützt wird, ganz anders als noch im K10. Wenn er da beschissene Leistung zeigt ist das mMn ok und sagt genau 0 über dessen tatsächliche Leistungsfähigkeit aus. Und Cinebench10 ist uns ja sowieso als nicht unproblematisch bekannt. So unterirdische Ergebnisse kann man bei keiner neuen Hochleistungsarchitektur für bare Münze nehmen, da hätte AMD ja gleich 8 Bobcat-Kerne mit 3GHz als Hochleistungsdesign verkaufen können ;). Immer schön auf die Verhältnismässigkeit achten, dann fällt auf wie unplausibel das ist. Da jetzt irgendwelche Untergangsszenarien abzuleiten ist doch einfach nicht korrekt.
 
Zuletzt bearbeitet:
Ach als ob die Ergebnisse vom Idle Takt wären
Als ob die Ergebnisse mit 2,8 GHz erzielt worden wären. Klar, AMD wirft einen nagelneuen Prozessor auf den Markt, der deutlich hinter Thuban zurückliegt. :rolleyes: Tatsache ist wohl, dass B0 und frühere Steppings von Bulldozer Probleme mit den Power-States hatten. Von daher wäre es absolut plausibel, dass das ES nicht oder nur teilweise mit vollem Takt lief.


Das mit dem Idle kann ich mir nur schwer vorstellen, da CnQ deaktiviert war.
Wenn das Problem im Silizium oder BIOS liegt, ist es völlig egal, ob CnQ deaktiviert war oder nicht.

Und wäre dies die Idle Score, dann wäre Super Pi mit 2,8 Ghz bei ca. 7 Sekunden bzw. bei ca. 5 Sekunden mit Turbo.
Da man nicht sicher sagen kann, wie die Taktrate war, lassen sich auch schlecht Ergebnisse für 2,8 GHz interpolieren. Auch möglich, dass die Taktrate öfters hin und her springt, was die Ermittlung des durchschnittlich anliegenden Taktes noch schwieriger macht.


SuperPi setzt auf x87, was beim BD nurnoch notdürftig unterstützt wird, ganz anders als noch im K10.
Wenn ich mich richtig erinnere, war die Aussage von AMD, dass durch die Verbesserungen der Bulldozer Architektur selbst x87 Code profitieren soll. Btw, könnten wir uns darauf einigen, Bulldozer bitte nicht mehr als Hochtaktdesign zu bezeichnen? :wink:
 
Wenn die max. Leistungsaufnahme unter der max. Wärmeentwicklung liegt läuft aber was falsch oder hab ich etwas falsch verstanden?
 
Als ob die Ergebnisse mit 2,8 GHz erzielt worden wären. Klar, AMD wirft einen nagelneuen Prozessor auf den Markt, der deutlich hinter Thuban zurückliegt. :rolleyes: Tatsache ist wohl, dass B0 und frühere Steppings von Bulldozer Probleme mit den Power-States hatten. Von daher wäre es absolut plausibel, dass das ES nicht oder nur teilweise mit vollem Takt lief.
Ich hab ja nicht behauptet das das Ergebnis korrekt ist, aber die CPU lief bei diesem Ergebnis zu 100% nicht mit 800MHz! ;)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh