[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

Hi Balzon


geh doch mal auf die seite und schaue dir die resultate vom test mit dem letzten Final Bios an und die mit dem Beta vieleicht erkennst du dann etwas. Solange wir das Finale nicht haben lässt sich abschließend keine aussage tätigen....

lg


Ich kenne die Ergebnisse bereits. Worauf beziehst Du dich? Ergibt für mich jetzt kein Sinn, da es doch genau das ist, was ich beschreibe. Als erstes mal vorne weg, die ersten Ergebnisse sind mit älterem Mainboard entstanden. Ich denke aber das lag am Bios, weil OBR nach Update des AGESA Codes auf 0.0.9.0 ebenfalls von performance Steigerungen sprach. Also noch mal für dich. Finales Bios AGESA 0.0.7.5= übel langsam in Cinebench, Beta Bios AGESA 0.0.9.1= deutlich schneller in Cinebench als finales Bios. Ergo braucht es wohl mindestens AGESA 0.0.9.0 um die Leistung zu entfalten. Ob es die volle Leistung entfaltet weiß ich nicht, mir stört nur das Beta Gerede. Beta Biose sollten die ersten sein, die die volle Leistung entfalten können.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Und mal ganz vom 8 Kerner abgesehn, den sich nicht jeder kaufen würde, so gibts zu den kleineren Modellen noch weniger Infos.
Ob AMD da überhaupt Land sehn wird, ist fraglich, ohne extrem an der Preisschraube drehen zu müssen, sofern sie es überhaupt können.

Das finde ich sehr interessant...
Man möchte ja seitens AMD die/den großen drei Moduler gegen den 2500K von Intel stellen.
Schafft der große vier Moduler gerade so auf biegen und brechen 2600K Leistung, wird der drei Moduler den 2500K definitiv nicht packen... Den ihm fehlen locker flockig 25% der Ausführungseinheiten.
Eigentlich müsste der 8150 den 2600K gerade in Multithreading deutlich hinter sich lassen, damit die Politik der kleineren Modelle aufgeht. Andererseits lässt der Preis gerüchten zur Folge wiederum nicht signifikante Mehrleistung vermuten.

Bleibt also spannend...

Meine Spekulation aufgrund der aktuellen möglichen Infos:
- großer vier Moduler schlägt ganz knapp 2600K in MultiThreading. Verliert aber in SingleThreading, bzw. generel bei weniger Auslastung (ala Games)
- drei Moduler wird merklich langsamer als 2500K sowohl unter voller Auslastung, als auch bei weniger Last.
- zwei Moduler arbeitet ähnlich fix bei MultiThreading wie die Intel Dualcores + SMT. Ist aber wie der große Bruder bei weniger Auslastung weniger fix.
Wobei letzteres abzuwarten bleibt. Hier könnte man mit erheblichem Turbo vllt gar das Ruder rum reißen. ;)
 
@fdsonne
das würde bedeuten gleich bei einem AMD Phenom II X6 1100T zubleiben, vor allem wer noch ein am2+ board besitzt......Der geht sicher bald für 140.-EUR über den Tresen. Bulldozer wäre einfach ein Faß ohne Boden.
Abgesehen davon verwende ich jetzt seit mehr als 10 Jahren nur AMD Prozessoren, aber so einen Zirkus wie um den Bulli habe ich noch nicht erlebt.
 
Zuletzt bearbeitet:
Ihr seid mal wieder am Thema vorbei. Die Grafikkarten und wieviel Kerne BF3 unterstützt ist hier eigentlich nicht das Thema und sollte bitte eingestellt werden.
 
R.I.P PC games -> nicht mal die wissen, warum amd bei super pi und wprime schlecht ist
AMD ist in wPrime schlecht? Seit wann das? Und wem die AMD Werte in Super Pi nicht gefallen, der kann ja mal den System Stability Tester ausprobieren. Gibt's auch in einer 64-bit Version, die zumindest auf meinem Athlon II fast dreimal so schnell ist im Vergleich zur 32-bit Version. ;)


Woran erkennst du das? Nur mal so am Rande, zu K8- und Netburst-Zeiten war AMD in SuperPi weit vor Intel (EDIT: Stichwort x87, da hat Intel noch optimiert - AMD nicht).
Auf Netburst zu verweisen, ist einfach nur eine ziemlich schwache Ausrede. Auch zu dieser Zeit war Intel vorn, nämlich mit dem P-M. Mal davon abgesehen, Analysen deuten eher darauf hin, dass andere Optimierungen, zB bei der Sprungvorhersage, bei Intel für Leistungsgewinne sorgten und weniger x87 Optimierungen.


Nach dem Test soll der achtkerner von AMD bei einem Multithread Benchmark bei 4,2 Ghz auf Niveau eines 2600k sein, das bekommst du billiger mit einem Thuban hin...
Der Unterschied ist nur, einen X6 1100T müsstest du dafür schon um 0,5-0,9 GHz übertakten, je nach Turbo. Bulldozer wird 4,2 GHz wohl mit Turbo ohne Übertaktung schaffen. Ganz zu schweigen von der Leistungsaufnahme, die bei einem X6 @ 4,2 GHz auch um einiges höher sein dürfte.


PGGH bringt es auf den Punkt wenn dem so ist.
Dumm nur, dass PCGH wie leider nicht selten wieder mal Unwahrheiten kolportiert. "Mehr Recheneinheiten"? Nein! Thuban besitzt für jeden Kern 3 ALUs, 3 AGUs und 3 128-bit FPU Einheiten (ADD, MUL, MISC). Das ganze 6 mal ergibt insgesamt 54 Ausführungseinheiten. Zambezi hingegen besitzt pro Modul 2x 2 ALUs, 2x 2 AGLUs, 2 128-bit FP SIMD, 2 128-bit Int SIMD. Das ganze 4 mal ergibt insgesamt 36 Ausführungseinheiten. Oder 2/3 der Ausführungseinheiten von Thuban. Auch deshalb sage ich schon länger, man sollte Zambezi als 4-Kerner betrachten, der beim Multithreading deutlich besser skaliert als mit SMT, und nicht als 8-Kerner. Da kann das AMD Marketing erzählen was es will. Allerdings sind die Ausführungseinheiten zwischen K10 und Bulldozer teils verschieden. Man sollte sie also auch nicht unbedingt 1:1 vergleichen.


Letzten Endes kommts aufs Gesamtpaket an!
Die (evtl.) hohen VCores sprechen nicht umbedingt für einen niedrigen Stromverbrauch, genauso wie die größere Die-Fläche.
1,3 V ist doch nicht hoch. Deneb und auch zuletzt Llano wurden mit 1,4+ V und weniger Takt gelauncht. Und Die Fläche sagt noch nichts über Leistungsaufnahme. Entscheidender ist doch, welche Transistoren dort untergebracht sind und wie stark diese beansprucht werden. ZB Cache braucht pro Transistor idR weniger Energie als Kernlogik. Weiterhin besitzt Bulldozer neue Energiesparmechanismen, die nicht nur unter Idle greifen, sondern auch unter Last, Stichwort Clock Grid.
 
@ mr.dude

Die AGUs sind keine vollwertigen ALUs und die AGLUs sind mächtiger als die AGUs, die kannst du also nicht einfach in einen Topf werfen.
Man sollte sie also auch nicht unbedingt 1:1 vergleichen.
Wie du ja auch selbst sagst ... nicht einfach alles munter addieren und dann multiplizieren.
Auf Netburst zu verweisen, ist einfach nur eine ziemlich schwache Ausrede. Auch zu dieser Zeit war Intel vorn, nämlich mit dem P-M.
Stimmt, der Pentium-M war im Desktop-Markt eine extrem weit verbreitete CPU :fresse:
 
Die AGUs sind keine vollwertigen ALUs und die AGLUs sind mächtiger als die AGUs, die kannst du also nicht einfach in einen Topf werfen.
Deshalb schrieb ich auch:
Allerdings sind die Ausführungseinheiten zwischen K10 und Bulldozer teils verschieden. Man sollte sie also auch nicht unbedingt 1:1 vergleichen.
Warum wiederholst du das also nochmal, nur mit anderen Worten? Übrigens, ohne Berücksichtigung der AGUs/AGLUs stünde es 36 zu 20 Ausführungseinheiten. Da wäre das Verhältnis sogar noch besser für Thuban. Und dass AGUs keine ALUs sind, war in dem Kontext auch nebensächlich.

Stimmt, der Pentium-M war im Desktop-Markt eine extrem weit verbreitete CPU
Was hat eine Diskussion über Architekturen mit speziellen Marktsegmenten zu tun? :rolleyes:
 
Der Unterschied ist nur, einen X6 1100T müsstest du dafür schon um 0,5-0,9 GHz übertakten, je nach Turbo. Bulldozer wird 4,2 GHz wohl mit Turbo ohne Übertaktung schaffen. Ganz zu schweigen von der Leistungsaufnahme, die bei einem X6 @ 4,2 GHz auch um einiges höher sein dürfte.

Also erstmal ist der Turbo auch nichts anderes als intelligents automatisches Übertakten des Prozessors.
Wenn ein Bulldozer der auf 4,2 Ghz rennt 6.87 Punkte bei Cinebench bekommt und ein 1100T mit 3.3 Ghz 4.23 Punkte ist man mit dem thuban günstiger bei der Leistung, denn der Bulldozer wird bei allen Kernen auf 4,2 Ghz auch mehr Strom ziehen als im Standard-Takt und der Bulldozer soll angeblich über 250€ kosten und der 1100T kostet ca 150€.

Auch wenn der Bulldozer kein echter Achtkerner ist so ist er auch kein simpler Vierkerner, also wäre die Leistung ernüchternd, wenn sich die Benchmarks so als richtig heraustellen würden.

Wenn das das endgültige Leistungverhalten vom größten Bulldozer wäre kann man getrost beim X6 bleiben bzw zu ihm greifen und hoffen das BD2 besser wird.
 
Bei Bulldozer? Ja. Beim Thuban? Nicht offiziell bekannt.

Davon ab stützen beim Bulldozer die AGLUs die ALUs in Sachen Berechnung ... also sollte man anders rechnen und dann wäre Gleichstand. Nimmt man einfach nur Anzahl von Integer- und FPU-Kernen, liegt Zambezi vor Thuban. Und AMD vermarktet auch genau das.
 
Zuletzt bearbeitet:
mies einfach nur mies. ich will ne leistungs explosion nicht mini schritte......

sollen endlich mal Bench's rüberwachsen lassen alles andere glaub ich nicht egal. mit richtigen offiziellen bildern usw.....
 
Da stimmt was nicht, den Benches würde ich wenig Beachtung schenken. Diese Benckmarks sind mMn mit dem gleichen Sample gemacht worden wie die früher. Nur mit mehr Takt und nem finalen BD-AGESA.
Der Prozessor schafft mit dem hohen Takt bei Cinebench 80% der IPC des K10-Kerns. Das ist allein deshalb schon unglaubwürdig, weil JF früher davon sprach, dass BD definitiv mehr IPC hat als der K10. Wenn man allein die Caches betrachtet kann BD eigentlich nicht langsamer sein als der K10 und in diesen Benches ist er es taktbereinigt definitv, sogar massiv. Also: Von den Schlußfolgerungen her vollkommen unglaubwürdig.

Dass WPrime auf dem Sandy nicht so gut performt, kann an den kleinen L2-Caches liegen. Mit dem Tool ist mMn genausowenig ein Architekturübergreifender Vergleich mögich, wie mit SuperPi.
 
Zuletzt bearbeitet:
In Cinebench erwarte ich mit Standard Takt mind. 15% vorsprung gegenüber den i7-2600.
Wartet bis zum launch dann werdet ihr sehen das AMD den i7-2600 mit Abstand abziehen wird!
 
Zuletzt bearbeitet:
Davon ab stützen beim Bulldozer die AGLUs die ALUs in Sachen Berechnung ... also sollte man anders rechnen und dann wäre Gleichstand.
Nein. Loads/Stores haben immer noch einen grösseren Anteil am Code als Rechenoperationen. Hier hast du mal ein Profil anhand von SPEC CPU2006:



Es ist also Unsinn, AGUs/AGLUs nicht zu berücksichtigen. Beim K10 wurde die dritte AGU auch deutlich öfter genutzt als die dritte ALU.

Nimmt man einfach nur Anzahl von Integer- und FPU-Kernen, liegt Zambezi vor Thuban.
Irrelevant. Was "Kerne" sind und wie sie vermarktet werden, interessiert uns nicht. Wir sprachen von Ausführungseinheiten.
 
Als beworbener 8-Kerner muss er auch mit Abstand an nem beworbenen 4-Kerner vorbei ziehen.
Jaja, erzählt mir jetzt nix von Marketing und Logik...
Wenn er gegenüber nem X6 als 8-Kerner dastehn will, sollte er
bei 3.6GHz 8.3 bis 8.4 Punkte im Cinebench R11.5 erreichen,
das wäre ein Vorsprung von 20% gegenüber dem 2600K,
taktbereinigt noch 13%.
Das wäre gegenüber dem X6 dann aber noch keine Verbesserung der IPC,
sondern nur des Standard-Takts, der Übertaktbarkeit und der Anzahl
der Kerne, bzw. der Anzahl der Kerne mit denen geworben wird.
Legen wir noch 5% drauf, weils ne neue Architektur ist, sollten
da mindestens 8.7 Punkte drin sein... sonst wärs kein 8-Kerner
sondern ein Marketing-Trick.
 
@Duplex
Man kann sich auch alles schön reden.
@Rest der Fanatiker
Ich verstehe euch ned. Hier wird die Firma xy auf Teuf komm raus verteidigt obwohl Tatsaschen ganz andre Sprache sprechen.
Man muss es einfach so sehen wie es ist. Es wurde fast überall propagiert der BD wird den SB in MT Anwendungen abziehen. Was kamm herraus. Nix. Man muss 4,2 GHz um überhaupt an einen SB mit 3,2-3,5 GHz ranzukommen.

Sehr vorteilhaft........

MfG Jaimewolf3060
 
Zuletzt bearbeitet:
und hier sehen wir wieder, dass du weder den thread halbwegs gelesen hast, noch gepeilt hast, was kerne, module usw. hier aussagen ...
 
@Rest der Fanatiker
Ich verstehe euch ned. Hier wird die Firma xy auf Teuf komm raus verteidigt obwohl Tatsaschen ganz andre Sprache sprechen.
Man muss es einfach so sehen wie es ist. Es wurde fast überall propagiert der BD wird den SB in MT Anwendungen abziehen. Was kamm herraus. Nix. Man muss 4,2 GHz um überhaupt an einen SB mit 3,2-3,5 GHz ranzukommen.

Sehr vorteilhaft........

MfG Jaimewolf3060
Und ich als vollkommen unbeteiligte Person die hier nur ab und an mitliest verstehe nicht warum man solche Aussagen trifft (und das immer wieder von zig Leuten).
Fakt ist und das kann niemand bestreiten das es Bulldozer offiziell nicht gibt und egal wie man es dreht und wendet, die Benches können stimmen oder auch nicht, soviel zu deinen "Tatsachen"! Wenn dir irgendwas nicht passt wie die Leute hier ihren Standpunkt verteidigen ob richtig oder nicht, guck einfach nicht mehr rein.
Aber Leuten wie mir die hier einfach nur lesen wollen was es zu Bulldozer gibt geht das einfach nur aufn Keks, mehr als das was Mr. Dude und Personen x, y und z hier immer von sich geben (das ist zumindest noch Informativ auf die ein oder andere Art).

Sry für Offtopic aber nach über 40 Seiten (die restlichen taugen hoffentlich :d) musste das mal raus...:kotz:
 
Ich verstehe euch ned. Hier wird die Firma xy auf Teuf komm raus verteidigt obwohl Tatsaschen ganz andre Sprache sprechen.
Man muss es einfach so sehen wie es ist. Es wurde fast überall propagiert der BD wird den SB in MT Anwendungen abziehen. Was kamm herraus. Nix. Man muss 4,2 GHz um überhaupt an einen SB mit 3,2-3,5 GHz ranzukommen.
Das sind doch keine offiziellen Benches von denen du sprichst :rolleyes:
OBR usw. das sind alles Samples mit fehler, das hat nichts zu bedeuten, ganz ruhig bleiben!
 
Richtig, bisher kam noch gar nix heraus, weil es noch keine aussagekräftigen Benchmarks gibt. ;)

Und wenn es die dann gibt und der BD schneidet nicht so ab wie erhofft gibts wieder einen Tread in der Art: AMD wird überall benachteiligt weil xyz nicht getestet wird abc aber schon.... kennen wir doch alles schon!

Falls BD besser wird als die Konkurrenz kommt der eben in den neuen Rechner, wenn nicht dann eben ein Intel, ist mir eigentlich egal.
 
da bin ich echt mal gespannt was bei raus kommt weil bis jetzt ist das teil absoluter bullshit im vergleich zum i7 2600k!
Wenn sich das alles bewahrheiten sollte ist das eine echt miese pleite... naja wollen wirs nicht hoffen!
 
R.I.P PC games -> nicht mal die wissen, warum amd bei super pi und wprime schlecht ist

das kann ich bei meinem 1090T bestätigen - aber warum ist das so? konnte nur beobachten, dass windows die last von superPI ständig auf alle cpus verteilt aber nur auf einer laufen lässt. konnte nicht wirklich merken das der turbocore aktiv wird
 
Ich hab da mal ne Frage dazu:
Wodurch wird denn sichergestellt, dass CMT überhaupt Verwendung findet?
Ist das bei einem Bench wie Cinebench denn Aufgabe des Selbigen oder verwaltet das BS
mit einem Sheduler oder sonstwie die Resourcen oder wie?
Denn soweit ich weiß gibt es ja CMT mit dem BD zum ersten mal und das muss ja irgendwie
auch ausgelastet werden, oder liege ich da komplett falsch?
 
@Duplex
Man kann sich auch alles schön reden.
@Rest der Fanatiker
Ich verstehe euch ned. Hier wird die Firma xy auf Teuf komm raus verteidigt obwohl Tatsaschen ganz andre Sprache sprechen.
Man muss es einfach so sehen wie es ist. Es wurde fast überall propagiert der BD wird den SB in MT Anwendungen abziehen. Was kamm herraus. Nix. Man muss 4,2 GHz um überhaupt an einen SB mit 3,2-3,5 GHz ranzukommen.

Sehr vorteilhaft........

MfG Jaimewolf3060

Erstmal gratz zu deinem schlauen Comment. Lol, ich frag mich echt mal was für Tatsachen dir bekannt sind und eine ganz andere Sprache sprechen und dem Rest der Fanatiker hier ned bekannt sind? Es handelt sich immer noch um nichts offizielles, mit noch nicht final Bios und ka ob die CPU die gebraucht wurde überhaupt dem entspricht, was wir nachher kaufen können!?
Die Benchens können stimmen oder halt eben nicht, aber das als TATSACHE hinzustellen ist doch sehr fragwürdig!?
 
das kann ich bei meinem 1090T bestätigen - aber warum ist das so? konnte nur beobachten, dass windows die last von superPI ständig auf alle cpus verteilt aber nur auf einer laufen lässt. konnte nicht wirklich merken das der turbocore aktiv wird

warum ist superpi auf amd langsam als auf intel ?

Idee 1)

Der SuperPi Code besteht aus alten x87 Befehlen, welche bei Intel weiteroptimiert wurden, bis SSE die Ablöse antrat. Bei AMD hingegen war dies nicht der Fall, wodurch die Verbesserungen in der Ausführungsgeschwindigkeit eben nicht vorhanden sind. -> Intel ist schneller.

Idee 2)

SuperPi ist ein Integer-Code.
Das kann Intel einfach schneller abarbeiten als das AMD-Pendant.
Hier muss man jedoch stark auf die Architektur schauen. Der P4 war da eine absolute Krücke.

Idee 3)

Die Cache-Hierarchie ist unter Anderem ausschlaggebend.
Hier müsste man nur die Intel Core Serie und jede andere vergleichen.




Das ist kurz und knapp das, was in den Foren diskutiert wird.
 
Zuletzt bearbeitet:
[...]AMD wird überall benachteiligt weil xyz nicht getestet wird abc aber schon.... kennen wir doch alles schon!
Schade das der Einsatz und die Mühe gewisser User ständig von Leuten wie dir in den Dreck gezogen wird. Es gab in diesem Thread viel berechtigte Kritik an den Testmethoden einiger Seiten und was noch viel wichtiger ist, die Redakteure haben zu großen Teilen darauf reagiert und ihr Vorgehen angepasst.

Du könntest ja auch mal die Provokateure und Basher kritisieren, die sich ständig in diesen Threads rumtreiben und die Diskussion ins OT ziehen. Aber sowas liest man ja äußerst selten von Usern, die sich die Neutralität ganz groß auf die Fahne schreiben.
 
Und wenn es die dann gibt und der BD schneidet nicht so ab wie erhofft gibts wieder einen Tread in der Art: AMD wird überall benachteiligt weil xyz nicht getestet wird abc aber schon....
Nö, der Tenor lautet dann: Piledriver wird besser. :d:d:d

warum ist superpi auf amd langsam als auf intel ?

Idee 1)

Der SuperPi Code besteht aus alten x87 Befehlen[...]

Idee 2)

SuperPi ist ein Integer-Code.[...]

Idee 3)

Die Cache-Hierarchie ist unter Anderem ausschlaggebend.
These 1 & 2 widersprechen sich. Wobei x87-Befehle schon sehr wichtig sind.

These 3 - ??? - Das Programm stammt aus Pentiums Zeiten - Wenn das nicht in den Cache eines Phenom II passt, hätte ein Pentium ja ständig im RAM rumschreiben müssen. Unwahrscheinlich.

Andere These: Wesentliche Teile der Iteration sind so klein, das sie im µOP-Cache des Sandybridge laufen. Tritt das ein, geht der richtig ab.
 
warum ist superpi auf amd langsam als auf intel ?

Idee 1)

Der SuperPi Code besteht aus alten x87 Befehlen, welche bei Intel weiteroptimiert wurden, bis SSE die Ablöse antrat. Bei AMD hingegen war dies nicht der Fall, wodurch die Verbesserungen in der Ausführungsgeschwindigkeit eben nicht vorhanden sind. -> Intel ist schneller.

Idee 2)

SuperPi ist ein Integer-Code.
Das kann Intel einfach schneller abarbeiten als das AMD-Pendant.
Hier muss man jedoch stark auf die Architektur schauen. Der P4 war da eine absolute Krücke.

Idee 3)

Die Cache-Hierarchie ist unter Anderem ausschlaggebend.
Hier müsste man nur die Intel Core Serie und jede andere vergleichen.




Das ist kurz und knapp das, was in den Foren diskutiert wird.
Das Thema hatten wir schon mal vor ich weiß nicht wieviel Seiten.

Was wir damals rausgefunden haben war, dass die Intels seit dem Übergang auf Yonah, also schon vor Conroe so stark sind.
Intel hat damals nen "Digital Media Boost" eingeführt, irgendwelche FPU Verbesserungen, von denen man keine Details kennt.

x87 Befehle gibts übrigens bei SuperPi, das ist nicht nur INT, habs letztens mit perfmonitor auf meinem AMD Notebook nachgeprüft.

Man müßte man nachschauen, welche Befehle bei Intel deutlich schneller laufen. Eventuell sind das irgendwelche exotischen cos/sin Teile oder sonstwas, die man sonst nicht so oft braucht, und die bei AMD deshalb nur per Microcode abgearbeitet werden.

Ist aber auch Wurst, solange yCrunsher einigermaßen läuft, wäre alles in Butter. Blöderweise ist das aber mit dem Intel Compiler übersetzt. Die AVX Variante läuft angeblich auch unter AMD, aber wie optimal das jetzt ist .. hmhmm:fresse:
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh