Was hat AMD mit Bulldozer falsch gemacht ?

@jdl
wobei man aber sagen muss, es kommt klar drauf an, was du auf die FPU für Instructions los lässt... Durch den shared Ansatz kann das Teil bedingt auch über zwei Threads angesprochen werden... Eben weil sie sich splitten lässt und der Decoder auch diese Menge durchlassen kann.
Nutzt dir halt nix, wenn du mit einem Thread schon die ganze FPU Breite brauchst. Dann tritt das von dir beschriebene ein... Wie Praxisrelevant die FPU im privaten Umfeld aber ist, steht halt wieder auf einem völlig anderen Blatt. Im HPC Geschäft hast du aber wohl definitiv mal recht ;)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
… Durch den shared Ansatz kann das Teil bedingt auch über zwei Threads angesprochen werden... Eben weil sie sich splitten lässt und der Decoder auch diese Menge durchlassen kann. …
Mehr Threads sind fast immer schlechter, weil das mehr Verwaltungsaufwand bedeutet und man im HPC problemlos die Ausführungseinheiten auch mit weniger Threads gefüllt bekommt. Zum Beispiel bringt HT im HPC wenig bis nichts, wenn man Thread Pinning nutzt. Daher konfiguriert man die Intel Maschinen meistens mit HT, aber läßt dann trotzdem nur so viel Threads darauf laufen wie es Cores gibt. Die Threads werden aber fest an die Core gebunden, so daß die Häufigkeit der Contextswitches reduziert werden. Dadurch wird die Performance erhöht und der Vorteil von HT verschwindet vollständig.
 
Das ist mir durchaus bewusst. Ich wollte eher darauf hinweisen, dass der Quervergleich zum HPC Markt recht wenig mit dem im privaten Endkundenmarkt gemein hat... Die Belastungen der CPUs sind dort einfach völlig anderes...
Wenn du im privaten Umfeld, selbst mit zwei Threads bestenfalls im Schnitt die FPU eines Bulldozer Moduls erstmal ausgelastet bekommst, dann hat das Ding ja noch keine wirklichen Nachteile. Problematisch wirds, wenn du es eben mit einem Thread schon schafst... Der Stino Code im privaten Umfeld, wo es eher um Games, bisschen Office, bisschen Internetzeugs, vielleicht etwas Bild/Video/Audiobearbeitung geht, oftmals sogar mit Bezahlmichsoftware, also nicht dem OpenSource und machs dir selbst Ansatz, sieht nunmal anderes aus, als im HPC mit eher hochspezialisiertem Code... Auch setzt sich privat quasi keiner hin und tut die unmengen an Software, die da gleichzeitig auf den PCs tuckert, auf die Threads festpinnen.

So Sachen wie AVX, FMA3/4 usw. sind eher Unbekannte. Und solange das so bleibt, ist der Ansatz der shared FPU nicht direkt das Problem des BDs. Das Problem des BDs im privaten Endkundenmarkt ist wie oben erwähnt, dass er bedeutend schwächer pro Takt/Thread agiert als die blaue Konkurenz. Vorrangig im Umgang mit Ganzzahlen... Und genau das ist eben das, was stand heute noch dort die teils drastischen Unterschiede erzeugt. So ne mini 15W DC Kiste mit SMT und nem boost von teils 50%+ des Basistaktes bringen ansprechenden Speed bei der Arbeit und federn das meiste der Alltags-Lastanforderungen ab. Im HPC Bereich würde wohl so ein Prozessor untergehen... Effizienz hin oder her ;)
 
Hm, mich würden mal die "wahren" Intentionen vom TE interessieren. Man siehe seine letzten Threads... :confused:

Was mich aber stolz macht: Bisher sind so gut wie alle Threads dieser Art aus dem Ruder gelaufen, nicht hier. :bigok:
Es geht doch, deshalb mag ich das Luxx. :love:
 
Da stalkt mich ja einer :d

Ist keinesfalls ein troll Thread um AMD runterzumachen, aber wenn man sich die letzten Ereignisse anschaut, und auch die Ideen die AMD in CPUs/GPUs (Mantle, HMB ... und schlag mich tot) hatte, immer nach hinten für die Firma losging. Da kann man eigentlich auch nicht mehr von einer Pechsträhne reden.
Bulldozer war ja eigentlich ein ganz cooler Ansatz und auf dem Papier klang das ja alles super (Marketing Ahoi), aber so wirklich funktioniert hat es ja nicht. Die Gründe dazu wurden ja schon von einigen Usern benannt und meine Fragen wären größenteils geklärt aber man kann ja den Thread trotzdem zum diskutieren weiter benutzen, natürlich solange sich Team Rot halbwegs sachlich halten kann :d

Ich finde aber auch das AMD da schon viel früher mit Zen hätte kommen müssen, die hatten ja ungefähr nen Jahr später zugegeben das Bulldozer ein Fail war, aber warum sie nicht gleich Zen in Auftrag gegenben hatten und stattdessen noch ein paar Generation warteten. Soweit hätte es meiner meinung nach nicht kommen müssen, und jeder weiß auch, dass das hier AMDs letzter Großer Wurf mit Zen und Polaris sein wird.
 
Es war eben einfach ein Fehler quasi blindlinks darauf zu vertrauen, dass dieser Markt fast bedingungslos in die Breite expandiert. Viel mehr gibts da ja nicht dran rumzureden... Der Markt war nicht bereit für acht und mehr Threads.
Wobei man daran AMD durchaus eine Mitschuld zuweisen kann, denn durch deren Bestrebungen die CPU und die GPU in Form der APU auf einem Die zu vereinen, haben sie ja auch eine alternative Nutzung des durch die Shrinks frei werdenden Platzes auf den Dies mit gefördert. Genau diese iGPU ist ja bei Intels Mainstream CPUs in jeder Generation stärker geworden und nimmt immer mehr Platz auf dem Die ein, während die High-End CPUs der großen Sockel keine haben und deren Kernzahlen seither geradezu exploriert sind.

Wäre der Fokus nicht auf die iGPUs/APUs verlängert worden, wären es mit der Steigerung der Kernzahlen im Mainstream vermutlich durchaus weiter gegangen, denn nachdem man erkannt hat das die 10GHz von denen man geträumt hat als die Taktraten mit jeder Generation rasant gesteigert werden konnten, doch nicht erreichbar sein werden, ging es dann darum mit mehr Kernen mit Leistung zu bieten. Nur hat sich da das Mainstreamsegment dann eben auch zugunsten besserer iGPUs abgekoppelt und bleibt bei maximal 4 Kernen, bei Intel wie bei AMD!


irgendwelche 15W DualCores mit oftmals sehr hohem TurboBoost um Lastspitzen abzudecken und sonst recht niedrigem Basistakt.
Anders kann man solche TDP auch nicht bieten und 15W sind ja schon eher viel, es gibt auch welche mit 6W TDP oder noch weniger. Die sind ja auch nicht für dauernd hohe Last ausgelegt und daher funktioniert das Konzept. Man muss eben die HW für den Zweck passend wählen und sollte sich nicht von den kurzfristigen Spitzenleistungen blenden lassen, da gerade Consumer HW immer öfter mit Technologien daher kommt, die nur einen kurzzeitigen Boost der Leistung erlauben, wie man es z.B. bei dem Pseudo-SLC Schreibcaches der TLC SSDs sieht, deren Dauerschreibrate dann nicht selten ganz schön bescheiden ist. Aber die reicht eben um in den Benchmarks gut auszusehen wo nur wenige GB geschrieben werden und für den typischen Heimanwender reicht es auch, denn wann schreibt er mal viele GB am Stück. So ist es auch mit diesen CPUs mit extrem geringer TDP, die takten bei Last hoch, die Leistungsaufnahme übersteigt die TDP dann gewaltig und die Dinger werden warm und müssen im Takt wieder runter. Passiert das bevor ein Benchmark zuende ist, fällt das Ergebnis dort eher bescheiden aus, ist der Benchmark vorher durch, dann glänzen sie dort mit guten Ergebnissen. Nur sind es eben Sprinter, die schaffen die 100m in 10s, halten aber eben keine Marathonstrecke mit der Geschwindigkeit durch.
Was klar zeigt, dass dieses Konzept, viel viel viel pro Thread Power bei wenig Verbrauch und ohne sehr Breite CPUs klar aufgeht/aufgegangen ist.
Eben, weil ja auch viel Software noch sehr von der Singlethreadperformance abhängt. Das wird sich auch so bald nicht ändern und wie gesagt kann man manche Dinge einfach nicht parallel realisieren, bei denn wird sich das nie ändern. Einen MD5 Hash kann man z.B. nicht parallel berechnen, wenn man den MD5 z.B. einer großen Datei ermitteln will, hängt man da voll an der Singlethreadperformance, nur wenn man mit Burte-Force einen Hash knacken will, dann kann man das parallelisiert ausführen und umso mehr Kombinationen parallel probieren, je mehr Kerne man hat.

Witzig ist dabei die Wandlung der Geschichte. AMD hat mit den Athlons, Athlon XPs und Athlon 64 Modellen genau diesen Part doch selbst gepusht. Nicht mehr "nur" auf Taktrate, sondern auf Leistung pro Takt gehen.
Es war allerdings seltsam, warum AMD diese erfolgreichen Pfad verlassen hat, den Fehler muss sich AMD klar alleine Ankreiden lassen. Das ist im Grunde die Antwort auf die Frage dieses Threads.

- - - Updated - - -

aber wenn man sich die letzten Ereignisse anschaut, und auch die Ideen die AMD in CPUs/GPUs (Mantle, HMB ... und schlag mich tot) hatte, immer nach hinten für die Firma losging. Da kann man eigentlich auch nicht mehr von einer Pechsträhne reden.
Weil es zu spät und zu halbherzig gemacht wurde, die ganze Idee hinter den APUs war es eben auch kleine parallelisierbare Aufgaben an die GPU abgeben zu können, wenn diese komplett in die CPU integriert ist, weil eben sonst die Zeit für die Übertragung der Daten jeglichen Vorteil auffrisst, nur ab welcher Generation der APUs war das denn überhaupt erst möglich? Eben, weder bei der ersten noch bei der zweiten und als es endliche Entwicklungstools in die Richtung gab, war der Marktanteil schon so gering, dass die Breite der SW Entwickler dies nicht mehr interessiert hat und andere Konzepte wie Cuda waren früher dran und auch viel weiter verbreitet. Außerdem waren die CPU Kerne der APUs sowieso so schwach, dass man so etwas dann gar nicht als Basis für die Entwicklung von SW mit hohen Leistungsanforderungen genommen hätte. Nun kommt Zen erstmal wieder als CPU, es ist ein Hüh und Hott, es fehlen eine klare Richtung und die Beständigkeit.

Kein professioneller SW Entwickler wird Zeit und damit Geld investieren um auf eine Technik zu setzen vor der er morgen nicht weiß ob sie nicht gleich wieder eingestampft wird. Das sollte auch AMD bekannt sein und das haben sie trotzdem gemacht, wohl nicht zuletzt aus Geldnot.
 
Das ist mir durchaus bewusst. Ich wollte eher darauf hinweisen, dass der Quervergleich zum HPC Markt recht wenig mit dem im privaten Endkundenmarkt gemein hat...
AMD fehlen aber die Kunden aus dem HPC Markt, weil die relativ viel Geld eingebracht haben. Darüber wurde die Entwicklung der AM3+ (und Vorgänger) bezahlt, für den Desktop hat man nur höher getaktete Modelle mit höherer TDP verwendet. Jetzt sind sie raus aus diesem Marktsegment und nehmen das Geld eben nicht mehr ein. Insofern ist es auch für den Desktopkunden von Bedeutung, wenn die Opterons nicht mehr HPC tauglich sind.
 
AMD hätte wissen müssen, das der Ansatz mit eher mäßiger IPC und und hohem Takt nichts bringt.
Das ist ja auch nicht Bulldozers Ansatz. Ist als Erklärung also Quatsch.

Hochtaktarchitekturen wie Builldozer oder Pentium 4 haben schlechte IPCs
Zum x-ten mal, Bulldozer ist KEINE (!!!) Hochtaktarchitektur. Wie oft denn noch? Netburst war eine Hochtaktarchitektur. Bulldozer ist eine Durchsatzarchitektur. Bulldozer hat heutzutage mehr IPC als K10 (inklusive Husky) je hatte. Dass der ursprüngliche Bulldozer weniger IPC hatte, lag nicht am Design, sondern an Designfehlern. Ursprünglich war Bulldozer mit gleichwertiger IPC wie K10 geplant.


Was hat denn eigentlich AMD mit Bulldozer verkehrt gemacht, damit es soweit mit AMD kam, dass sie kurz vor dem Ende stehen ?
AMD steht heute genauso wenig wie vor dem Bulldozer Launch "kurz vor dem Ende".

Auf den Punkt gebracht, AMD wollte ein Serverdesign auch im Clientmarkt verkaufen. Und das funktioniert so nun mal nicht. Zum einen weil Clientanwendungen weniger parallelisiert sind als Serveranwendungen, zum anderen weil Clientanwendungen mehr von Legacy Code abhängig sind als von neueren ISA-Erweiterungen. Dazu kamen Verzögerungen aufgrund der Fertigung, ursprünglich sollte Bulldozer gegen Nehalem debütieren und nicht erst gegen Sandy Bridge, und diverse Kinderkrankheiten, die erst mit Steamroller weitestgehend behoben wurden. Stell dir also einen 4-Modul Steamroller als Nehalem Gegenspieler vor und alles wäre eigentlich paletti gewesen. Da hätte man auch eine solide Basis für Weiterentwicklungen gehabt. So ist man nach Piledriver zurück ans Reissbrett, hat Zen entwickelt, der wieder mehr auf Clientbedürfnisse ausgelegt ist, und hat das bisherige Bulldozer Design nur noch für APUs moderat weitergepflegt. Aktuelle Server- und Desktop-CPUs sind quasi immer noch auf dem Stand von 2012. Dass man damit heute nix mehr reisst, sollte klar sein.
 
Das ist auch der Fall. Bulldozer ist ein Multithreadingmonster, nur leider gibts einfach nicht genug Software die das wirklich vollständig nutzen kann.
Selbst heute, 4 Jahre nach dem Launch ist er immernoch seiner Zeit voraus.

Bulldozer ist seit 2011 auf dem Markt, also 5 Jahre.

Und er sollte eig früher kommen.

Und gehyped wurde er auch nicht. AMD wollte ihn eig erst in 45nm paar Jahre früher bringen, aber wurde verschoben.

Sogesehen war Bulldozer dann auch keine CPU mit schlechter IPC, denn die IPC war auf Athlon 64 Niveau.

Und jeder weiß das ein damalige Athlon 64 bei 1,8ghz schon als 3000+ bezeichnet wurde, und Bulldozer schafte halt nicht nur 1,8ghz sondern mal eben 3,8ghz oder 4,8ghz etc.

Also IPC war eig zeitlich gut, nur durch die Verzögerung wirkt es wie ein IPC Rückschritt weil AMD als Zeitgewinnung die aufgebohrten K8 aka K10 namens Phenom raus gebracht haben.

Das waren 2 Entwicklungen parallel die nur wegen der Bulldozer Verzögerung zu Stande kam.

Man kann also abschließend sagen, Bulldozer kam 5 Jahre zu früh, und wäre er Rechtzeitig gekommen, wäre er halt 6 oder 7 Jahre zu Früh gekommen.

Wir verdanken ihm aber einen Massiven Push in der Software. MultiCore Support von mehr als 4 Kernen durch Video Games hätten wir ohne Bulldozer nicht so schnell gehabt, genau wie Mantle, Vulcan, DX12 etc.

Also, danke AMD. Historisch war Bulldozer wirklich Nützlich.
 
Zuletzt bearbeitet:
Wir verdanken ihm aber einen Massiven Push in der Software. MultiCore Support von mehr als 4 Kernen durch Video Games hätten wir ohne Bulldozer nicht so schnell gehabt, genau wie Mantle, Vulcan, DX12 etc.

Also, danke AMD. Historisch war Bulldozer wirklich Nützlich.
Naaaja, Intels Hyperthreading hat sicher auch seinen Teil beigetragen.
Genau werden wirs wohl nie erfahren - wobei man ja nur ganz bedingt überhaupt daon sprechen kann, dass Multicore richtig gut durch Games unterstützt wird. Die meisten Games lungern immernoch bei 4 Kernen rum.
 
Zum x-ten mal, Bulldozer ist KEINE (!!!) Hochtaktarchitektur. Wie oft denn noch? Netburst war eine Hochtaktarchitektur. Bulldozer ist eine Durchsatzarchitektur. Bulldozer hat heutzutage mehr IPC als K10 (inklusive Husky) je hatte. Dass der ursprüngliche Bulldozer weniger IPC hatte, lag nicht am Design, sondern an Designfehlern. Ursprünglich war Bulldozer mit gleichwertiger IPC wie K10 geplant.

K10 3Ghz, Bulldozer 4Ghz
 
Theoretisch sagt der tatsächlich erreichte Takt tatsächlich nichts darüber aus, um was für eine Architektur es sich handelt.
Denke Bulldoyer wrde ach nachträglich gepuscht, denn er arbeitet mit 4ghz bei weitem nicht am Effizienzoptimum.
 
Ein Hochtaktdesign zeichnet sich durch eine sehr lange Pipeline aus, das hat Intel mit Netburst auch eindrucksvoll gezeigt.
 
bulldozer kam vor allem zu spät.
eigentlich sollte der gegen nehalem antreten. der war aber schon längst abgelöst, als bulldozer endlich da war.
ursprünglich war ein release für anfang 2009 geplant. dann 2010, dann anfang 2011, und schlussendlich wurde es ende 2011, also breite verfügbarkeit praktisch erst 2012.
 
130nm 2ghz ghz
90nm 2,6ghz
65nm 3,2ghz
45nm 3,8 ghz

Das lag also nicht am Design, sondern an der fertigung.

130nm war bis 2,25 GHz --> Athlon XP 2800+ Thoroughbred-B
90nm bis 3200 MHz --> A64 X2 6400+
45nm bis 3700 MHz --> Phenom II X4 980
65nm bis 3100 MHz --> A64 X2 6000+ Brisbane
 
Zuletzt bearbeitet:
130nm war bis 2,25 GHz --> Athlon XP 2800+ Thoroughbred-B
90nm bis 3200 MHz --> A64 X2 6400+

hab nicht nachgeguckt sondern nur grob vermitteln wollen was ich meine. denke ich wurde verstanden.
 
ach jetzt ist die grottige Fertigung die Schuld am schlechten Abschneiden von AMD ist auf einmal eine gute :lol:

Das war nicht der Tenor.

Ich habe das geschrieben um klar zu machen das Bulldozer kein Hochtakt Design war.

Nicht umsonnst gingen die Sandy,s auch auf so hohe Taktraten.
Somit ist dein Argument widerlegt.
 
Prinzipiell war der Ansatz gut nur die Umsetzung schlecht. Wenn sich Cores innerhalb eines Moduls Einheiten teilen um Fläche zu sparen ist das schon klasse. Bei singlethread hätte jedoch ein Kern auf mehr Ressourcen (gesamte Modul) zurück greifen können um auch mehr singlethread zur Verfügung zustellen. Das war leider nicht der Fall und die IPC war sogar geringer als beim Phenom II.
 
Finde schon, wenn am sich rühmt, den ersten kommerziellen Prozessor mit 5 GHz anzubieten, das man das Hochtakt Design nennen kann. Alternativ ist der FX Centurion sonst eine Mischung aus starker Selektion der besten Chips und aufgrund des anfänglichen Preises von etwa 750,-€ auch etwas Geldgier.
 
Nur das es deswegen immer noch kein hochtaktdesign ist! Oder ist Haswell auch ein hochtaktdesign, den kann man auch bei 5GHz betreiben, wenns die Zahnpasta unterm heatspreaser herhibt, ...

Lest euch doch wenigstens mal in das Thema Pipelineing ein, bevor ihr falsche Aussagen trefft.
 
Finde schon, wenn am sich rühmt, den ersten kommerziellen Prozessor mit 5 GHz anzubieten, das man das Hochtakt Design nennen kann. Alternativ ist der FX Centurion sonst eine Mischung aus starker Selektion der besten Chips und aufgrund des anfänglichen Preises von etwa 750,-€ auch etwas Geldgier.

Das war doch erst 3 Jahre nach Bulldozer Release und garnicht geplant und nur eine Verzweiflungsmaßnahme wegen den Finanziellen Problemen und den fehlenden nachfolgern MK3 und MK4 für AM3+ weil das Bulldozer konzept eingestampft wurde.

Von daher waren diese 5 ghz Prozessoren doch garnicht geplant. Abgesehen davon war das nur im Turbo Modus wo dann die anderen Cores runtergetaktet wurden.
Sowas hätte Intel auch machen können wenn sie wollten. Spricht also keineswegs für eine geplante absicht.

und wie schon jemand schrieb, wenn intel wollte, hätten sie das auch mit haswell machen können.
einfach verlöteten heatspreader wie bei amd, und turbo für 1 kern auf 5 ghz und fertig ist das gleiche. dafür muss man nicht 7 jahre etwas planen.

und bedenke auch bitte, das der Stärkste Bulldozer bei Release noch einen Base Takt von 3,6 ghz hatte.
 
Was hat AMD mit Bulldozer falsch gemacht?
Annähernd sechs Jahre viele potentielle Käufer verschrecken (wollen), ist der Fehler.

Extrem gehyped, Erwartungen geschürt und dann etwas abgeliefert, das in allen gängigen Bereichen langsamer als die Phenom II X4/X6 war.
Klar gab es optimierte Anwendungen die vom neuen Design profitierten, aber die Zeit war (und ist) nicht reif.
Klar ist es eine gute Idee Ressourcen zu teilen, aber dann das Blaue vom Himmel zu merchandisen und in vielen Bereichen zu patzen? Geht nicht.

Ich hatte mir einen Sprung in der Leistung erhofft und ebenso viele meiner Freunde. Doch es passierte nichts, was haben wir lange Gesichert gemacht als die neuen CPUs noch wärmer wurden, keine Neuauflage oder Verbesserung der X6 kam...
Dann die Ansage das AMD sich aus dem Hochleistungssegment zurückziehen wird...
Wir sind ausnahmslos alle sind zu intel abgewandert und haben seit 2011 keine AMD Prozessoren mehr gekauft. Eher sogar noch früher, denn eine Neuanschaffung 2010 lohnte ja nicht, da Bulldozer so gut sein sollte.

Hätte AMD ein glücklicheres Händchen gehabt und die bisherigen Knüller weiter gepflegt... wer weiß was passiert wäre.
 
Zuletzt bearbeitet:
Zum x-ten mal, Bulldozer ist KEINE (!!!) Hochtaktarchitektur. Wie oft denn noch? Netburst war eine Hochtaktarchitektur. Bulldozer ist eine Durchsatzarchitektur. Bulldozer hat heutzutage mehr IPC als K10 (inklusive Husky) je hatte. Dass der ursprüngliche Bulldozer weniger IPC hatte, lag nicht am Design, sondern an Designfehlern. Ursprünglich war Bulldozer mit gleichwertiger IPC wie K10 geplant.
Naja weiß ja nicht jeder dass 5 GHz nicht wriklich viel sind im CPU Bereich, die meisten kennen nur AMD und Intel.
Das IBM schon länger über 5GHz fährt ist vielen einfach nicht bekannt, da kannst noch soviel erklären solang die Leute kein Basis Wissen besitzen. ;)

Extrem gehyped, Erwartungen geschürt und dann etwas abgeliefert, das in allen gängigen Bereichen langsamer als die Phenom II X4/X6 war.
Klar gab es optimierte Anwendungen die vom neuen Design profitierten, aber die Zeit war (und ist) nicht reif.
Klar ist es eine gute Idee Ressourcen zu teilen, aber dann das gelbe vom Himmel zu merchandisen und in vielen Bereichen zu patzen? Geht nicht.
Dann habt ihr was falsch gemacht, mein erster FX-8150 war schneller als der X6 wurde aber etwas wärmer mit mehr Takt.
Der FX-8350 ist ein Sahenschnittchen, 4x 5GHz Turbo unter 50°C ist eine Hausnummer und vor allem schneller als der X6. :d
 
Bulldozer war gegenüber dem Phenom II (X6) was die IPC angeht ein klarer Rückschritt.
Klar kann man das mit mehr Takt ausgleichen, sinnvoller wäre es aber gewesen mehr Takt und gleiche IPc zu haben

Wenn man dem X6 richtig Feuer gibt ist dein FX wahrscheinlich garnicht mal mehr so weit weg. Selbst bei 5ghz nicht...
 
...ausserdem wurde die Frage im Prinzip schon beantwortet und hätte mit ein wenig Eigenleistung selber beantwortet werden können.
 
Zuletzt bearbeitet:
Ein Hochtaktdesign zeichnet sich durch eine sehr lange Pipeline aus, das hat Intel mit Netburst auch eindrucksvoll gezeigt.
Nur hat Bulldozer keine sehr lange Pipeline. Bulldozers Integer-Pipeline unterscheidet sich längenmässig nicht so sehr von Nehalem / SB. Netburst lag da in der Spitze mit über 30 Stufen in ganz anderen Regionen. Hinzu kamen dort die double pumped ALUs. Der geplante Nachfolger, Tejas, sollte gar über 40 Stufen besitzen.


Finde schon, wenn am sich rühmt, den ersten kommerziellen Prozessor mit 5 GHz anzubieten, das man das Hochtakt Design nennen kann.
Bulldozer wurde aber nicht mit 5 GHz gelaunched, sondern wie bereits erwähnt mit 3,6 GHz Basistakt. Die FX-9xxx Modelle sind einfach nur OC-Versionen, jenseits der üblichen TDPs, und daher als Bewertungsgrundlage für die Architektur ungeeignet. Wenn Intel das wollte könnten sie genauso Modelle mit bis zu 5 GHz bei einer TDP von >200W anbieten.


Extrem gehyped, Erwartungen geschürt und dann etwas abgeliefert, das in allen gängigen Bereichen langsamer als die Phenom II X4/X6 war.
Nö, war er nicht. Wenn man eine schlechte Meinung von Bulldozer hat, bitteschön. Ist jedem selbst überlassen. Deshalb sollte man aber keine Märchen erfinden und bei der Wahrheit bleiben. Bulldozer konnte je nach Szenario auch mal hinter dem K10 liegen. Das ist richtig und ging dem K10 bei dessen Launch im Vergleich zum K8 übrigens genauso. Trotzdem war Bulldozer schon beim Launch im Schnitt schneller als jeder K10. Im Computerbase Gesamtrating lag er seinerzeit knapp 10% vor dem schnellsten X6. In Extremszenarien und mit Nutzung von AVX/FMA konnte Bulldozer bis zu doppelt so performant wie der X6 sein.


ach jetzt ist die grottige Fertigung die Schuld am schlechten Abschneiden von AMD
Niemand hat die alleinige Schuld der Fertigung zugeschrieben. Fakt ist aber, dass die 32 nm SOI Fertigung von Glofo alles andere als optimal war und eine gehörige Teilschuld trägt. Das konnte ich selbst anhand von K10.5 und Husky testen, also völlig unabhängig von Bulldozer. Bis auf die Flächeneinsparung gibt's da kaum nennenswerte Verbesserungen. Und signifikante Verbesserungen bezüglich Leckströmen wären dringend notwendig gewesen, um ein Bulldozer Modul auslasten zu können, welches fast doppelt so viel Transistorlogik besitzt wie ein K10.5 Kern. Gerade bei Taktraten von >3 GHz.

K10 3Ghz, Bulldozer 4Ghz
Deshalb ist Bulldozer trotzdem keine Hochtaktarchitektur. Nur weil ein VW Golf schneller ist als ein Fiat Punto wird aus dem Golf noch lange kein F1 Bolide. Um mal die üblichen Autovergleiche etwas zu strapazieren. Bulldozer wurde mit 3,6 GHz Basistakt gelaunched, nicht mit 4 GHz. Damals gab es dann auch schon K10 Modelle mit bis zu 3,7 GHz Basistakt (Phenom II X4 980).


Ich habe das hier schon öfters erklärt. K10 war seit jeher sehr stark taktlimitiert aufgrund seiner recht kurzen Pipeline. Zusammen mit Speedpath Problemen hatte das seinerzeit bei Barcelona richtig zu Problemen geführt. Dieser kam zu Beginn nicht über 2 GHz hinaus, Phenom I stagnierte dann sehr schnell bei 2,6 GHz. Mit K10.5 und einer kompletten Überarbeitung des Designs konnte man die Speedpath Probleme zwar beseitigen, an der generellen Taktlimitierung der K10 Pipeline änderte das aber nichts. Mit Bulldozer wollte man genau diese Problematik angehen und die Pipeline auf ein besseres Taktverhalten trimmen. Das heisst aber nicht, dass man alles dem Takt untergeordnet hat, so wie das bei einem Hochtaktdesign der Fall ist. Vielleicht hätte man die IPC im gleichen Verhältnis (+20-25%) verbessern sollen. Möglich wäre das gewesen. Nur muss man wissen, dass die Planung von Bulldozer zu einer Zeit stattfand, als der P4 noch in Intels Portfolio aktuell war. Welcher ja nun alles andere als ein IPC-Monster war. K10 IPC hätte also völlig ausgereicht. Selbst Core und der spätere Core2 hätte AMD diesbezüglich nicht beunruhigen müssen. Fatal war, dass Intel mit Nehalem und SB dann recht starke Fortschritte machte, die sie zusammengerechnet in gefühlt 10 Jahren davor gerade mal so hinbekommen haben. Damit hatten die AMD Planer vermutlich nicht kalkuliert.

Noch was, AMD hätte bei der CMT Implementierung komplett auf VMT verzichten und ausschliesslich auf ST + HMT Ressourcen setzen sollen. Das war mMn auch ein Fehler. CMT ansich war schon ein interessanter und richtig guter Ansatz. Vielleicht sehen wir ja eine verbesserte und klassischere Variante in Zen wieder. Die Leaks zu den Ausführungseinheiten lassen jedenfalls Raum für Spekulationen. Auch wenn es jetzt offiziell SMT heisst. Was aber nichts bedeuten muss. Selbst ab Steamroller sprach AMD dann irgendwann von SMT statt CMT.
 
Zuletzt bearbeitet:
Bulldozer hatte einfach kein Markt um seine Stärken auszuspielen und AMD nicht die Kraft ein Wechsel auf Multicore Anwendungen voran zu treiben. Intel konnte den Leistungshunger bedienen ohne das Entwickler plötzlich auf Mehrkernprozessoren programmieren mussten. Erst jetzt nach 5 Jahren wo auch Intel keine sonderlich hohen Leistungszuwächse mehr erzielt kommt dieses Segment in Fahrt.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh