[Sammelthread] AMD Bulldozer - Next Generation new CPU Architecture - Sammelthread

Status
Für weitere Antworten geschlossen.
Zudem scheinen die L2 Bereiche auf dem Orochi Die Shot gefaked.

Wurde ja mittlerweile schon bestätigt, dass da einiges nachbearbeitet wurde, und verschiedene Größen identischer Cachebereiche auf dem Die machen ja auch keinen Sinn. Darum sollte man vielleicht besser eher den Mittelwert der 335, 375 und 450mm² nehmen, als so optimistisch wie ich einfach den kleinsten Wert - 335mm² - anzunehmen. Allerdings kann ich mir fast 400mm² kaum wirtschaftlich vorstellen, außer man könnte damit im absoluten High-End konkurrieren. :confused: Nun, aber die Leistung müssen wir natürlich noch abwarten. :)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Irrelevant. Es gibt keine gesicherten Informationen, wie viel Fläche pro L2 gebraucht wird. Anhand von Llano lässt sich da überhaupt nichts schlussfolgern. Zudem scheinen die L2 Bereiche auf dem Orochi Die Shot gefaked. Die oberen sind zB deutlich kleiner. 335 mm² ist jedenfalls unrealistisch. Es sollte eher Richtung 300 mm² bzw darunter gehen.
Btw, du musst das nicht permanent wiederholen (zum 9. mal jetzt?). Wir haben deinen Unfug schon beim ersten mal verstanden. :rolleyes:
 
Nun, der Die-Shot sagt 335-450mm² zusammen mit den bekannten Größen der Caches. Wir können natürlich auch blind tippen, 250mm² oder 500mm², doch die beste Quelle, ein bearbeiteter Die-Shot, sagt bestenfalls 335mm², im Schnitt etwa 385mm². :)
 
Laut Hans de Vries benötigen bei Llano 2 MiB L2 12,62 mm². Wenn man davon ausgeht, dass Bulldozer 2 MiB L2 pro Modul besitzt, was bisher offiziell nicht bestätigt wurde, und man diese Grösse auf den Bulldozer Die überträgt, würde man auf eine Gesamtgrösse für Orochi von ~350 mm² kommen. Das wäre grösser als der aktuelle Thuban.

Kerne: 6 -> 8 = +33%
L2: 3 MiB -> 8 MiB = +167%
L3: 6 MiB -> 8 MiB = +33%

Dabei lasse ich mal aussen vor, dass ein Bulldozer Modul (2 Kerne) sicherlich sogar kleiner ist als zwei K10.5 Kerne bei gleicher Strukturgrösse. Die Kerngrösse sollte also weniger als 33% wachsen, falls sie überhaupt wächst.

Im Folgenden die Anteilswerte beim Bulldozer Die (alles grob vermessen und gerundet anhand des Die Shots):

1x Modul: ~6,3% (4x: ~25,2%)
1x L2: ~3,6% (4x: ~14,5%)
1x L3 Tile: ~3,2% (4x: ~12,6%)

Das ganze nun zusammengerechnet.

~25,2% (Kerne) des Die wachsen um 33% = ~8,4% Wachstum für das gesamte Die
~14,5% (L2) des Die wachsen um 167% = ~24,1% Wachstum für das gesamte Die
~12,6% (L3) des Die wachsen um 33% = ~4,2% Wachstum für das gesamte Die

Für Uncore nehmen wir mal keine relevanten Grössenveränderungen an. Unterm Strich haben wir für Orochi also ein Wachstum von ~36,7% gegenüber Thuban bei gleicher Strukturgrösse. Wenn Orochi gegenüber Thuban wachsen soll, muss also die kleinere Struktur von 32 nm weniger bringen als diese ~36,7%. Das ist natürlich ziemlich unwahrscheinlich. Der K10.5 Kern ist mit ~15,3 mm² bereits ~57,9% grösser als der Llano Kern (9,69 mm²). Wenn die Strukturen bei Bulldozer in gleichem Verhältnis wie bei Llano verkleinert werden, müsste der Orochi Die ~300 mm² gross sein (346 * 1,367 * 9,69 / 15,3). Und wie schon oben erwähnt, aufgrund der Kompaktheit der Module sollte es eher Richtung <300 mm² gehen. ~250 mm² erscheinen mir absolut machbar, also vergleichbar mit Shanghai. Aber das hängt hauptsächlich davon ab, wie kompakt der Cache im Endeffekt ausfällt. Mit bisher spekulierten 16 MiB insgesamt (L2+L3) wäre das immerhin doppelt so viel wie bei Shanghai. Hans de Vries hatte ja schon vor geraumer Zeit die SRAM Grössen mal bekanntgegeben.

Code:
--------------    Intel 45nm   Intel 32nm    AMD 45nm      IBM/AMD/FS 32nm

SRAM cell size    0.346 um2    0.171 um2     0.37 um2      0.149 um2
NMOS drive cur.   1.36 mA/um   1.55 mA/um    1.21 mA/um    1.55 mA/um
PMOS drive cur.   1.07 mA/um   1.21 mA/um    0.78 mA/um    1.22 mA/um

Eine Verbesserung der Grösse bei 32 nm von fast Faktor 2,5 gegenüber 45 nm.

Behauptungen, das Orochi Die wäre riessig, nur um AMD wieder möglichst schlecht hinzustellen, sind reine Erfindung, weder plausibel, noch recht wahrscheinlich.

Hier noch ein Vergleich zum L2 Cache. Links Llano, rechts Orochi:



Man sieht, dass die Struktur ganz anders ist. Entweder hier wurde ordentlich gefaked, was auch die Dimensionen einschliesst, oder es gibt grundlegende Unterschiede. Deshalb lässt sich nur anhand des Llano L2 Caches nichts Sinnvolles ableiten.
 
Zuletzt bearbeitet:
Interessante Rechnung. Natürlich wird es auch darauf ankommen, dass die Produktion der Prozessoren für die Firma so günstig wie möglich wird, dabei aber die möglichst beste Leistung erreicht.
Man kann ja nur hoffen, dass es AMD gelingt. Obwohl AMD 80% kleiner ist als Intel und entsprechend auch weniger Geld hat, sieht der Bulldozer laut den Informationen und Spekulationen die da sind, gut aus.
Leider müssen wir noch warten und diese Zeit ist doch für uns Hardwaresüchtige eine schlimme Zeit.
 
Schöne Rechnung mr.dude. Wäre schon ne gute Leistung von AMD wenn das eintreffen würde. Und das ist schon echt unglaublich, wenn man sich ansieht wie groß Intel im Vergleich zu AMD ist.
 
Schöne Rechnung mr.dude. Wäre schon ne gute Leistung von AMD wenn das eintreffen würde. Und das ist schon echt unglaublich, wenn man sich ansieht wie groß Intel im Vergleich zu AMD ist.

Intel ist zwar größer aber das AMD macht vieleicht ihre arbeit besser wer weiß... Man nehme nur mal als beispiel den guten alten AMD64 vs Pentium 4 da hat Intels größe und geld auch nix gebracht!
 
Der Verdacht, dass die neuen Strukturen der neuen Generation (BD) erheblich kleiner sein dürften, erhärtet sich ja wenn man sich Bobcat anschaut. Ein Bobcat-Kern dürfte erheblich mehr leisten als ein "Atom-Kern" und ist wenn man das Grössenverhältnis 40nm zu 45nm abrechnet trotz OoO nicht grade unwesentlich kleiner geraten als der Atom. Das betrifft i.Ü. ebenso den Cache.
 
Der Verdacht, dass die neuen Strukturen der neuen Generation (BD) erheblich kleiner sein dürften, erhärtet sich ja wenn man sich Bobcat anschaut. Ein Bobcat-Kern dürfte erheblich mehr leisten als ein "Atom-Kern" und ist wenn man das Grössenverhältnis 40nm zu 45nm abrechnet trotz OoO nicht grade unwesentlich kleiner geraten als der Atom. Das betrifft i.Ü. ebenso den Cache.

Wie meinst du das jetzt genau? Ist etwas verwirrend. Ist er nicht (unwesentlich) kleiner oder, nich unwesentlich, kleiner?
Weiss man, ob es ein Modul BD's geben wird?
 
Weiss man, ob es ein Modul BD's geben wird?
nein wird es nicht, Bulldozer ist für den High End/Enthusiast Markt gedacht, wozu soll man extra Masken für 1 Modul erstellen wenn Llano schon Mainstream ist ;)

kurz gesagt

Llano = Mainstream bis 150 €
Bulldozer = High End/Enthusiast 200-500 €
Ontario = Low/Mainstream unter 100 € für OEM
 
Zuletzt bearbeitet:
Ich stelle mir den 1Modul BD (oder wie er dann heissen soll) als eine Art Konkurent zum Atom mit HT. Der Athlon II Neo ist ja ganz nett aber halt nicht wirklich auf dem stand der Dinge was TDP betrifft. Ein Modul mit niedriger Taktung währe doch da ganz gut einzusetzen?
 
der bulldozer ist zunächst mal für hohe frequenzen entwickelt, ihn runterzutaktet ist schon mal quatsch.

den einmodulbulldozer wird es zwar nicht in der erten generation geben aber vielleicht bei BD2, denn dieser wird ja, dann mitunter den llano erstezen.
 
Zuletzt bearbeitet:
Ich stelle mir den 1Modul BD (oder wie er dann heissen soll) als eine Art Konkurent zum Atom mit HT.
du verwechselst da was großes

Ontario ist der Atom konkurrent, Ontario ist jetzt schon viel viel schneller als Atom.

Bulldozer hat mit Ontario nichts zu tun, das sind 2 unabhängige Architekturen

Außerdem wird Intel den Atom shrinken, aber nur die TDP weiter verbessern können, die Leistung reicht nicht aus um mit Ontario mithalten zu können
 
Zuletzt bearbeitet:
Der Verdacht, dass die neuen Strukturen der neuen Generation (BD) erheblich kleiner sein dürften, erhärtet sich ja wenn man sich Bobcat anschaut. Ein Bobcat-Kern dürfte erheblich mehr leisten als ein "Atom-Kern" und ist wenn man das Grössenverhältnis 40nm zu 45nm abrechnet trotz OoO nicht grade unwesentlich kleiner geraten als der Atom. Das betrifft i.Ü. ebenso den Cache.
Das wundert mich auch etwas, dass der Bobcat Kern so klein soll soll. Laut Hans de Vries nicht mal die Hälfte eines Atom Kerns. Klar, Atom hat noch Hyperthreading. Dennoch, das wäre ziemlich beeindruckend, sollte ein Ontario Kern bei gleichem Takt und halber Fläche sogar schneller sein als ein Atom Kern mit zwei logischen Prozessoren. Vielleicht auch ein Hinweis auf die Kompaktheit der Bulldozer Module?


der bulldozer ist zunächst mal für hohe frequenzen entwickelt
Nicht wirklich. Woher hast du dieses Gerücht?
 
durch 2 ALU + 2 AGU soll das Deisgn angeblich bis 30% höher Taktbar sein, dazu kommt noch das BD keine Nachteile gegenüber K10 haben soll, es kann nur besser werden, ich hoffe das BD im Durchschnitt ohne AVX 75% schneller als Thuban wird, 2011 wird sehr spannend :)
 
Weil man womöglich mehr Taktspielraum hat, heisst das noch lange nicht, dass "Bulldozer zunächst mal für hohe Frequenzen entwickelt wurde".

Netburst wurde für hohe Taktraten entwickelt, mit einer tiefen Pipeline von 20 Stufen, die später auf über 30 Stufen erweitert wurde. Für Bulldozer stehen bisher lediglich 15 Stufen im Raum, K10 hat 12, Core 2 und Nehalem haben 14.

Ich hatte es schon mal gesagt, Bulldozer wurde für hohen Durchsatz und für hohe Effizienz entwickelt. Alles andere ist nur die Konsequenz dessen. Also bitte nicht so pauschalisieren. Bulldozer ist definitiv nicht Netburst.
 
Intel ist zwar größer aber das AMD macht vieleicht ihre arbeit besser wer weiß... Man nehme nur mal als beispiel den guten alten AMD64 vs Pentium 4 da hat Intels größe und geld auch nix gebracht!

Jetzt erzählst du mir was ganz neues:fresse:
 
Ich hatte es schon mal gesagt, Bulldozer wurde für hohen Durchsatz und für hohe Effizienz entwickelt. Alles andere ist nur die Konsequenz dessen. Also bitte nicht so pauschalisieren. Bulldozer ist definitiv nicht Netburst.


nur weil die pipline 15 stufen bekommt soll es kein hochfrequenzprozessor sein!? das kann keiner wissen, ausser den 50 beteiligten ingenieuren. 4 zylinder haben heutzutage auch bis zu 500PS dankt turbolader und kompressoren statt der anfänglichen 30.
hast du nen einblick in die BD architektur, das bezweifle ich doch sehr.

spekulationen sind dazu da um zu spekuliren.
 
nur weil die pipline 15 stufen bekommt soll es kein hochfrequenzprozessor sein!?
Korrekt.

hast du nen einblick in die BD architektur, das bezweifle ich doch sehr.
Das darfst du gerne bezweifeln. Ich habe zumindest so viel Einblick, um sagen zu können, dass es kein Hochfrequenzdesign ist.

Und ich stelle dir gerne nochmal die Frage. Vielleicht beantwortest du sie irgendwann auch mal und ignorierst sie nicht einfach. Woher stammt deine Behauptung?
 
frag mal Dresdenboy bei P3DNow, da gab es öfter spekus über hochfrequenzdesign bezgl. 2Alu+2AGu
 
@Duplex:
Ihr redet aneinander vorbei.
Der Unterschied ist nur der, dass mr.dude sagen will, dass die Designvorgabe nicht von Anfang an Hochfrequenz-Design war, sondern dass das Design von Anfang auf Effizient / Durchsatzvorgaben priorisiert war, das dann in der Folge zu einem Hochtaktdesign führten.

Kleiner Unterschied, mit dem Du sicher kein Problem haben dürftest, oder ?
 
Zuletzt bearbeitet:
Netburst war ein Hochfrequenz-Design aber BD hat das sicher nicht als Designaspekt gehabt...
 
Der Unterschied ist nur der, dass mr.dude sagen will, dass die Designvorgabe nicht von Anfang an Hochfrequenz-Design war, sondern dass das Design von Anfang auf Effizient / Durchsatzvorgaben priorisiert war, das dann in der Folge zu einem Hochtaktdesign führten.
Bulldozer war weder am Anfang ein Hochfrequenzdesign, noch ist er das jetzt. Ich würde echt gerne mal wissen, wo diese Behauptungen herkommen. Woran macht ihr das denn fest? Nur weil Bulldozer einen höheren Takt haben wird? Toll, was für eine Überraschung angesichts von 32 nm und einer etwas längeren Pipeline im Vergleich zum K10. :rolleyes: Deshalb wird trotzdem kein Hochfrequenzdesign daraus. Alle offiziellen Aussagen seitens AMD, wie zB die von JF, dass es keine extremen Taktraten geben wird und auch kein Double Pumping, sprechen klar gegen ein Hochfrequenzdesign. Wenn Bulldozer etwas ist, dann ein "Throughput-Design".
 
Bulldozer war weder am Anfang ein Hochfrequenzdesign, noch ist er das jetzt. Ich würde echt gerne mal wissen, wo diese Behauptungen herkommen. Woran macht ihr das denn fest? Nur weil Bulldozer einen höheren Takt haben wird? Toll, was für eine Überraschung angesichts von 32 nm und einer etwas längeren Pipeline im Vergleich zum K10. :rolleyes: Deshalb wird trotzdem kein Hochfrequenzdesign daraus

Kann man das soeinfach pauschalisieren? Also ich mein ob Hochfrequenzdesign oder nicht?
Denn wenn man sieht, der P4 ganz am Anfang hatte bei weiten keinen hohen Takt. Es wurde erst über die Jahre mehr Takt rausgeholt. Von Anfänglichen 1,3GHz (Willamette) bis 3,8GHz (bei den letzten S775er und Xeon Versionen)
Über einen Zeitraum von gut 5 Jahren.
Beim Core 2 startete man auch mit niedrig getakteten Modellen (unter 2GHz) und ist mittlerweile bei 3,4 bzw. 3,5GHz angekommen. Unterschied zum höchstgetakteten Netburst sogut wie nicht vorhanden (rein vom Takt)
Nehalem ist nicht anders, wobei man hier deutlich höher startete, zumindest im Desktop Bereich. Im S1366er Dual Bereich gibts von Anfang an Modelle mit ~2GHz.
Bei AMD siehts nicht anders aus, der K8 kam Anfangs mit unter 2GHz bis dann am Ende 3,2GHz.
Der K10 geht mittlerweile auch bis 3,4GHz.

Ich erkenne hier zwischen den Architekturen teilweise 10% Taktunterschiede im jeweils aktuellen Zustand.


Kann man also jetzt schon davon sprechen, das eine nicht am Markt ausgebreitete Architektur auf Hochfrequenzen getrimmt ist oder nicht?
In meinen Augen eher nicht... Das wird die Zeit zeigen ob man mit dem Takt hoch geht (gehen muss) und wie der Konkurent auftritt...


EDIT: für mich sieht das eher danach aus, das immer der, welcher zum Zeitpunkt die leistungsschwächere Architektur am Markt hat, gezwungen ist, die Takte extrem zu steigern, warscheinlich weit mehr, als man anfangs wohl geplant hat (meine Vermutung)
Sieht man sehr schon am Netburst P4. Am Ende musste Intel sehr hoch mit dem Takt, um gegen die A64 mitzuhalten. Dann kam Core2 und AMD musste hoch mit dem Takt. Bzw. muss es immernoch...
 
Zuletzt bearbeitet:
denni schrieb:
Netburst war ein Hochfrequenz-Design aber BD hat das sicher nicht als Designaspekt gehabt...

Was hat Neburst mit Bulldozer gemeinsam. Warum vergleichst du diese Architekturen?

Dauert bestimmt nicht mehr lange und wir werden von Spieluhr hören wie schlecht doch alles bei AMD ist.
 
Zuletzt bearbeitet:
Auch wenn es nur Bobcat ist, gibt es mal ein paar Benchmark Zahlen aus dem Boinc Benchmark (single Thread)

XtremeSystems Forums - View Single Post - AMD Ontario APU pictured,die size ~77mm^2

habs mal fix in ein Diagramm gepackt

bobcatxm1z.jpg


Für so einen kleinen Prozessor echt erstaunliche Leistung.
 
Zuletzt bearbeitet:
Das Ontario 90% der aktuellen K10 Leistung hat ist schon länger bekannt, ein Intel Atom hat selbst in 32nm keine chance gegen Ontario 40nm, AMD kann sehr viel Geld mit Ontario verdienen :d
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh