[Sammelthread] AMD Bulldozer - Next Generation new CPU Architecture - Sammelthread

Status
Für weitere Antworten geschlossen.
Das wurde doch nun schon alles mehrfach erklärt.

1 Bulldozer Modul / 1 Kern / 1 Thread = 100%
1 Bulldozer Modul / 2 Kerne / 2 Threads = 180%+

1 SMT Kern / 1 Thread = 100%
1 SMT Kern / 2 Threads = ~120%

Das ist mir schon klar - nur mich interessiert der absolute Leistungswert (wenn man ihn denn in eine Zahl fassen könnte, was natürlich nicht so einfach geht), auf den sich die Leistungssteigerung dann bezieht.

A *1,8 kann halt < als B * 1,2 sein, wenn B >> A.

Mag mir sonst noch jemand schreiben, dass es sich um Module handelt? Nur weil ich 4+4 Kerne geschrieben habe...

In dem verlinkten Artikel von Duplex wird es ja ganz gut erklärt: die Bezeichnung der Kerne im Modul (die keine Kerne sind) ist eine reine Marketingentscheidung, um den Prozessor besser verkaufen zu können.

"Apparently AMD is calling my clusters their cores, and my core their cluster. It has been suggested that this change of terminology is motivated by marketing, so that they can say they have twice as many cores."

Rein technisch gesehen (zumindest laut Wikipedia Definition für einen Kern) ist es ein 4-Kern Prozessor mit einem sehr überlegenem Hyperthreading, den das Marketing als 8 Kern Prozessor verkaufen wird.


Nein. Du gehst davon aus, dass ein K10 Kern so schnell wie ein Bulldozer Kern sein wird. Das ist aber unwahrscheinlich. Nehmen wir mal die 50% (mehr IPC, mehr Takt), dann ergibt sich folgende Rechnung:

X6: 6x 1 = 6
BD: 4x 1,8 x 1,5 = 10,8

Wenn das mit den +50% stimmt, wird der BD tatsächlich eine bessere Leistung abliefern als die dann aktuellen Intels, denke ich. Wobei ich zu der Zeit sogar schon mit Intel x6 Prozessoren rechne, die nicht mehr in dieser ExtremEuro Kategorie liegen, aber selbst die dürfte der BD dann schlagen.

Etwas misstrauisch bzgl. der 50% stimmt mich allerings der Beitrag auf den Duplex verlinkt hat:

"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that great a product, but is shipping just because AMD
needs a model refresh. "Sometimes you just gotta ship what you got." "
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Gekauft wird der schnellere, ich sehe das ähnlich wie Druss, alles andere ist bis jetzt Kaffesudleserei *g* In Summe kann niemand wissen was im Prinzip schneller sein wird, Sandy oder Bulldozer, Intel wird sicher auch nicht schlafen.
 
ich gehe davon aus das ein 2 Modul BD mit 4 Kernen den Intel Gulftown schlägt.
 
Das ist mir schon klar - nur mich interessiert der absolute Leistungswert (wenn man ihn denn in eine Zahl fassen könnte, was natürlich nicht so einfach geht), auf den sich die Leistungssteigerung dann bezieht.

A *1,8 kann halt < als B * 1,2 sein, wenn B >> A.
Absolute Leistungswerte kann sowieso noch niemand von uns sagen. Diese wirst du erst beim Launch sehen. Man kann aber zumindest festhalten, B >> A wird definitiv nicht eintreten.

Wenn das mit den +50% stimmt, ...
Nicht schon wieder zu viel hinein interpretieren. Die 50% waren lediglich ein Beispiel. Genauso wenig sind die 60-80% weiter oben bestätigt. Man kann wohl relativ sicher sein, dass Bulldozer pro Kern schneller ist als der aktuelle X4/X6. Wie viel es ist, wird man sehen.

Etwas misstrauisch bzgl. der 50% stimmt mich allerings der Beitrag auf den Duplex verlinkt hat:

"The only bad thing is that some guys I know at AMD say that Bulldozer is
not really all that great a product, but is shipping just because AMD
needs a model refresh. "Sometimes you just gotta ship what you got." "
Das hat nichts zu bedeuten. Es wird selbst beim besten Produkt immer Leute geben, die noch was besseres wollen. Und ob die Aussage den Tatsachen entspricht und ob "some guys" überhaupt irgendwas wissen, darf auch bezweifelt werden.


@Maeximum30
Wie kommst du darauf, dass "der schnellere" gekauft wird? Wenn es nur danach ginge, müsste der i7 980X ja >99% Marktanteil haben. Der hat aber eher 0,0001% Marktanteil.


ich gehe davon aus das ein 2 Modul BD mit 4 Kernen den Intel Gulftown schlägt.
Da bist du aber äusserst optimistisch. Ein 4 Modul Bulldozer ja, aber 2 Module eher nicht.
 
Zuletzt bearbeitet:
ich gehe davon aus das ein 2 Modul BD mit 4 Kernen den Intel Gulftown schlägt.

Ich würde sagen, dass ein Modul mit zwei Kernen locker für einen 8-Kern Sandy Bridge reicht.

:d

Zu köstlich hier...

Realistisch ist eher etwas anderes. Ich rechne für CMT mit durchschnittlich 70% Mehrleistung, 20% IPC-Plus und etwa 10% Mehrtakt. Ein 8-"Kern" Modell, also 4 Module, wäre damit etwa 50% schneller als ein aktueller Thuban. Ein gutes Ergebnis. :)

20% IPC-Steigerung halte ich für ziemlich optimistisch, ob CMT real auch wirklich immer so große Profite bringt muss man auch abwarten. Takt ist natürlich zunächst nur geraten, da gibt es noch keinerlei Anhaltspunkte.
 
Ich rechne mit 40-50% mehr IPC :)

nicht vergessen, Bulldozer ist auf sehr hohe Taktraten ausgelegt, deshalb ist auch der L1 klein
 
Zuletzt bearbeitet:
Sehr hohe Taktraten sprächen für sehr niedrige IPC, also ein "P4 Design" überspitzt formuliert. Was denn nun?
 
Das BD Design verstehst du nicht, das ist kein P4 2.0
 
Das mit der Optimierung auf sehr hohe Taktraten kam doch von dir. ;) Kann mich nicht entsinnen, dass bisher sonst irgendwo gelesen zu haben. Ich rechne mit einer weiterhin gemächlichen Takt- und IPC-Steigerung in üblichem Maß, aber wie gesagt: Dazu ist bisher wenig bekannt.

Kurz gesagt: Lange Pipeline -> hoher Takt -> niedrige IPC
oder aber kurze Pipeline -> niedriger Takt -> hohe IPC

mit allen möglichen Zwischenstufen. Beides zusammen wäre das Ei des Kolumbus. ;)
 
Zuletzt bearbeitet:
ich gehe davon aus das ein 2 Modul BD mit 4 Kernen den Intel Gulftown schlägt.


Dazu müsste ein virtueller BD Kern um ca. 100% schneller sein, als ein Phenom Kern. Naja, kann ja sein, bei einer komplett neuen Architektur.

Zu meiner Quick&Dirty Rechnung - es ist natürlich nur ein reines Zahlenspiel, um ein Gefühl für die Dimensionen zu bekommen :

Phenom II x2 7073 Cinebench Punkte
*1,1 um die Taktfrequenz auf Gulftown Niveau anzupassen: 7780 Punke
*1,8 um das überragende HT einzurechnen: 14005 Punkte

dagegen Gulftown: 28.384 Cinebench Punkte

=> ein einzelner virtueller Kern (der 4 Stück) des 2 Modul (Modul = echte Kerne) BDs muss um über 100% schneller sein als ein einzelner Phenom Kern, um den Gulftown zu schlagen.

=> ein 4 Modul BD sollte den Gulftown nach dieser Rechnung locker schlagen, weil ein einzelner virtueller Kern, seiner 8 virtuellen Kerne, dazu nur um ein paar Prozent schneller sein muss, als ein einzelner Phenom Kern. (Ausgehend vom Phenom II x4 läge der 4 Modul BD bei 26.100 + x%*26.100, was bereits ab 9% den Gulftown übertreffen würde).
 
Zuletzt bearbeitet:
naja, ich finde diese ganzen rechnungen sind schwachsinn.
aber die neue architektur sieht schonmal sehr vielversprechend aus, ich denke das diese architektur eine menge leisten kann/wird und seine vor und nachteile haben wird. (wie jede architektur) :-P
 
Ich finde die neue Architektur auch vielversprechend. Gerade das neue HT scheint ein echtes Schmankerl zu sein.

Allerdings würde ich meine Rechnungen nicht als Schwachsinn bezeichnen, sondern eher als erkenntnisstiftend. Würde mir ein AMD Mitarbeiter mitteilen, um wie viel schneller ein virtueller BD Kern gegenüber einem echten Phenom Kern ist, könnte ich heute schon die Cinebench Ergebnisse für den BD voraussagen. Ich finde das sehr spannend.

Irgendwas muss ich beim Warten auf das Athlon II C3 Stepping ja tun. Ich möchte endlich einen neuen PC - also @AMD: hopp-hopp, liefert die Teile endlich aus!
 
wahrscheinlich ja ;-)

amd hat ja mit am2 und am2+ für eine gute/lange kompatibilität gesorgt, wird beim am3 bestimmt nicht anders sein^^
 
Der Sprung wird sehr groß ausfallen

Geht das auch fundierter? Mal ein ganz anderer interessanter Ansatz:

Bild AMD-Server-Roadmap (5/19) - ComputerBase

Wenn man sich mal nur nach dem Anstieg des Pfeils richtet, wäre ein Interlagos (8 Module?) etwa 50% schneller als Magny-Cours. Das wäre genau das, was ich auf der letzten Seite für Thuban verglichen zu einem 4-Modul BD für den Desktop projeziert habt. ;)
 
ev sind es bereits C3.......wär ja möglich, daß es blos noch nirgends editiert wurde

aber C2 weiter produzieren wenn bereits C3 am markt ist wird sich AMD kaum antun......aber erst müssen die C2 lager geleert werden!
 
Zuletzt bearbeitet:
@Undertaker 1

Die Folie brauchst du hier nicht verlinken
Das sind Abschätzungen und bei Bulldozer wird absichtlich keine richtige Länge angegeben.

(JF-AMD) hat schon mehrmals gesagt, dass die Balken für Interlagos nicht taugen, die Folie stammt ursprünglich auch von ihm. Zu BD sagt er eine größeren Performancesprung als beim Magny Cours voraus.

Beim Magny-Cours hat man die Ankündigung übertroffen.

Bulldozer ist eine grundlegend neue Architektur, AMD wird kein Rückgang machen
 
Hmm? Für Magny-Cours spricht die Folie von ~100% Vorsprung zu Istanbul, maximal ~70% sind es von Topmodell zu Topmodell letztlich geworden (dem niedrigeren Takt geschuldet, klar). Klar ist so eine Marketingfolie, das sagt schon der Name, keine tolle Quelle, aber momentan fehlen die sonst so geliebten Balken ja noch völlig. ;)

Von Rückschritt kann man kaum sprechen, wenn wirklich ~50% Leistungssteigerung eintreten sollten - von der Konkurrenz erwarte ich einen weniger großen Sprung, auch weil dort der Fertigungssprung auf 32nm bereits eingepreist ist.
 
Zuletzt bearbeitet:
Hintergrund: Bulldozer
Unter dem Codenamen Bulldozer entwickelt AMD seit einigen Jahren den Nachfolger der K10-Architektur (Phenom, Phenom II). Da letztere "nur" eine Modifikation der K8-Architektur (Athlon 64, K8L oder K9 im Falle des Athlon 64 X2) mit mehr Kernen und L3-Cache war, deren Kernbereich wiederum große Ähnlichkeit zum K7 (Athlon, Athlon XP) aufweist, gilt Bulldozer als größter Schritt in AMDs-CPU-Entwicklung seit Beginn des Jahrtausends. Unter anderem werden je zwei CPU-Kerne zu einem "Modul" zusammengefasst, das sich Ansteuerungslogik, L2-Cache und FPU ("Floating Point", Gleitkomma)-Einheiten teilt. Details zu Implementierung und Rechenleistung sind weiterhin unbekannt. Als gesichert gilt lediglich, dass die Dekoder-Einheiten eins Moduls mindestens zwei Threads bearbeiten und so beide Kerne unabhängig voneinander mit Arbeit versorgen können. Die gemeinsame FPU-Einheit ist zudem zweigeteilt und kann in schnellem Wechsel komplett von einem Kern oder je zur Hälfte von beiden Kernen zeitgleich genutzt werden.

Die Fertigung der ersten Bulldozer-Desktop-CPU wird in 32nm SOI erfolgen und als Plattform kommen Sockel AM3 und voraussichtlich Chipsätze der 8xx-Serie zum Einsatz. Die Auslieferung wird aber erst im ersten Halbjahr 2011 erfolgen.

AMD 32 Nanometer: Technikdetails zu Bulldozer und Llano - AMD, 32nm, Llano, Bulldozer, fusion
 
Wie ich weiter vorne schon sagte, von Istanbul zu Magny-Cours sind es ~80%. Schaut euch zB das Review von TecChannel an. Und von Magny-Cours zu Interlagos ist nicht weniger zu erwarten. Ich würde gar von 100% ausgehen. 10-20% mehr IPC, 33% mehr Kerne, 25-30% mehr Takt. Das wäre alles keine Magie und absolut im machbaren Bereich.
 
Da rechnest du allerdings mit 100% Performancegewinn durch CMT. Das verspricht nichteinmal der Hersteller selbst.
 
Ich rechne mit einer ähnlichen Skalierung von zwei Kernen wie bei aktuellen CPUs. Und wie schon gesagt, 80% sind hier sehr konservativ gerechnet. Das bezieht sich vor allem auf die FPU, was bei praxisnahen Workloads nur wenig Auswirkungen hat. Abstriche wird es maximal bei AVX geben. Nur sind hier sogar mehr als 100% möglich, da theoretisch doppelt so viel Bandbreite zur verfügung steht. Um es eindeutiger zu formulieren, bei Auslastung eines Moduls sind 10-20% mehr IPC pro logischem Prozessor gegenüber zwei logischen K10 Prozessoren denkbar.
 
Das Frontend ist definitiv weniger "fett" als von zwei vollwertigen Phenom-Kernen:

http://info.nuje.de/Bulldozer_Core_uArch_0.4.png

Zudem rechne ich damit, dass eine Herstellerangabe eher optimistisch ausgelegt ist. 80% Versprechung wird praktisch wohl auf den best-case hinauslaufen, 60-70% eher im Schnitt. Dazu kommen natürlich noch weitere IPC Verbesserungen.
 
Schon klar, dass du wie üblich reinen Pessimismus bei AMD kolportierst. Nur wie üblich rechnest du falsch. Die Herstellerangaben von AMD waren bisher sehr konservativ. Magny-Cours 60%, real 80%. Genauso die Performance Folien zu Bulldozer. JF schreibt selbst 80%+. 80% sind also Untergrenze. Real dürften es eher 90-100% in den meisten Fällen werden. Und das Frontend "ist" genauso wenig weniger fett. Erstmal ist das lediglich eine Spekulation von Dresdenboy anhand der Patente und damit nicht offiziell. Und zweitens hat ein K10 Kern Decoder für 3x µCode und 3x FastPath. Kann pro Takt aber nur eines von beiden nutzen. 2 K10 Kerne können pro Takt also bis zu 6 Instruktionen dekodieren. Bulldozer hingegen würde laut Patent Decoder für 4x µCode und 4x FastPath besitzen und kann beides gleichzeitig nutzen, also bis zu 8 Instruktionen pro Takt. Ein Bulldozer Modul besitzt damit ein 33% "fetteres" Decoder Frontend als 2 K10 Kerne. Ähnliches wird auch auf Fetch und Dispatch zutreffen.
 
Zuletzt bearbeitet:
Zuletzt bearbeitet:
Wie kann man nur so stur irgendwelche Marketingfolien zerreden? :rolleyes: Wenn du dir diese mal genau anschaust, dann wirst du merken, dass hier keine durchschnittliche Performance angegeben wird. Und wie man weiss, basieren diese Prognosen bei AMD auf speccpu.

specfp_rate_2006

Opteron 2435 = 143
Opteron 6174 = 313

Die Prognose mit 100%+ war also völlig iO.

Und bringe endlich vernünftige Quellen. Anandtech kannst du dir sparen. Das sagt überhaupt nichts. Real sind es durchschnittlich 80%. In einzelnen Disziplinen können es wie man sieht auch >100% sein, in anderen <80%.
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh