AMDs Bulldozer bzw. was kommt nach dem K10

Status
Für weitere Antworten geschlossen.
Nun, clock domains haben wir bei GPUs schon seit G80 und bei CPUs ebenfalls bereits für den Uncore-Bereich, gut möglich das man dies noch weiter ausbaut. Ein adaptiv für die einzelnen Domains arbeitender Turbo ist da gut denkbar.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Momentan braucht man ~1/3 mehr Fläche für die gleiche Leistung (Instanbul zu Nehalem).
Das hatten wir an anderer Stelle schon mal diskutiert. Es gibt zu viele Unterschiede, um hier überhaupt Vergleiche anzustellen. AMD hat zB 4 Interconnects implementiert, Intel lediglich 2. Deshalb kann AMD auch 4P und 8P Systeme bestücken, was wiederum deutlich mehr Performance bedeutet, Intel lediglich 2P Systeme. Hinzu kommen unterschiedliche Packdichten und Grössen von Caches, unterschiedliche Fertigungsverfahren, die die Prioritäten der Die Grösse anders gestalten, usw. Das war aber alles nicht das Thema.
Wir sprachen von den Kernen. Und 6 Istanbul Kerne sind etwas kleiner als 4 Nehalem Kerne, exklusiv L2 Cache, und leisten nicht weniger. Das sind die Fakten.

Und jetzt bitte wieder zurück zum Thema. Hier geht es nicht um K10 und schon gar nicht um Nehalem. Wenn du schon Vergleiche anstellen willst, dann nur in Verbindung mit Bulldozer.


was könnte man sich denn da an taktveränderungen vorstellen, angenommen es könnten die einzelnen Funktionseinheiten wirklich unabhängig voneinander getaktet werden?
Genaue Taktgrössen wird dir sicherlich noch keiner nennen können, falls du das meinst. AMD scheint hier einen ähnlichen Weg zu gehen wie IBM, die in zukünftigen Power Prozessor ebenfalls eine solche Technologie nutzen wollen.
Was ich mich momentan frage, wie die Integer Pipelines überhaupt aufgebaut sind, 2-fach mit 2x ALU + 2x AGU oder 4-fach mit 4x ALU/AGU? Ersteres wäre für Multihtreading sehr effizient und trotzdem performant. Für Singlethreading ist 2-fach natürlich relativ schwachbrüstig. Hier könnte man sich aber wiederum vorstellen, dass dann eben die einzelnen Funktionseinheiten stark übertaktet werden, um eine hohe Performance zu erzielen. Der zweite Kern des Moduls liegt dann ja brach und würde somit einiges an Spielraum bezüglich TDP ermöglichen. Unklar ist allerdings auch noch, ab der zweite Kern auch bei Singlethreading Aufgaben übernehmen kann, zB Branch Prediction, siehe Dresdenboys erwähnten Patenten.
 
Wir sprachen von den Kernen. Und 6 Istanbul Kerne sind etwas kleiner als 4 Nehalem Kerne, exklusiv L2 Cache, und leisten nicht weniger. Das sind die Fakten.

Nein, da das gar keinen Sinn macht. Woher weißt du, wie ein Kern ohne L2 performen würde? Wenn eine Architektur gigantische L2 Caches braucht um schnell zu sein, muss dieses ebenso mit einbezogen werden, wie wenn dies nicht so ist. Nein, wir sprachen nicht von Kernen, sondern von der gesamten Diefläche, denn die muss bezahlt werden. Bei guten Yields kostet dich 1mm² Cache exakt genausoviel wie 1mm² Logik. Entscheidend ist das Endergebnis.

Und jetzt komm bitte endlich mal wieder zu Bulldozer zurück.
 
Hardware-Infos.com: AMDs Bulldozer-Architektur nimmt Formen an



was könnte man sich denn da an taktveränderungen vorstellen, angenommen es könnten die einzelnen Funktionseinheiten wirklich unabhängig voneinander getaktet werden?
Nachdem da nichts so komplexes wie ein ganzer kern übertaktet wird, kann man doch "OC-bottlenecks" umgehen
("Beispiel": FPU lässt sich von haus aus nicht gut takten, der integer-cluster ist aber viel taktfreudiger und kann single-threaded relativ zum standardtakt viel höher takten)

was haltet ihr davon? nachdem es soweit ich gesehen hab, auf keiner folie vom Financial Analyst Day erwähnt wurde, wie wahrscheinlich ist es dass es überhaupt (gut) funktioniert?

Hört sich ganz gut an :)
 
Boost Technology klingt gut und hoffentlich besser umgesetzt als bei Intel. Gut für ältere Engines die gar nichts von den Kernen haben.
 
Ganz so schlecht ist das bei Intel auch wieder nicht ;)
 
Das habe ich nicht gesagt. Auch bei Intel ist das praktisch für ältere Sachen. Ich meinte das wenn AMD einen Schritt weiter geht und nicht nur den Takt einzelner Cores anhebt, sondern auch einzelne Funktionseinheiten mit beeinflusst, dann könnte das eine bessere Umsetzung werden. Aber für mich ist das nur eine bessere Umsetzung, wenn dabei nicht gleich der Verbrauch um sagen wir 50 Watt nach oben geht. Das sollte im Rahmen bleiben. Das Feature an sich ist sehr gut.
 
Hier nochmal die von John Fruehe beantwortete Frage zum generellen Aufbau eines 8-Kern Bulldozer Prozessors.
I have been reading all of these threads and it is a little confusing as to what is actually a "core" in the Bulldozer. I just want to clarify the number of execution resources in the Bulldozer-based chips. If I read correctly, an 8-core Bulldozer die will contain the following:

1. Four FPUs
2. Eight integer units
3. Four L2 caches, each shared between one FPU and two integer units
4. One L3 cache
5. Two 64/72-bit UDDR3/RDDR3 memory controllers
6. Shows up as eight threads to the OS

Is that correct?
Correct. Not 100% sure on the L2 cache, I believe it is four but I have to check. The memory controllers need to match what is happening in C32 and G34, so in the case of an 8-core it would be 2 controllers, a 12 or 16 core would be 4 controllers.
 
Das dürfte dann ein Monster werden...
 
Das dürfte dann ein Monster werden...
Das ist "nur" der 8-Kerner. Dürfte aber trotzdem deutlich mehr als doppelt so schnell werden wie ein aktueller Phenom II X4 bei entsprechend vielen Threads und gleicher Taktrate. Das "Monster" wird eher Interlagos (16 Kerne).
 
Wie groß ist denn die Leistungssteigerung des 4 Kern / 8-Cluster Modells im FP Bereich im Vergleich zu einem 4-Kern K10.5 einzuschätzen? Gibt es da nennenswerte Verbesserungen (pro Takt)? Integer sollte ja Faktor 2 möglich sein, nur ist das ja nicht immer der Flaschenhals.
 
Das ist "nur" der 8-Kerner. Dürfte aber trotzdem deutlich mehr als doppelt so schnell werden wie ein aktueller Phenom II X4 bei entsprechend vielen Threads und gleicher Taktrate. Das "Monster" wird eher Interlagos (16 Kerne).

Der würde mir schon reichen :d
 
Dann würde es hier stehen ;)
 
Ich kann höchstens mein Blog empfehlen. Ab und zu finde ich neben Patenten auch noch Slides und Papers wie erst diese Woche. Wenn AMD nix rausrückt, muss man es sich eben holen :d

Gruß
Matthias
(Citavia / Dresdenboy)
 
Wie ja schon erwähnt, hatte Anandtech einigen Unsinn über Bulldozer geschrieben. Mittlerweile gibt es hier eine Korrektur.
 
Ich kann höchstens mein Blog empfehlen. Ab und zu finde ich neben Patenten auch noch Slides und Papers wie erst diese Woche. Wenn AMD nix rausrückt, muss man es sich eben holen :d

Gruß
Matthias
(Citavia / Dresdenboy)

Danke, ich hab das gleich mal gebookmarked :d

@mr.dude

Das war ja zu erwarten...
 
Zuletzt bearbeitet:
Eher unwahrscheinlich. Scheint so, als ob jemand den Unterschied zwischen Sample und Launch nicht so ganz verstanden hat.
 
Klasse wäre es schon, aber AMD hat wohl nicht die Ressourcen dafür schneller zu agieren.
 
Da die Fertigung ja doch etwas schneller zu sein scheint als geplant und es offenbar schon Llano-Samples gibt, wieso nicht? Dann könnte ich mit Llano durchaus schon im 2.HJ 2010 vorstellen. BD (Zambezi) wird aber definitiv nix vor 2011 ;).
 
Bulldozer 4/8 core cpu,s also für 2011

hoffentlich nicht erst ende 2011

endlich mal wieder eine Cpu von amd die einen Größeren Quantensprung macht.

nach dem K8 kahm nie wirklich eine Starke Steigerung.

vorallem was die ipc (nennt sich das so?) angeht.
 
Das wird davon abhängen was für Probleme auftauchen. Wenn alles Glatt geht, sollte es bald das Tapeout geben oder das hat es schon gegeben (nix darüber gehört bisher) und BD kommt Anfang 2011 als Rev.B auf den Markt. Eine größere Umarbeitung gibts immer bei solchen CPUs.
 
Zuletzt bearbeitet:
Das wird davon abhängen was für Probleme auftauchen. Wenn alles Glatt geht, sollte es bald das Tapeout geben oder das hat es schon gegeben (nix darüber gehört bisher) und BD kommt Anfang 2011 als Rev.B auf den Markt. Eine größere Umarbeitung gibts immer bei solchen CPUs.
Nix gehört ? Dann solltest Du mehr im P3D Thread mitlesen, tapeout wurde auf der Analystenkonferenz bekanntgegeben:
When pressed on the timing of tapeouts, one AMD spokesperson said that the fabs were 'running product now'. That means the chips have taped out and the fun is about to begin.
http://www.semiaccurate.com/2009/11/11/bulldozer-has-taped-out-earth-has-moved/

Die Wafer backen bereits, vielleicht ist mittlerweile (fast 4 Wochen später) sogar schon was fertig ;-)

ciao

Alex
 
Bei üblichen gut 18 Monaten Vorlaufzeit des Tape-Outs zum Launch sollte das auch so sein. ;)
 
Status
Für weitere Antworten geschlossen.

Ähnliche Themen

Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh