AMDs Bulldozer bzw. was kommt nach dem K10

Status
Für weitere Antworten geschlossen.
@mr.dude

Danke für die Erklärung. Was meinst du mit 4+1-Cluster?

Sorry fürs OT.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Es sind 4 gleichwertige Streamprozessoren (PE) plus ein "fetter" Streamprozessor (Special Function PE), der spezielle Aufgaben übernehmen kann.

zgtiwe7o.jpg
 
Mal eine Frage: Soll mit "Bulldozer" eigentlich eine echte Fusion von CPU und GPU erfolgen, oder ist das auch nur so eine "Mogelpackung", wie sie Intel jetzt mit Clarkdale bringt?
 
@Rudi Ratlos
Nee, so eine "Mogelpackung" wird es von AMD nicht geben. Eine Bulldozer Fusion mit einer GPU soll es dagegen schon geben. Ich würde aber nicht vor 2012 damit rechnen. Der erste Fusion Chip von AMD ist ja Llano. Allerdings basiert der noch nicht auf Bulldozer, sondern einem überarbeiteten K10.5. Dieser wird in 32 nm gefertigt und soll in etwa einem Jahr erhältlich sein.
 
Mal eine Frage: Soll mit "Bulldozer" eigentlich eine echte Fusion von CPU und GPU erfolgen, oder ist das auch nur so eine "Mogelpackung", wie sie Intel jetzt mit Clarkdale bringt?

Mogelpackung würde ich das nicht nennen, sondern eine Vorstufe. ;)
Beides zu vereinen scheint technisch derzeit noch nicht so recht machbar zu sein. :fresse:
 
Technisch machbar ist das derzeit schon. Das Design von Llano ist ja bereits fertig. Es dauert eben noch einige Zeit, bis dieses getestet und validiert ist. Gibt auch einen Die Shot.



Quelle: Heise


Wobei das wohl eine abgeschnittene Version ist. In den Präsentationen des Analyst Days war eine vollständige Version zu sehen.

 
Mogelpackung würde ich das nicht nennen, sondern eine Vorstufe. ;)
Beides zu vereinen scheint technisch derzeit noch nicht so recht machbar zu sein. :fresse:
Die aktuelle c't hat mich drauf gebracht. Technisch spricht ja nichts dagegen, das auch mal so zu machen. Wobei Intel damit wohl vor allem darauf zielte, die Konkurrenz von Nvidia aus dem Geschäft zu drängen.

Aber wenn man es mal genau betrachtet, ist der Westmere sogar ein kleiner Rückschritt, da die CPU zwar Nehalem-Design hat, aber keinen RAM-Controller mehr besitzt. Der sitzt nämlich in der "GPU", die damit quasi eine ins Prozessorgehäuse hochgewanderte Northbridge darstellt. Der einzige prinzipielle Fortschritt zum alten Design ist die schnellere Anbindung über interne "Strippen" statt FSB.

Aber marketingtechnisch ist das natürlich wieder mal ein Coup von Intel, keine Frage. So wie schon die "Quadcores" der Core2-Reihe, die ja auch zusammengesetzte Dualcores sind, die miteinander über den FSB reden müssen.
 
Die Frage ist immer, wie die praktischen Auswirkungen einer solchen Entscheidung sind. Die GPU profitiert natürlich von der schnelleren Anbindung an den Speicher, die CPU hat als Puffer zumindest noch den L3 Cache dazwischen. Man müsste jetzt Single-Thread Anwendungen gegen einen Lynnfield benchen und schauen, ob sich die pro-MHz Leistung verschlechtert hat.
 
Auf amdzone hat jemand eine interessante Entdeckung zu Orochi in der Open64 Implementierung gefunden.

L1D: 16 KiB, 4-way associativity, 64-byte line size
L2: 2048 KiB, 16-way associativity, 64-byte line size

Zum Vergleich Barcelona:

L1D: 64 KiB, 2-way associativity, 64-byte line size
L2: 512 KiB, 16-way associativity, 64-byte line size

Da scheinen sich die Spekus wohl zu bewahrheiten. Relativ kleiner L1D (und womöglich recht schnell, Latenz von 2 Takten?), sowie üppiger shared L2.
 
BD ist in seinem Modularen Desgin sicher eine Vorstufe zur vollständigen GPU-Integration. Ich könnte mir durchaus vorstellen, dass Anfang 2012 eine vollintegrierte BD-APU kommen könnte.
Man wird BD auch im Hinblick auf Fusion vorbereitet haben, immerhin soll BD jetzt erstmal wieder einige Jahre halten.
 
BD ist in seinem Modularen Desgin sicher eine Vorstufe zur vollständigen GPU-Integration. Ich könnte mir durchaus vorstellen, dass Anfang 2012 eine vollintegrierte BD-APU kommen könnte.
Man wird BD auch im Hinblick auf Fusion vorbereitet haben, immerhin soll BD jetzt erstmal wieder einige Jahre halten.

wird es dadurch nicht zwangsweise zu geschwindigkeits einbußen kommen im vergleich zu einem BD der nicht auf eine gpu vorbereitet wurde ? (fiktiv)

nicht das durch die zusätzlich geschaffenen gpu optionen, potential vernachlässigt wird.
 
Heißt das jetzt kein L3? Oder ist der nur noch nicht bekannt?
Das ist im Open64 Quellcode nicht definiert.

wird es dadurch nicht zwangsweise zu geschwindigkeits einbußen kommen im vergleich zu einem BD der nicht auf eine gpu vorbereitet wurde ? (fiktiv)

nicht das durch die zusätzlich geschaffenen gpu optionen, potential vernachlässigt wird.
Diese Befürchtungen braucht man nicht zu haben. Ich wüsste jetzt nicht, wo da Potenzial vernachlässigt werden würde.
 
Eher ist es so, dass die GPU in der FPU sitzen würde. Das wär natürlich überragend, wenn FMA ins Spiel kommt :d.
 
falls es jemand wissen möchte

K15 steht für Bulldozer & K12 für Liano
 
Offiziell und inoffiziell gibt es diese K-Namen bei AMD allerdings nicht mehr. Das nennt sich mittlerweile alles Family xxh.
 
K15 / Family 15 whatever

der Wahre Nachfolger des Sledgehammer ist auf dem Weeg.

und wird einschlagen wie der K8 damals.

für den Server markt hoffentlich schon ende 2010.
 
Wer es noch nicht kennt, Charlie hat hier die ISSCC Informationen zusammengefasst. Dort wurde hauptsächlich über Llano gesprochen. Einiges dürfte aber auch für Bulldozer von Belang sein. Kurz und knapp die wichtigsten Punkte:

Some of the 'what' questions were answered, like the fact that Llano uses a mildly tweaked version of the current K10h core found in AMD's Shanghai and Istanbul CPUs. The initial variant has four cores and adds a GPU to the mix. The GPU is based on the current 'Evergreen' DX11 cores, but how many shaders there are is an open question right now.
The core itself is changed a bit, but if you are familiar with the current 45nm K10h parts, you will feel right at home. AMD upped the L2 cache to 1MB per core, up from the current 512K, but it maintains the current 16-way associativity. The instruction window is enlarged to 84 entries so things should be a bit more efficient, and the instruction scheduler is now 30 entries for Integer, 36 for FP.
Hardware integer divide is said to be improved and latency for FP instructions has been reduced as well. To fill these windows, there is a better prefetcher, cache lines transition between states faster, and memory fill speed is increased. The TLB is also improved for better residency.
That said, each core is more than 35 million transistors and occupies 9.69mm^2, and 110 million transistors and 17.7mm^2 if you count the L2 and power gating ring.
Llano is built on AMD's new 32nm High-K Metal Gate (HKMG) Silicon On Insulator (SOI) process, and uses 11 metal layers, the same as Shanghai and Istanbul. The only change is that Metal 3 was reduced in pitch, and a lower K dielectric was used. On the silicon side, AMD is using dual strain liners, eSiGe, and some long-channel transistors to increase performance. The process also uses its second generation of immersion tools to draw the pretty lines on the wafers, think underwater basket weaving on a sub-micron scale with multi-million dollar tools.
AMD made a lot of changes to Llano to reduce power draw. It officially cites three main architectural changes - core power gating, digital APM (power management), and a clock grid redesigned for reduced power use. On a more granular level, SOI brought some major changes to the circuits themselves.
Another big circuit change is in the L1 cache cell, which moves from a double-pumped 6T design to an 8T design.
On the architectural level, the biggest change is called Core Power Gating, something Intel introduced in Nehalem. The idea is simple, even when off, as long as power can get to a transistor, some of it will get around the gate and be lost. This is conventionally known as leakage, and has become one of the most troubling problems in modern chip building.
They put a ring of transistors around the core itself, it is the black border labeled PG ring in the picture above. What it does is when a CPU goes into the new C6 sleep state, all internal data is saved to off-core DRAM, and the core is powered down completely.

It does not run slowly, the power gates turn off power to it entirely, and then those 110 million transistors stop leaking. This can be a huge power savings, AMD claims a 10-fold reduction in core leakage.

How it was done is pretty interesting as well. SOI is known to be better at preventing some kinds of leakage, and in this case, it is a huge advantage. AMD can use NFETs for the ring instead of the larger PFETs. Since the ring is 1.38 Million transistors per core, smaller is a good thing.
The next big one is digital power management (APM), basically being able to read how much power the CPU is using on a time scale that is less than "thermal time frames".
Driving this many high speed signals precisely burns a lot of power, so AMD rearranged the Llano core to cluster things that needed clock signals. The end result is a depopulated grid that barely resembles a grid. The transistors lost massively decrease the clock power used, with a claimed 84 percent drop in clock spine switching power, vastly fewer end clock buffers, and a total of 54 percent less power used for the clocks.

On top of the reduction in clock buffer count, AMD also gated them in a much finer way than ever before. At MaxPower, Llano has 32 percent of the clocks firing but only 12 percent when halted. This massively drops power when the CPU is sleeping. For the whole core, Llano only uses 68 percent of the static power and 84 percent of the dynamic power of its 45nm predecessor at a normalized clock.

Sieht so aus, als hätte AMD bei Llano doch einige tiefgreifendere Verbesserungen vorgenommen, was nicht nur zu einer besseren Performance pro Takt, sondern auch zu einer wesentlich besseren Energieeffizienz gegenüber den aktuellen K10.5 Kernen führen sollte.
 
Man darf gespannt sein :)
 
Am interessantestens klingt da das Power Gating. Damit sollte ne Menge Strom gespart werden können. Funktioniert das denn auch für den GPU-Teil, wenn eine dedizierte Grafikkarte zusätzlich verwendet wird?
 
Scheint doch mehr Veränderungen zu bekommen wie gedacht...
 
mich wundert das amd die änderung nicht besser vermarktet

der k10 auf k10,5 sprung war kleiner.

kleine frage an euch.

ich hab nun windows 7 home premium und nun erst erfahren das es keine mutli cpu,s unterstützt.

daher häng ich jetzt mit einem K8 2,6 ghz single core rum quasi....

das war nicht geplant. vorallem durchkreuzt das meinen aufrüst plan auf die serverplattform des Dual Bulldozer system,s

nochmal professional für 150 öcken geb ich garantiert nicht aus.

nun ist die frage. wie lange dauert es wohl bis bulldozer für den desktop raus kommt.

und auf welchem sockel kommt es ?

wenn es am3 kompatibel wird, dann auch mit allen am3 boards und ohne große bios update geschichten ?

oder wird ein neuer sockel raus kommen, und es wird nicht für am3 kompatibel sein ? oder falls doch, dannauf dem neuen sockel dennoch besser laufen ?

brauche nun mehr info,s weil ich eig wohl dazu gezwungen bin auf ein übergangs system umzusteigen.

denn von k10,5 halte ich nicht viel

genau so wenig von den neuen intel cpu,s

die architektur verbesserungen sind zu marginal gegenüber K8 und Core
 
Das kann dir momentan keiner sicher sagen. ;) Selbst wenn es bei einer neuen Revision von Sockel AM3 bleibt ist noch nicht gesichert, was bzgl. Spannungsversorgungsrichtlinien, BIOS (Größe aktueller Bausteine könnte zu klein sein) o.ä. geändert wird - kann also laufen, muss es aber nicht. Da heutige Boards so oder so in 1-1,5 Jahren ohne USB3.0/SATA3/PCIe3.0 (jeweils nativ versteht sich) etwas altersschwach dastehen, würde ich momentan eher zu einem günstigeren Board greifen und im Zweifelsfall bei späterer Aufrüstung ein neues kaufen - zumal man dann auch völlig frei in der Wahl bzgl. Sandy Bridge / Westmere / Bulldozer ist.
 
@Nighteye
Bulldozer für den Desktop heißt Zambezi und kommt für den AM3 Socket (4 Modul BD = 8 Kerne)
Die BD CPUs unterstützen DDR3-1866, die aktuellen AM3 Boards mit 790 Chipsatz haben 1600 DDR3 Support, aber später kommen Bios Updates wo dann DDR3-1866 freigeschaltet wird.
 
ich hab nun windows 7 home premium und nun erst erfahren das es keine mutli cpu,s unterstützt.
Ich hoffe nicht. :) Da der RC bald abläuft, habe ich mir nun selbst die Home Premium 64-bit Version bestellt. Wie kommst du darauf, dass mehrere CPUs nicht unterstützt werden? Zumindest wenn du damit Kerne bzw logische Prozessoren meinst. Also mir ist davon nichts bekannt.

das war nicht geplant. vorallem durchkreuzt das meinen aufrüst plan auf die serverplattform des Dual Bulldozer system,s
Ok, falls du mehrere Sockel meinst, das kann sein. Betriebssysteme explizit für Server gibt es ja nicht umsonst. :)

nochmal professional für 150 öcken geb ich garantiert nicht aus.
Also ich habe es bei Amazon bestellt. Die Professional bekommst du dort für etwa 115 Euro.

nun ist die frage. wie lange dauert es wohl bis bulldozer für den desktop raus kommt.
Kann dir wirklich noch keiner sagen. Offiziell ist 2011. Es gibt die eine oder andere Stimme, die Server Bulldozer schon Ende 2010 erwartet.

und auf welchem sockel kommt es ?

wenn es am3 kompatibel wird, dann auch mit allen am3 boards und ohne große bios update geschichten ?
Jup, sollte man annehmen. Hunderprozentige Sicherheit gibt es natürlich nicht. Lediglich die AM3 Kompatibilität ist gewiss. Inwiefern ein BIOS Update benötigt wird, zB für diverse Features, bleibt abzuwarten.
 
danke

@ mr.dude, ja home premium kann nur eine physikalische cpu verwenden.

Duplex hat was wichtiges erwähnt

die DDR3 geschichte.

wird DDR3-1866 also pflicht für den Zambezi ?

falls ja, könnte man sich quasi schonmal DDR3-1866 kaufen und den als DDR3-1600 laufen lassen ?

die boards müssten aber jetzt schon DDR3-1866 unterstützen wenn das so der fall sein wird.
 
falls ja, könnte man sich quasi schonmal DDR3-1866 kaufen und den als DDR3-1600 laufen lassen ?

niemand, aber auch wirklich niemand kauft ram im voraus! wenn der bulldozer 2011 erscheint wir der ddr3 ram preis ziemlich gedrückt sein und bekommst evtl sogar besseren und vor allem mehr. musst dir doch nur mal die samsungchips in 40nm anschauen.
 
falls ja, könnte man sich quasi schonmal DDR3-1866 kaufen und den als DDR3-1600 laufen lassen ?

die boards müssten aber jetzt schon DDR3-1866 unterstützen wenn das so der fall sein wird.
Wie schon vorher erwähnt, das ist in jedem Fall ne Glücksache.
Ich würde z.Zt. die GSkill ECOs kaufen, wenn man etwas zukunftssicherer sein will, mit 1,5-1,6V laufen die meistens auch auf 1866, und annehmbaren CLs.

Hängt aber stark vom Mainboard ab --- die Gigabytes und MSI unterstützen die Riegel auf alle Fälle.

ciao

Alex
 
Status
Für weitere Antworten geschlossen.

Ähnliche Themen

Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh