[Sammelthread] AMD Bulldozer - Next Generation new CPU Architecture - Sammelthread

Status
Für weitere Antworten geschlossen.
ein Modul ist ein Dual Core

Das Modul wird aufgeteilt in zwei 4 Way INT. Kerne die sich die Dekoder, FPU und den L2-Cache teilen. Der Rest ist doppelt vorhanden.

Die beiden INT. Kerne besitzen ihr eigenes L1-Caches, eigene Scheduler, Register usw. ein BD-Modul kann 2 Threads völlig unabhängig ohne das was limitiert bearbeiten. Der L3 Cache wird von allen Modulen genutzt

Dann verstehe ich aber nicht, warum das Modul durch den zweiten "Kern" nur 80% an Leistung dazugewinnt und nicht 100%.

Wenn es ein echter zweiter Kern ist, müssten es 100% sein. Irgendwo scheint doch etwas zu limitieren.

Und wenn es ein echter Kern wäre, warum dann die ganzen Folien über das überlegene Multi-Threading. Das zwei autarke Cores zwei Threads bearbeiten können, dafür braucht man doch keine Folien, um das als herausragende Leistung darzustellen.

In meinen Augen macht das keinen Sinn. Sorry. Oder kann jeder dieser zwei Kerne zwei Threads abarbeiten? D.h. 4 Module = 16 Threads? Wenn das so wäre, mea culpa. Aber andersrum: entweder das ist ein Dual Core, d.h. der zweite Kern bringt 100% der Leistung des ersten Kerns - oder es ist Multi-Threading.


Nein. Ein Modul ist vielmehr ein "optimierter Dual Core". Siehe Chuck Moore, Analyst Day 2009.


Das sind nicht wirklich schöne Begrifflichkeiten. Ein Bulldozer mit 4 Modulen wird als 8-Kern CPU von AMD vermarktet und besitzt 8 logische Prozessoren.

Analyst Day... Eine Reklameveranstaltung für Shareholder und Analysten... dort würde ich nicht mehr Informationen erwarten als in einem Werbespot.

Und ich beziehe mich halt auf den Entwickler von AMD Multi-Threading Technologie, auf den Druss verlinkt hat:

Andy Glew war der P6 (Pentium Pro) Chefentwickler, der auch mal bei AMD (2002-2004) arbeitete, der freut sich das seine alte, damals verworfene Arbeit jetzt doch noch bei AMD Bulldozer Anwendung findet

Bulldozer details + bobcat - comp.arch | Google Groups

...AMD's Bulldozer is an MCMT (MultiCluster MultiThreaded)
microarchitecture. That's my baby! ...
...I came up with MCMT in 1996-2000 while at the University of Wisconsin.
It became public via presentations. ...
...I called the set of an
integer scheduler, integer execution units, and an L1 data cache a
"cluster", and the whole thing, consisting of shared front end, shared
FP, and 2 or more clusters, a processor core. Apparently AMD is calling
my clusters their cores, and my core their cluster. It has been
suggested that this change of terminology is motivated by marketing, so
that they can say they have twice as many cores. ...

Der Erfinder selbst nennt das Modul den Kern und ist der Meinung, dass die Umbenennung der Cluster im Modul in Kerne eine reine Marketing Aktion ist, um den Eindruck von mehr Kernen zu erwirken.

Wenn ich nicht total falsch liege - und ich verstehe zu wenig von der Technologie, um das ausschließen zu können - dann bin ich der Meinung, AMD wäre ehrlicher, wenn sie die Pseudo 8 Cores als 4 Cores verkaufen würden und dafür betonen würden über was für ein unglaublich effektives Multi Cluster Multi Threading diese CPUs verfügen. Andererseits würden sie dann weniger Geld verdienen, weil 8-Kern auf der Schachtel natürlich einen weitaus größeren Eindruck schindet.

Es ist ja auch egal. Ich leite daraus ja keine Rückschlüsse über den Prozessor ab. Mir ist es egal ob das Ding 1 oder hundert Cores hat - genauso wie es mir egal ist ob ein digitaler Fotoapparat 2, 5 oder 10 Megapixel hat. Am Ende ist das Ding eine Black Box und es zählt nur was bei rauskommt.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Dann verstehe ich aber nicht, warum das Modul durch den zweiten "Kern" nur 80% an Leistung dazugewinnt und nicht 100%.

Wenn es ein echter zweiter Kern ist, müssten es 100% sein. Irgendwo scheint doch etwas zu limitieren.
Nein. Es hat niemand gesagt, dass ein Speedup von fixen 80% der Fall sein wird. Betrachte es als Untergrenze, speziell im Hinblick auf AVX. Auch ein aktueller Dual Core wird nicht in jedem Szenario einen Speedup von exakt 100% haben. Genau genommen ist das sogar recht selten der Fall.

Und wenn es ein echter Kern wäre, warum dann die ganzen Folien über das überlegene Multi-Threading. Das zwei autarke Cores zwei Threads bearbeiten können, dafür braucht man doch keine Folien, um das als herausragende Leistung darzustellen.
Du hast scheinbar das Konzept von CMT überhaupt noch nicht verstanden. Es geht vor allem um die Maximierung der Flächeneffizienz. Ein "normaler" Dual Core wäre nicht schneller, bräuchte dafür aber einiges mehr an Transistoren. Es gibt zudem noch weitere Aspekte, die sich über einen bisherigen Dual Core nicht realisieren lassen würden, Stichwort Eager Execution.

Analyst Day... Eine Reklameveranstaltung für Shareholder und Analysten... dort würde ich nicht mehr Informationen erwarten als in einem Werbespot.
Dann sind deine Erwartungen aber völlig falsch. Nicht so viel rummosern, sondern reinschauen. Es gibt zu den Veranstaltungen Streams. Da werden auch jede Menge technischer Aspekte angesprochen.

Und ich beziehe mich halt auf den Entwickler von AMD Multi-Threading Technologie, auf den Druss verlinkt hat:
Falls du Andy Glew meinst, das ist nicht der Entwickler. Den könnte man maximal als geistigen Urvater bezeichnen. Einer der Chefentwickler hinter Bulldozer, wie schon erwähnt, ist Chuck Moore.

Der Erfinder selbst nennt das Modul den Kern und ist der Meinung, dass die Umbenennung der Cluster im Modul in Kerne eine reine Marketing Aktion ist, um den Eindruck von mehr Kernen zu erwirken.
Natürlich hat das etwas mit Marketing zu tun. Oder warum glaubst du, hebt Intel auf Folien Hyperthreading so hervor? Ist genauso Marketing. Was hier aber völlig belanglos ist. Wenn ein Modul für AMD aus zwei Kernen besteht, dann ist das so. Kommt halt auch den tatsächlichen Gegebenheiten sehr nahe. Ein Modul wird eben so leistungsfähig sein wie zwei aktuelle Kerne (+ IPC + Takt). Ende der Geschichte. Ein Modul stellt zwei logische Prozessoren zur Verfügung, die gegenüber einem logischen Prozessor nahezu linear skalieren. Das ist der entscheidende Punkt. Also Schluss mit der unsinnigen Diskussion, was nun ein Kern in Bulldozer sein sollte und was nicht. Das bringt uns nicht im geringsten weiter und legt sowieso AMD fest und sonst niemand.
 
Zuletzt bearbeitet:
Jo AMD kann halt auch ein Stück Holz nehmen und es als CPU verkaufen... Es gibt allg. Definitionen, und es gibt Marketing.
 
Zuletzt bearbeitet:
Finde den BD schon sehr interessant (auch von der Zeit her läge genau in meinem "Neuanschaffungstiming").
Mich würde aber auch interessieren, wie es aussieht, wenn ich ein altes Programm oder Spiel ausführe welches nur einen Kern nutzt? Wird dann ein Modul genutzt oder ein "Kern"?
 
Blickt doch einfach mal zurück ich glaube so gute 6-8 Jahre da kaam AMD 64 FX raus.. und dies war mächtig teurer als die konkurenz; klar und die Leistung war zu dem Zeitpunkt unantastbar..


Genauso wird es auch mit BD werden (glaub ich )
 
Mich würde aber auch interessieren, wie es aussieht, wenn ich ein altes Programm oder Spiel ausführe welches nur einen Kern nutzt? Wird dann ein Modul genutzt oder ein "Kern"?
Anwendungen nutzen keine Kerne, Anwendungen nutzen Threads. Und Threads werden hardwareseitig auf logische Prozessoren abgebildet. AMD wird auf logischer Ebene gegenüber aktuellen CPUs nichts verändern, 1 Kern - 1 logischer Prozessor. Nur dass eben zwei dieser Kerne zusammengefasst und optimiert werden, was momentan als Modul bekannt ist. Bei Intel verfügt hingegen ein Kern über zwei logische Prozessoren. Sollte eine ältere Anwendung also nur einen Thread nutzen, dann wird auch nur ein Kern eines Bulldozer Moduls ausgelastet. Und hier wird dann vor allem Turbo greifen, also der Kern wird deutlich höher getaktet.
 
Zuletzt bearbeitet:
meint ihr, daß es besser wäre auf bulldozer zu warten, oder doch lieber einen 6core T1055 kaufen ? Der rüfte ja eigentlich, dank 6 Kernen, gut für die Zukunft gerüstet sein, oder ?

ps: welches AM3 Board (uATX, HDMI) wäre zu empfehlen, wenn man es möglichst lange behalten will, also es auch für die kommenden AMD CPUS "Bulldozer" benutzen möchte ?


mfg
 
Man kann immer warten :d

Ich hätte auch warten können, aber wer weiß schon genau, wann der Bulldozer nächstes Jahr kommt ;)

Ich hab mir den 1090T nun erstmal geholt (+ ASRock 890FX Deluxe3 + 8GB DDR3 1333MHz Kingston HyperX CL7 RAM) und bin mit ihm hochzufrieden. :)

Aber das musst du schon selber entscheiden, die Entscheidung kann und wird dir keiner abnehmen ;)

Als Board würde ich ein Asus empfehlen, die bieten mit den besten Support, was BIOS-Updates angeht.
 
muss das irgendein spezieller chipsatz sein, oder ist das egal ?
Wie gesagt, es sollte uATX sein, da ich plane mir einen Barbeon pc zu bauen.

mfg
 
Einen speziellen Chipsatz muss es nicht sein, aber vorzugsweise einer der 8XX-Serie und natürlich ein AM3 Sockel.
 
Als Board würde ich ein Asus empfehlen, die bieten mit den besten Support, was BIOS-Updates angeht.

Soll wohl als Scherz gemeint sein, oder? :d Bei den Highend-Boards bieten die wirklich guten Support. Allerdings bei den Brettern für die "breite Masse" schaut es manchmal anders aus. Als kleines Beispiel sei das M2A-VM HDMI erwähnt, wo erst Mitte April diesen Jahres ein BIOS-Update für die Athlon II und Phenom II Prozessoren gekommen ist. Eigentlich hatte damit keiner mehr gerechnet. In diesem Bereich könnte sich ASUS einiges von der "Tochter" ASRock abschneiden - die arbeiten aktuell zumindest dran, wie es ausschaut und sind auf dem Weg der Besserung. ;)

@classic437: Die Auswahl ist noch bei µATX recht überschaubar, zumindest wenn es ein Chipsatz der 8xx(Gx)-Serie und USB 3.0 sein soll (Achtung, nicht alle Boards mit 8xx Chipsatz unterstützen USB 3.0 -> Stichwort Zusatzcontroller; SATA III wird allerdings von der SB810 & SB850 unterstützt). Mainboards/AMD Sockel AM3 (DDR3) Preisvergleich bei Geizhals.at Deutschland Sollte sich aber bald ändern. Ohne USB 3.0, bzw. mit 7xx Chipsatz ist die Auswahl sehr groß.
 
:btt:
Das ist kein Kaufberatungsthread!!! (
reportycvj.gif
)
 
Zuletzt bearbeitet:
Die Spekulationen rund um Bulldozer werden immer abenteuerlicher.

"Zambezi" (32nm, 8-core)


  • 4 AMD Bulldozer modules
  • 4 KB L1 data cache (8 way associative) per core, 12 Kuops trace cache (in term of bandwidth output the cache can reach same as a 64 KB sram, 2 way associative) per module
  • Trace cache enhancement included in new architecture.
  • 128 KB L2 cache per module
  • 80 Raster Operations Pipeline (4 way Data channel x 20 Instruction pipeline).
  • Feature 6+ GHZ
  • Support new ISA: XOP, FMA4, SSSE3, SSE4.1, AVX, AES, CLMUL
  • Support fusion of CMP and JMP instructions
  • up to 8192 KB L3 cache shared by all modules and GPU on a single die.
  • Higher memory level parallelism
  • will release as dual core, quad core for low end and mainstream market.
  • DDR3
  • AM3r2
  • 10-100 watts
  • Tentative release date Q1/Q2 2011
 
Zuletzt bearbeitet:
Erinnert irgendwie ein bischen an den P4 .. was mich mal interessieren würde, wie hoch sich die Special Function Units wie SSE, AVX etc. takten lassen .. das restliche Design könnte man ja noch irgendwie anpassen .. die Erweiterungen auch?

Von über 4 Ghz hatte ich auch was im Kopf beim Bulldozer, aber gleich 6? Halte ich nicht für sehr wahrscheinlich.
 
Die Spekulationen rund um Bulldozer werden immer abenteuerlicher.
Tja ... das ist der Segen von Wikipedia ... da darf jeder Idiot schreiben was er will :haha:
Ich glaub da stand sogar letztens mal dabei, dass Bulldozer ein Fusion Chip wäre ...
Der BD Wikiartikel ist irgendwie ein Sammelsurium von Halbwahrheit und Fanboyfantasien ^^

Auszuschließen, dass da irgendein AMD Mitarbeiter nicht irgendwas verrät kann man natürlich nicht, aber im Meer des Blödsinns ginge sowas dann unter :(

ciao

Alex

P.S: Was soll der Mist mit der "Raster Pipeline" ???
 
Zuletzt bearbeitet:
Freu mich schon drauf, könnte seit langem wieder ein AMD bei mir werden, ich hoffe auf ein Oktober 2003 2.0 :d
 
Ja es ist keine Kaufberatung hier, allerdings muss der kleine Fehler von Slurm_McKenzie korrigiert werden. Die 810 Southbridge bietet kein SATA III, nur die 850 Southbrdige.

@classic437
Also nur die 850 Southbrdige bietet SATA III. USB 3.0 gibt es aktuell bei keinem Board nativ, das ist immer ein Zusatzcontroller, der 2 x USB 3.0 bietet.

Meiner Meinung nach. Wenn man die höchste Wahrscheinlichkeit haben will, eine passende BIOS Version für Bulldozer zu bekommen, falls dieser auf den aktuellen AM3 läuft, kommt eigentlich fast nur noch ASRock infrage.
Ob Asus dabei eine gute Wahl ist, möchte ich anzweifeln. Während ASRock der nForce 3 250 Platine (Sockel AM2 und AGP Slot, ~60€ Platine) Phenom II X4 965 Support bietet, bekommt man bei Asus für das AM2 High-End Brett M2N32-SLI Deluxe, damals ~180, nicht einmal Athlon II und Phenom II Support. Nur der nicht lieferbare X3 715 ist in der CPU Liste gelistet.
Nachtrag. Eine weitere Beta Version. Praktisch seit März 2009 gibt es keine endgültige BIOS Version mehr, nur noch Beta Versionen. Dabei hat es nun 1 Jahr gedauert, bis AM3 Prozessoren mit einer Beta Version unterstützt werden. Soviel zu Asus. Aktuell wird weiterhin nicht einmal ein Phenom II X4 955/920 unterstützt. Die CPU Liste sieht auch wirklich erschreckend aus. Es lohnt nicht so viel Geld für ein Board zu bezahlen, wenn nicht einmal die CPU Support Liste gepflegt wird. Für mich ein Zeichen, wie die dort arbeiten.
 
Zuletzt bearbeitet:
Vielleicht IGP? 80 SP's würden etwa einer HD5450 (je nach Taktraten) entsprechen. Mich irritieren dabei aber die 4x20 dahinter.
Ja wie besagt, Bulldozer hat aber erstmal keine IGP ... da wird irgendwie alles zusammengetragen was irgendwer wirgendwo gesehen hat ..:wall:
 
Erinnert irgendwie ein bischen an den P4
Wieso? Wegen der Taktrate? Nee, Bulldozer bzw ein Bulldozer Modul ist ein 2x 4-fach OoO Design. Das hat mit Netburst nun wirklich nichts zu tun. Und ich persönlich glaube auch nicht, dass du über 4 GHz sehen wirst. Zumindest was den 8-Kerner betrifft.

P.S: Was soll der Mist mit der "Raster Pipeline" ???
ROPs kennt man eigentlich hauptsächlich von Grafikprozessoren. Und auch wenn Bulldozer irgendwann mal zur APU mutieren soll, klingt das irgendwie ziemlich seltsam. Auch der L2 Cache schaut ziemlich winzig aus.
 
Zuletzt bearbeitet:
Ich möchte nur schnell eine Erinnerung aussprechen bezüglich den Taktraten:
Jemand hat einen AMD VIP-besucher zitiert wie er sagt: die BD Architektur ist für extrem hohe Taktraten ausgelegt.

Gut "hoch" ist schon etwas ungenau aber hoffen darf man ja :-P
 
Er widerspricht vor allem den Schaubildern von AMD selber, die immer einen unified L2-Cache pro Modul vorsehen. Die Daten sind purer Schwachsinn :d.

Sowas kann ich auch:

Code:
4 BD-Modules
32kiB L1-Inst-Cache pro Modul
16kiB L1-Data-Cache pro Kern
1MiB L2-Cache pro Modul
8MiB L3-Cache für das gesamte Orochi-Die (OR-Bx)
2,5-3,5GHz Takt mit Rev.B
DualChannel DDR3-1866-Support
FMA4, XOP, SSE4...

Das klingt jedenfalls erheblich realistischer :d.
 
Zuletzt bearbeitet:
Ich möchte nur schnell eine Erinnerung aussprechen bezüglich den Taktraten:
Jemand hat einen AMD VIP-besucher zitiert wie er sagt: die BD Architektur ist für extrem hohe Taktraten ausgelegt.
Woher soll das denn stammen? Ich habe davon jedenfalls noch nichts gehört. John Fruehe hat sehr hohe Taktraten bisher ebenfalls verneint. Auch wenn Übertakter womöglich Spass daran hätten, Bulldozer ist eine Durchsatz-Architektur und keine Architektur ausgelegt auf hohe Taktraten, so wie einst Netburst. Ich habe hier extra noch mal eine Aussage von JF rausgesucht:
5GHz? Only if the chips were powered by magic unicorns. Expect higher clock speeds on those processors than you see today, but not 5GHz.


@[HOT]
Also zumindest "per module" steht ja da. Trotzdem wären 128 KiB für 2 Kerne gemessen an aktuellen Kernen wohl einfach zu wenig.


Abinstein von amdzone hat aber auch eine interessante Theorie aufgestellt. Und zwar wäre der L1 eher sowas wie ein L0 und der L2 eher sowas wie ein L1, sowohl was Durchsatz als auch Latenz betrifft. Anmerkung meinerseits, der L3 käme dann einem grossen shared L2 Cache nahe, so wie beim C2Q. Nur designtechnisch wesentlich besser gelöst, da alle Kerne auf den kompletten L3 Zugriff hätten. Das wäre imo im Vergleich zur jetzigen Cache Hierarchie ein grosser Fortschritt. Ich denke auch, dass ein grosses Verhältnis zwischen L2 und L3 besser ist. Schaut euch mal die durch die GCC Logs spekulierten Grössen für 4 Module an, 2 MiB L2 pro Modul, 8 MiB L3, 16 MiB gesamt. Nutzt man eine ähnliche Vorgehensweise wie momentan, also dass Kerne unter Idle ihren Cache in den L3 schieben, und dann dank Power Gating komplett abschalten, würden bei maximal einem aktiven Modul 3x 2 MiB des L3 belegt sein und lediglich 2 MiB frei zur Verfügung stehen. Also von den maximal möglichen 10 MiB (2 MiB L2 + 8 MiB L3) pro Modul blieben dann effektiv nur noch 4 MiB (2 MiB L2 + 2 MiB L3) übrig. Das wäre nicht sonderlich viel. Mit 128 KiB L2 pro Modul und 8 MiB L3 sähe das schon wieder ganz anders aus. Aber wer weiss, es stand ja auch mal im Raum, dass die Module auf den kompletten L2 Zugriff hätten, also auch den L2 von anderen Modulen. So eine Art Ringbus, auf den eigenen L2 hat jedes Modul schnellen Zugriff, auf den L2 anderer Module kommt dann etwas Latenz hinzu.
 
Gibts eigentlich schon Infos was AM3r2 bedeuten wird? Mir ist aufgefallen, dass der Sockel beim ASUS M4A89GTD leicht verändert wurde.
 
Bulldozer schon zum Weihnachtsgeschäft?

You might be surprised to learn that AMD is just seven months away from releasing new CPUs based on not one, but three, new designs. The Phenom II that we have known for the past 17 months will soon be put to pasture, never to be seen again. Its replacements are built for the server, the desktop, the notebook and the netbook.

Dubbed Bulldozer, Bobcat and Llano, the new processor designs are the final piece of AMD’s grand strategy to emerge from years of debt and struggle as a leaner, meaner company. For enthusiasts, they are something altogether more important: a clear sign that the fascinating war between AMD and Intel is about to go nuclear once again.

What we know about AMD’s next-generation processors
 
Das wäre wirklich überraschend früh. Ich hätte frühestens Q2 2011 mit Bulldozer gerechnet.
 
Da müsste aber bald das Tape-Out sein.
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh