[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

Duplex

Urgestein
Thread Starter
Mitglied seit
11.02.2008
Beiträge
10.151
AMD Bulldozer FX-8000/6000/4000 Series "Zambezi" 32nm Info & Sammelthread

AMD Bulldozer FX-8000/6000/4000 Series
"Zambezi" 32nm Info & Sammelthread


Mit der Nehalem-Architektur hat Intel einen Schritt hin zu einem modularen Aufbau seines Designs gemacht. Somit ist es für Intel auch relativ einfach die Architektur an die verschiedenen Anforderungen der unterschiedlichen Märkte anzupassen. AMD versucht mit Bulldozer nun einen ähnlichen Weg. Die Basis stellt dabei das Bulldozer-Modul dar. AMD spricht hier von einem Dual-Core-Modul, da zwei unabhängige Integer-Cores und ein Single-Shared-Floating-Point-Core vorhanden sind, welche Instruktionen von zwei unabhängigen Threads entgegennehmen können. Dieses Dual-Thread-Design ist größer als ein Single-Core, aber deutlich kleiner als ein typischer Dual-Core mit redundanten Komponenten. In der Theorie geht AMD davon aus, dass dieses Design schneller als ein Single-SMT-Core (Hyper Threaded) arbeiten kann, aber langsamer als ein "echter" Dual-Core ist. Gegenüber einem normalen Dual-Core lassen sich aber 12 Prozent Die-Fläche einsparen.

Ein Prozessor muss aber nicht nur aus einem dieser Module bestehen, sondern es können bis zu vier Bulldozer-Module zusammengesetzt werden. Im Resultat ergeben sich Prozessoren mit zwei bis acht der neuen Kerne. Jeder dieser Kerne wird dem OS als logischer Prozessor angezeigt, ähnlich wie es auch bei Intels HyperThreading-Technologie der Fall ist. Eine CPU, die aus vier Bulldozer-Modulen besteht, wird also als ein 8-Kern-Prozessor im Windows Task Manager auftauchen. AMD will mit dieser Idee einen guten Kompromiss zwischen einem Single-Core mit SMT (HyperThreading), der eben eigentlich ein Single-Core ist, und einem Dual-Core, der oftmals unnötig viele Ressourcen brachliegen lässt, gefunden haben. Mit der Einführung des AMD Phenom hatten viele bereits mit starken Änderungen in der Architektur gerechnet, doch AMD blieb dem K8-Design treu, und so konnte Intel in der Performance pro Takt immer weiter davon ziehen. Mit Bulldozer soll nun das Design erscheinen, auf das AMD-Nutzer schon etwas länger gewartet haben.

nik4x8qy.jpg


Taucht man etwas tiefer in die Mikro-Architektur eines Bulldozer-Moduls ein, werden Gemeinsamkeiten mit Intels Westmere sichtbar. So ist das Modul wie beim Phenom zwar bei einem 64 kB L1-Cache des Instruction-Fetcher geblieben, dieser gibt Anweisungen aus zwei Threads aber an vier Decoder weiter und nicht mehr an nur drei. Aus dieser Decoder-Engine werden die Daten dann an drei unabhängige Scheduler weitergegeben: zwei Integer- und ein Shared-Floating-Point-Core. Jeder Integer-Core besitzt zwei AGU- und ALU-Engines. Während vielen ALU ein Begriff ist, sorgt AGU noch immer für Fragezeichen: AGU steht für "Adress Generation Unit". Dabei handelt es sich um eine Art Integer-Recheneinheit, welche sich um die Generierung von Speicheradressen sowie um das Lesen und Speichern kümmert. Dem Integer-Core stehen 16 kB L1-Cache zur Verfügung.

Neben den bereits bestehenden SIMD-Befehlssätzen und AES kennt Bulldozer nun auch die AVX-Instruktionen sowie XOP und FMA4. Allerdings ist die Unterstützung von FMA4 von Intel ungewiss, weshalb hier unklar ist, ob die Funktionen in der Masse eingesetzt werden.

Der Cache ist nach Threads aufgeteilt, sodass der Shared-Floating-Point-Core entscheiden kann, auf welchen Teil des Caches er zurückgreifen muss. Innerhalb des Shared-Floating-Point-Core befinden sich dann jeweils zwei 128 Bit FMAC- und 128 Bit Packed-Integer-Pipelines, die dafür sorgen, dass der Shared-Floating-Point-Core auf zwei Threads gleichzeitig arbeiten kann. Wie Intels kommende Sandy-Bridge-Prozessoren unterstützt AMDs Bulldozer-Modul SSE-Instructions-Sets bis zur Version 4.2 und ebenfalls Intels AVX-Instruktionen. 256-Bit-AVX-Operationen werden durch zwei 128-Bit-FMAC-Units ausgeführt. Jedes Bulldozer-Modul verfügt über seinen eigenen L2-Cache, den sich der Integer- und die zwei Shared-Floating-Point-Cores teilen.

Das komplette Die mit vier Bulldozer-Modulen besitzt eine Gesamtgröße von 315 mm² und insgesamt 2 Milliarden Transistoren:


dieshotuust.jpg


Beim Kern sind zum einen die großen L2-Caches zu sehen (oberhalb
eines Bulldozer-Moduls), zum anderen auch die gemeinsamen L3-Caches,
die sich in der Mitte befinden.

Alle Bulldozer-Module können unabhängig voneinander getaktet und mit der nötigen Spannung versorgt werden. So kann ein Bulldozer-Modul nun auch komplett abgeschaltet werden und verbraucht im Idle-Modus nicht einmal mehr Strom. Die dann eingesparte Leistung kann in anderen Modulen zusätzlich verbraucht werden. Intel macht dies in seiner Turbo-Boost-Technologie nicht viel anders. Da Takt und möglicher maximaler Verbrauch aber auf Ebene des Modules bestimmt werden und nicht auf Core-Ebene, sind doch entscheidende Unterschiede zu Intel vorhanden – AMDs Lösung könnte deutlich effizienter arbeiten als die Core-Turbo-Technologie von Intel. Im Unterschied dazu kommunizieren die Module nun nicht nur mehr über ein Taktsignal, sondern auch bezüglich der anliegenden Spannung miteinander. Weitere Details dazu sind auf der nächsten Seite zu finden.

AMD setzt für Bulldozer den 32-nm-Prozess von Globalfoundries mit Silicon-on-Insulator-Technik ein.


Turbo-Core im Detail

Intel hat mit Turbo Boost bereits vor einiger Zeit eine ähnliche Technologie für seine Prozessoren eingeführt. Grundsätzlich geht es darum, den gegebenen (Takt)-Spielraum eines Prozessors zu nutzen, wenn er nicht an seiner thermischen Leistungsgrenze arbeitet, aber dennoch durch technische Beschränkungen limitiert wird. Die thermische Leistungsgrenze wird durch den maximalen Verbrauch bestimmt - die Thermal Design Power (TDP). Bei AMD wird ein Testverfahren angewendet, welches jeden Transistor des Prozessors belastet, und somit kann die TDP bestimmt werden. Daraus errechnet AMD dann auch den maximalen Takt, den der Prozessor unter diesen Bedingungen fahren kann. In der Praxis allerdings wird dieser Zustand selten bis gar nicht erreicht. Kaum eine Anwendung schafft es einen Prozessor derart auszulasten. Dennoch muss AMD den konservativen Weg gehen, sozusagen ein Worst-Case-Szenario einhalten.


turbo-core-1iuh3.png


Um aber auch realistischere Wert zu den Prozessoren nennen zu können, führte AMD die Average CPU Power (ACP) ein. Die TDP spiegelt also den maximalen Stromverbrauch des Prozessors wider, die ACP in der Praxis aufzufindenden Belastungen. Die ACP errechnet sich dabei aus einer Belastung von 100 Prozent im Server-Bereich. Dies unterscheidet sich auf den ersten Blick nicht (könnte man annehmen) vom Szenario für die TDP, wo jeder Transistor belastet wird. Nimmt man sich allerdings ein Beispiel zur Hand, sind die Unterschiede zwischen TDP und ACP enorm. Für den Opteron 2376 gibt AMD eine TDP von 115 Watt an. Die ACP liegt allerdings bei nur 75 Watt. Immerhin 40 Watt bzw. 35 Prozent liegen also zwischen diesen Szenarien. Der 12-Kern-Prozessor Opteron 6174 wird von AMD mit einer TDP von ebenfalls 115 Watt bemessen, die ACP liegt bei 80 Watt. Zwischen den beiden Werten liegen nur noch 30 Prozent Unterschied. Der Grund hierfür ist CoolSpeed, eine Technologie, die AMD mit den neuen Opteron-Prozessoren einführte, um ACP und TDP näher zusammenzuführen. Man nutzt die Lücke zwischen ACP und TDP, um dem Prozessor etwas mehr Takt zu geben. Sollte er zu dicht an die TDP herankommen, wird der Takt wieder reduziert. Mit den mageren 5 Prozent zwischen der klassischen Methode und CoolSpeed wollte sich AMD allerdings nicht zufriedengeben und so führt man mit den Bulldozer Prozessoren die Turbo Core Technologie ein.

Turbo Core geht also noch einige Schritte weiter wie CoolSpeed und taktet den Prozessor so hoch, wie die TDP es maximal zulässt. Sollte der Prozessor zu dicht an die TDP herankommen, wird wieder eine Stufe heruntergetaktet, sodass die Spezifikationen eingehalten werden. In einem Diagramm ist das Prinzip sehr schön dargestellt.

amd_turbocore1kuym.jpg


Die Scorpius-Platform

Zwar spricht AMD hin und wieder von einer AM3-Kompatibilität im Zusammenhang mit Bulldozer. Dies darf jedoch nicht falsch verstanden werden: Für Bulldozer wird der AM3+-Sockel benötigt. Bisherige AM3-Prozessoren werden auf diesen Sockel passen, umgekehrt allerdings wird es nicht möglich sein einen AM3+-Prozessor auf ein aktuelles AM3-Mainboard zu setzen. Die Unterschiede in der Chipsatz-Generation fallen aber minimal aus.


chipsatzcunl.jpg


Die Feature-Liste von AMDs 990FX, 990X und 970 sowie der dazugehörigen Southbridges unterscheidet sich nur in einigen Details von der älteren Chipsatz-Serie. Die High-End-Version 990FX stellt maximal bis zu vier PCI-Express-x16-Slots zur Verfügung. In dieser Ausbaustufe ist jeder Slot mit 8 PCI-Express-Lanes angebunden. Werden nur zwei Slots bestückt, liegen an diesen natürlich die vollen 16 Lanes an. Zusätzlich stehen noch ein x4- und bis zu sechs x1-Slots zur Verfügung.

Die beiden kleineren Varianten 990X und 970 bieten wie die aktuelle Generation auch nur noch einen PCI-Express-x16-Steckplatz, der aber beim 990X in zwei x8-Slots aufgeteilt werden kann. Zusätzlich sollen dann noch sechs x1-Slots bereitgestellt werden. Die beiden Modelle der Southbridge SB950 und SB920 stellen die restlichen Features zur Verfügung. Dazu gehören auch weitere PCI-Express-Lanes sowie PCI-Steckplätze, aber natürlich auch bis zu 14 USB-2.0-Ports und 6x SATA 6 Gbit/s.


Leistung: Theoretische Tests


ratinggames7crj.jpg
ratinggesamtscat.jpg


Leistung: Games



Die CPU Modelle
• AMD FX-Series FX-4100, 4x 3.60GHz (B2 Stepping)
TDP: 95W • Fertigung: 32nm • L2-Cache: 4x 1MB • L3-Cache: 8MB shared
AMD Processors
•AMD FX-Series FX-6100, 6x 3.30GHz (B2 Stepping)
TDP: 95W • Fertigung: 32nm • L2-Cache: 6x 1MB • L3-Cache: 8MB shared
AMD Processors
•AMD FX-Series FX-8120, 8x 3.10GHz (B2 Stepping)
TDP: 125W • Fertigung: 32nm • L2-Cache: 8x 1MB • L3-Cache: 8MB shared
AMD Processors
•AMD FX-Series FX-8150, 8x 3.60GHz (B2 Stepping)
TDP: 125W • Fertigung: 32nm • L2-Cache: 8x 1MB • L3-Cache: 8MB shared
AMD Processors





 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Kaum ist der neue Teil des Threads gestartet, gehts gleich mit Themen weiter, die nicht direkt etwas mit BD zu tun haben. Unterlasst das mal bitte und konzentriert euch auf den Threadtitel.
 
Zuletzt bearbeitet:
Das ist einfach nur typisch dumme Spekulation von Volker. Also nichts wichtiges. Nimm einfach das Gegenteil von dem, was er an AMD Spekulationen schreibt, und du kommst der Wahrheit am nächsten.

Kurzum, es gibt keine Kritik. Auf der Folie steht es ja auch nochmal deutlich:
Today, 32nm yields are in-line with our expectations ...

Der Punkt ist einfach, dass 32 nm der erste Fertigungsprozess nach der Ausgliederung von GloFo ist. Und dementsprechend will AMD natürlich auch die Verträge ändern bzw nur das bezahlen, was auch geliefert wird. Dass Yields zu Beginn noch nicht optimal sind und im Laufe der Zeit verbessert werden, ist ein völlig normaler Prozess. Da sollte man nicht zu viel hineininterpretieren. Was Volker schreibt, ist jedenfalls Blödsinn. Rund läuft die Fertigung auch jetzt schon und nicht erst 2012. Ansonsten hätte man nicht damit begonnen, Llano auszuliefern. ;)
 
AMD sagt, die Fertigung läuft gut. Das hat NV zu Fermi auch gesagt *SCNR*
Das ist einfach nur typisch dumme Spekulation von Volker. Also nichts wichtiges. Nimm einfach das Gegenteil von dem, was er an AMD Spekulationen schreibt, und du kommst der Wahrheit am nächsten [...] Was Volker schreibt, ist jedenfalls Blödsinn.
Warum musst du ihn gleich so diffamieren? Wir wissen, du magst ihn nicht und AMD dafür besonders gerne. Aber der Ton ist (mal wieder) daneben. Gut, dass ich nicht Volker bin ...
 
Die Original-Überschrift von CB ist ja auch witzig "AMD macht Globalfoundries wegen 32 nm Feuer" (sieht man durch die ersten 12 Postings). Fehlt nur noch der Zusatz "unter dem Hintern", dann sitzt das Niveau wo es hingehört...
 
"Pro/MHz" ist vollkommen unwichtig. Technisch zählt in erster Linie Performance pro Watt und sonst nix.
Wo wir wieder bei der hohen TDP-Einstufung der erwarteten 8-Kern/4-Modul Bulldozer wären. Bei 30 % mehr Leistungsaufnahme als Intels Sandybridge gibt es da ein Problem, das man erst einmal durch 30 % mehr Geschwindigkeit kompensieren können muss.
Beim Desktop drückt der Schuh jetzt weniger, bei der Migration des Designs ins Mobilsegment (2012) wird's ihnen aber auf die Füße fallen.

Nebenbei bemerkt spielt natürlich auch die Die-Fläche sowie die Ausbeute eine Rolle. Man will ihn ja auch bezahlen können.
 
Wo wir wieder bei der hohen TDP-Einstufung der erwarteten 8-Kern/4-Modul Bulldozer wären. Bei 30 % mehr Leistungsaufnahme als Intels Sandybridge gibt es da ein Problem, das man erst einmal durch 30 % mehr Geschwindigkeit kompensieren können muss.

Wo wir wieder bei der unterschiedlichen Definition von "TDP" bei AMD und Intel wären.

Siehe auch
http://de.wikipedia.org/wiki/Average_CPU_Power

Die ACP ähnelt damit einer älteren Definition der Thermal Design Power von Intel.
Demnach gibt AMD bei der TDP max. Werte an, Intel allerdings nur Durchschnittswerte, für das marketing ist Intels Variante wesentlich besser, siehe die ganzen TDP Posts (wie einer von mir hier zitiert).
Ein 125W TDP bei AMD dürfte in etwa 95-100W bei Intel entsprechen, womit wir beim SB 2600K sind.
 
Zuletzt bearbeitet:
Es wird auch einen 95W TDP 4-Modul Bulldozer geben. Und der 125W TDP Spitzen-Bulldozer dürfte in erster Linie unter Volllast aller Kerne inkl. 500MHz+ Turbo (also MT-Szenario) stromhungriger sein, dann allerdings mit großer Warscheinlichkeit auch schneller als jeder aktuelle Sandy Bridge.
 
Zuletzt bearbeitet:
Ist doch egal ob die CPU 95, 125 oder 140W TDP hat, Intels High End CPUs haben auch 130W TDP, wenn die Leistung stimmt ist der Verbrauch nicht so wichtig, ich doch bei Nvidias GTX590 vs. HD6990 das gleiche, die Nvidia Karte verbraucht mehr Strom, hat aber mehr Leistung!

Interlagos (Bulldozer) hat bei gleicher ACP 50% mehr Speed als Magny Cours (K10.5)
halbieren wir die Modul Anzahl, dann ist Bulldozer (Zambezi) ca. 50% vor Phenom2 X6, ca. Westmere (Gulftown i7-980x)
In Multithreading wird dann Sandy Bridge keine Chancen haben, 3DMark11, Vantage, Cinebench & Multicore Games usw. werden alle von Bulldozer profitieren können, bei AVX Code oder FMA4 ist dann AMD viel viel schneller als Intel :wink:
 
Zuletzt bearbeitet:
Warum bist du der Meinung, dass die TDP-Angabe = Leistungsaufnahme des Prozessors ist?
 
wo habe ich geschrieben das die TDP mit der Leistungsaufnahme identisch ist? :rolleyes:
 
Hey, ganz ruhig. Wenn man sich deinen Satz durchliest, kann man es so auffassen.

Ist doch egal ob die CPU 95, 125 oder 140W TDP hat, Intels High End CPUs haben auch 130W TDP, wenn die Leistung stimmt ist der Verbrauch nicht so wichtig
 
AMD sagt, die Fertigung läuft gut. Das hat NV zu Fermi auch gesagt
Nö, haben sie nicht. Daran würde ich mich ansonsten erinnern. Das einzige, was im Vorfeld von nVidia kam, war eine Fermi Attrappe, sonst nix. :fresse:

Warum musst du ihn gleich so diffamieren? Wir wissen, du magst ihn nicht und AMD dafür besonders gerne.
Ich mag weder ihn nicht, noch mag ich AMD. Das ist dir vielleicht unbekannt, aber mir sind solche emotionalen Bindungen zu Personen oder Firmen völlig egal. Mir geht es um Produkte und Technologien. Fakt ist, Volker schreibt gerne Blödsinn zu AMD. Und das darf ja wohl auch mal gesagt werden. Vor allem dann, wenn man sich für die Produkte interessiert und einen dieser spekulative Müll ohne jegliche Basis nervt. Mit Diffamieren hat das nichts zu tun. Gerade auch, weil Volker an seiner Art anscheinend nichts ändern will. Er sollte sich vielleicht mal ein Beispiel an Michael Günsch nehmen. Dessen Artikel sind um Längen sachlicher und objektiver verfasst.


Wo wir wieder bei der hohen TDP-Einstufung der erwarteten 8-Kern/4-Modul Bulldozer wären. Bei 30 % mehr Leistungsaufnahme als Intels Sandybridge gibt es da ein Problem, das man erst einmal durch 30 % mehr Geschwindigkeit kompensieren können muss.
Solange wir die Performance nicht kennen, sehe ich noch kein Problem. Zumal TDP != reale Leistungsaufnahme. Das sollte man nicht vergessen. Intels TDP ist zudem nicht das gleiche wie AMDs TDP.

Beim Desktop drückt der Schuh jetzt weniger, bei der Migration des Designs ins Mobilsegment (2012) wird's ihnen aber auf die Füße fallen.
Ganz im Gegenteil. Gerade im Mobilbereich sehe ich enormes Potenzial für Bulldozers CMT Design. Sozusagen ein "Dual-Core Light", kompakt und sparsam. Mehr brauchen die meisten Mobiluser auch in den nächsten Jahren nicht. Und falls doch, nimmt man halt einen Prozessor mit 2 oder 4 Modulen. Die Frage wird vielmehr sein, ob AMD da wirklich Ambitionen mit Bulldozer hat und entsprechende Ressourcen investiert. Oder ob man hier in Zukunft primär auf Bobcat setzt und Bulldozer nur für Mobilplattformen mit gehobenen Ansprüchen einsetzt.
 
mr.dude schrieb:
"Pro/MHz" ist vollkommen unwichtig. Technisch zählt in erster Linie Performance pro Watt und sonst nix.
Tja, dein altes Problem. "Pro/MHz" ist sehr wohl wichtig, da es ein maßgeblicher Faktor für die Performance ist. Daraus ergibt sich dann auch Performance pro Watt. Warum das im Übrigen so wichtig sein soll, musst du mir erklären. Gerade im Bezug auf Oberklasse und High-End. Hier zählt Performance und die besteht wie gesagt auch aus "Pro/MHz". Und genau da hapert's momentan bei AMD ziemlich, deswegen sind die im High-End-Segment unter anderem nicht konkurrenzfähig.
mr.dude schrieb:
Daran würde ich mich ansonsten erinnern.
Ich such dir das Slide raus.
=mr.dude schrieb:
Gerade im Mobilbereich sehe ich enormes Potenzial für Bulldozers CMT Design. Sozusagen ein "Dual-Core Light", kompakt und sparsam. Mehr brauchen die meisten Mobiluser auch in den nächsten Jahren nicht.
Oh ja :)

EDIT
Interlagos (Bulldozer) hat bei gleicher ACP 50% mehr Speed als Magny Cours (K10.5) halbieren wir die Modul Anzahl, dann ist Bulldozer (Zambezi) ca. 50% vor Phenom2 X6, ca. Westmere (Gulftown i7-980x) In Multithreading wird dann Sandy Bridge keine Chancen haben, 3DMark11, Vantage, Cinebench & Multicore Games usw. werden alle von Bulldozer profitieren können, bei AVX Code oder FMA4 ist dann AMD viel viel schneller als Intel
Wie kommst du auf +50%? Und "Multicore-Games" sehen derzeit Sandy Bridge meilenweit vor Thuban, sogar BC2, welches drastisch mit sechs statt vier Kernen zulegt. Stichwort "Pro/MHz", das mr.dude ja für vollkommen unwichtig erachtet. 3DMark11 und Vantage kann ich zudem nicht spielen, AVX hat SB auch.
 
Zuletzt bearbeitet:
Mal ehrlich, der hunderste Verweis auf den alten K10.5 in 45nm Fertigung ohne HKMG bringt uns auch zum hundersten Mal nicht weiter. Selbst wenn die Kern-IPC des Bulldozers gegenüber K10.5 nur moderat zugenommen hat, könnte die neue Architektur durch höheren Taktraten weitere Leistungsprünge machen. Wurde aber auch schon zum hundersten Mal erwähnt^^
 
Intel kann auch durch höhere Taktraten weitere Leistungssprünge machen. Das hilft AMD nicht viel weiter - einen "Taktkrieg" kann Intel mitgehen bis 125 oder gar 140 Watt. Pro/MHz wäre da eben eine sichere Bank - und nicht "nur" Kerne und Takt.
 
Wie kommst du auf +50%? Und "Multicore-Games" sehen derzeit Sandy Bridge meilenweit vor Thuban, sogar BC2, welches drastisch mit sechs statt vier Kernen zulegt. Stichwort "Pro/MHz", das mr.dude ja für vollkommen unwichtig erachtet. 3DMark11 und Vantage kann ich zudem nicht spielen, AVX hat SB auch.

laut JF-AMD 50% Speedup bezogen auf 8 Module vs. 12 Kerne im Server Specrate Bench.

jetzt halbieren wir die Module von 8 auf 4, also Zambezi vs. Thuban, hier gibt es mit großer wahrscheinlichkeit auch 50% Speedup in Multhitreading,

Turbo 2.0 & Power/Clock Gating gibt es auch noch ;) wenn ein integer aus einem Modul allein arbeitet & 1Ghz Turbo bekommt, dann ist auch die Singlethread Leistung höher als K10, 1 integer Core von Bulldozer ist sowieso mit Sicherheit schneller als ein K10 Core

3DMark11 & Vantage Tests gibt es doch immer bei CPU Tests, hier kann Zambezi sogar vor Westmere liegen, wir werden es sehen.
Sicher wird die IPC steigen, sonst brauchen wir kein Bulldozer, sonst hätte es auch ein K10 mit 10 Cores & 12MB L3 @3Ghz in 32nm geschaft ;)
 
Zuletzt bearbeitet:
Ich bin ja mal auf TC 2.0 gespannt, das ganze bisherige Turbo-Gedöns kann man in die Tonne treten.
1 integer Core von Bulldozer ist sowieso mit Sicherheit schneller als ein K10 Core
Zwei Threads pro Modul vs. K10-Dualcore war meines Wissens das Slide. Das ist ein Unterschied.

EDIT
Ja, Modul gegen K10-Dualcore und nicht Integer vs. Integer. BD würde hier zB durch die Flex-FPU gewinnen.

 
Zuletzt bearbeitet:
So Leute, ich denke es reicht mit dem OT. Wenn man sich mal dem Threadtitel widmet, kann man erkennen, dass es um die Bulldozer-Architektur selbst geht. Drum könnt ihr auch bitte beim Thema bleiben und nicht ständig abschweifen.
Des weiteren sind bitte diese Sticheleien zu unterlassen.
 
Zuletzt bearbeitet:
ist eigentlich schon bekannt wann erste overviews mit vorab benchmarks von CT oder Computerbase erscheinen? Oder machendie das nicht vor dem Offiziellen RLS?
 
So Leute, ich denke es reicht mit dem OT. Wenn man sich mal dem Threadtitel widmet, kann man erkennen, dass es um die Bulldozer-Architektur selbst geht. Drum könnt ihr auch bitte beim Thema bleiben und nicht ständig abschweifen.
Des weiteren sind bitte diese Sticheleien zu unterlassen.

Vielen Dank, dass du auch meine Posts mit Inhalt bzw Fragen zu der Architektur gelöscht hast. Ich habe hier (auch durch die vermeintlichen offtopic Posts) viel zu Bulldozer gelesen.
Der Threadtitel heisst im Übrigen "Bulldozer, New CPU Architecture" und nicht "Bulldozer Architecture Discussion". Einfach übersetzt steht da nur, dass es hier um den Bulldozer geht, welcher mit einer neuen Architektur aufwartet.
Es steht nicht dort, das dieser Thread nur explizit für die Architektur vorgesehen ist. Irgendwie kann man es mit dem Löschen auch übertreiben.

Aber da dieser Post auch wieder gelöscht wird ...
 
Vielen Dank, dass ihr euch einfach nicht an das Thema halten könnt. Irgendwann ist eben mal Schluss und dann folgt eben der Del-Button. Dein letzter Beitrag, den ich entfernt habe, hatte mit nichten etwas mit der neuen Architektur zu tun. Bleibt einfach beim Thema, unterlasst das sticheln und schon kann hier friedlich über die neue Architektur diskutiert werden, sofern es etwas neues zu diskutieren gibt.;)
 
ist eigentlich schon bekannt wann erste overviews mit vorab benchmarks von CT oder Computerbase erscheinen? Oder machendie das nicht vor dem Offiziellen RLS?
Vorab-Benchmarks gibt's bei AMD nicht. Zumindest nicht von Hardwareseiten. Ausführliche Benchmarks gibt's erst beim Launch bzw nach Ablauf des NDA. Wenn wir Glück haben gibt es ein paar Leaks im XS oder wo auch immer.
 
Intel kann auch durch höhere Taktraten weitere Leistungssprünge machen. Das hilft AMD nicht viel weiter - einen "Taktkrieg" kann Intel mitgehen bis 125 oder gar 140 Watt. Pro/MHz wäre da eben eine sichere Bank - und nicht "nur" Kerne und Takt.
Hmm, so einfach wird das nicht, Intel hat weder SOI noch UltraLow-K noch ein nagelneues Design mit feinem Clock-Gating.

V.a. Letzteres ist ja für die oft beworbenen +500MHz Turbo Mode 2.0 auf allen Kernen gut.

Da hat Intel erstmal nichts. Ein Taktkrieg würde damit wohl so enden wie damals AMDs 140W CPU. Ausgequetscht bis zum Ende, aber langsamer als das Konkurrenzprodukt mit weniger Watt. Ausserdem ist das bei Sandy eh ne schlechte Idee, da wurden ja 2 Pipelinestufen ggü. Nehalem eingespart, ergo wird da schnell das Ende der Taktfahnenstange erreicht werden.

Bisher liegt Intel dank 32nm HighK stromtechnisch weit vorne, von der IPC dank Nehalem/Sandyarch. ganz zu schweigen. Aber das bedeutet eben nicht, das jemand anders es nicht besser machen könnte :asthanos:

Das kann ganz schnell gehen, siehe K7 > P3 oder Core2 > K8.

Dagegenhalten könnte Intel höchstens durch nen vorgezogenen 22nm Start.
 
Zuletzt bearbeitet:
Hmm, so einfach wird das nicht, Intel hat weder SOI noch UltraLow-K noch ein nagelneues Design mit feinem Clock-Gating.
Seit wann braucht man das für schnelle Prozessoren?

Da hat Intel erstmal nichts. Ein Taktkrieg würde damit wohl so enden wie damals AMDs 140W CPU. Ausgequetscht bis zum Ende, aber langsamer als das Konkurrenzprodukt mit weniger Watt. Ausserdem ist das bei Sandy eh ne schlechte Idee, da wurden ja 2 Pipelinestufen ggü. Nehalem eingespart, ergo wird da schnell das Ende der Taktfahnenstange erreicht werden.
Bisher hat eher AMD nichts am Markt... mal sehen wie das dann in ein paar Monaten ausschaut wenn Bulldozer mal draussen ist. Man weiß ja im Prinzip nicht wie schnell die Dinger werden.
Die Sandys laufen ja auch mit verkürzter Pipeline in hohen GHz bereichen ganz gut, also da wär schon noch Spielraum nach oben.

Bisher liegt Intel dank 32nm HighK stromtechnisch weit vorne, von der IPC dank Nehalem/Sandyarch. ganz zu schweigen. Aber das bedeutet eben nicht, das jemand anders es nicht besser machen könnte :asthanos:

Das kann ganz schnell gehen, siehe K7 > P3 oder Core2 > K8.

Dagegenhalten könnte Intel höchstens durch nen vorgezogenen 22nm Start.

Welchen Einfluss HighK jetzt auf den Stromverbrauch hat weiß ich nicht, bzw. kann ich nicht abschätzen wie es ohne ausschauen würde. An den nm kann man das auf jeden Fall nicht fest machen... da hat ja Intel ein Paradebeispiel geliefert: Northwood->Prescott
 
Seit wann braucht man das für schnelle Prozessoren?
Stichwort Leckströme. ;) Der i7 2600K reizt die 95 W schon gut aus. Viel mehr ist innerhalb von 130 W auch nicht drin ohne neue Fertigung. Ich muss hier Opteron zustimmen, ob Sandy Bridge einen "Taktkrieg" mit Bulldozer mitgehen kann, ist anhand der bisherigen Infos noch lange nicht klar.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh