[Sammelthread] AMD Bulldozer - Next Generation new CPU Architecture - Sammelthread

Status
Für weitere Antworten geschlossen.
@Uriel
2 Module 4 Cores sind garantiert schneller als ein i7 Quad von Intel, AMD macht kein rückschritt sondern wird die Leistung steigern, der Sprung wird aufjedenfall größer als K8>K10
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
ganz einfach weil AMD noch am Takt, dem Turbo und der TDP feilen musste - ein einfach höher getakteter Istanbul hätte wahrscheinlich nicht ins 125Watt Fenster gepasst
Dann hast du ja verstanden, was ich sagte. Jeder Markt erfordert separate Produktlinien = höherer Entwicklungs- und Validierungsaufwand = mehr notwendige Ressourcen. Das gleiche galt für FX. War im Endeffekt nur nicht ertragreich.


Bulldozer wird nicht der teuerste Prozessor im Client Bereich. Die Server Modelle werden definitiv teurer, völlig unabhängig von FX. FX ist tot und wird mit Bulldozer nicht wiederkommen, auch nicht unter anderem Namen. Das letzte Modell war übrigens der FX-74. Und der wurde nach dem C2D gelaunched. Mit Leistungsfähigkeit hatte das also nichts zu tun. Es lag am hohen Validierungsaufwand und am dafür wirtschaftlich zu kleinen Markt. Deshalb starb FX und deshalb starb auch Quad FX, obwohl Quad FX als Plattform, exklusive der letztendlich eingesetzten CPUs, der Konkurrenz haushoch überlegen war, speziell was Skalierung betrifft.
 
Zuletzt bearbeitet:
... völlig unabhängig von FX. FX ist tot und wird mit Bulldozer nicht wiederkommen, auch nicht unter anderem Namen....

irgendwie kriege ich das gefühl nicht los, dass du neben dir 2 sachen liegen hast:
1. eine liste mit meinngen
2. ne knarre.

und jeder der was gegen die punkte auf der liste hat, hat ein problem....

derart verbissen sollte man solche sachen nur verteigen wenn man entwickel/vorgestellt hat oder für die firma arbeitet und in der abteilung für solche sachen als vorstand fungiert.
 
1 Modul = Dual Core
4 Module = 8 Threads

Wobei Dual Core bedeuten würde, man könnte den Prozessor in zwei vollständige Prozessoren "zerschneiden". Das geht beim BD nicht, da man dann nur einen vollständigen Prozessor und einen unvollständigen Prozessor hätte.

Siehe Wikipedia:

Der Begriff Mehrkernprozessor (auch Multicore-Prozessor oder Multikernprozessor) bezeichnet einen Mikroprozessor mit mehr als einem vollständigen Hauptprozessor auf einem einzigen Chip. Sämtliche Ressourcen mit Ausnahme des Bus und eventuell einiger Caches sind mehrfach vorhanden. Es handelt sich also um mehrere vollständige, weitgehend voneinander unabhängige Prozessoren inklusive eigener arithmetisch-logischer Einheit (ALU), Registersätze und, sofern überhaupt vorhanden, Floating Point Unit (FPU).

Als Doppelkernprozessor (auch Dual-Core-Prozessor) bezeichnet man einen Mehrkernprozessor mit zwei Hauptprozessoren. Mikroprozessoren mit einem Hauptprozessor bezeichnet man zur Abgrenzung als Einzelkernprozessor (auch Single-Core-Prozessor).

D.h. 1 Modul = Dual Core = AMD Marketing.

Natürlich ist ein Modul näher am Dual Core als am Single Core. Nur wären zwei echte - vollständige - Kerne halt noch einmal etwas anderes.

@Uriel
2 Module 4 Cores sind garantiert schneller als ein i7 Quad von Intel, AMD macht kein rückschritt sondern wird die Leistung steigern, der Sprung wird aufjedenfall größer als K8>K10

Da bin ich mal gespannt. Da der 2 Modul BD ein nicht-ganz-Quadcore ist und der i7 ein etwas-mehr-als-Quadcore, müsste ein (echter, vollständiger) Kern des BD gewaltig Gas geben im Vergleich zum i7. Im Prinzip steht inkl. CMT/SMT die Leistung von ca 3,6 vollständigen BD Kernen gegen die Leistung von ca. 5 vollständigen i7 Kernen.

D.h. ein einzelner vollständiger BD Kern (ohne den angehängten CMT Kern) müsste ca. 40% schneller sein als ein einzelner i7 Kern (ohne die angehängte SMT Schaltung).

Möglich ist das natürlich. Ich bin gespannt auf die ersten Vergleichstest. ;)
 
Zuletzt bearbeitet:
Das meine ich ja.
AMD verspricht etwas,und wir müßen erstmal abwarten.Wenn wir mal die vergangenheit uns mal so anschauen da wurde viel versprochen,aber in der tatsache sah es am ende ganz anders aus.
ich will ja nicht rum meckern aber so viel spekulationen und am ende ist es doch nur eine CPU die den Level3 Cache doch nicht so umsetzen kann wie es eigentlich in der Theorie sein sollte.

Bin aber mal gespannt,werde auf allefälle mal mich überraschen lassen.Was ich toll finde ist das AMD nicht immer den Sockel wechselt und doch bei den AM3 sockel bleibt bzw ihn neue CPUs baut.
 
der AMD K7 war den Intel P3 überlegen, der AMD K8 war den Intel P4 überlegen

laut JF-AMD Server Gruppe. wird Interlagos mit 16 kernen 80% schneller als Magny Cours mit 12 Kernen, die Desktop Versionen werden aber viel höher takten als die Server, ich denke ein BD Core wird mit Turbo min. 50% mehr Leistung als ein K10 Core haben, es dauert ja noch 1 Jahr
 
Zuletzt bearbeitet:
Das mag sein - aber ein Phenom II x2 ist bei gleichem Takt nicht schneller als eine Pentium G6950, der ein beschnittener i3 ist (kleinerer Cache, kein SMT). Link.
 
Da bin ich mal gespannt. Da der 2 Modul BD ein nicht-ganz-Quadcore ist und der i7 ein etwas-mehr-als-Quadcore, müsste ein (echter, vollständiger) Kern des BD gewaltig Gas geben im Vergleich zum i7. Im Prinzip steht inkl. CMT/SMT die Leistung von ca 3,6 vollständigen BD Kernen gegen die Leistung von ca. 5 vollständigen i7 Kernen.
Hmm ... also ich würde den 2 Modul BD eher mit nem 2 Kern Nehalem / Westmere / Sandy Bridge vergleichen. Wird von der Preisgestaltung her sicherlich auch auf sowas hinauslaufen.

Für die Intel SMT Quads gibts ja dann die 4 Modul/8Kern BD Version (Zambesi).
In dem Fall wird es eher interessant, wie sich die 6Kern Sandies mit SMT gegen die 8Kern Module schlagen werden, das wird wohl das Ethusiasten Segment für 2011 sein. Rein rechnerisch schaut es mit den aktuellen, (SMT freundlichen) aber gröbsten, ungenauen Daten so aus.
6*1,3 = 7,8 // Intel
4*1,8 = 7,2 // AMD

Am meisten wird dann am Ende davon abhängen wie gut die Software mit den Kernen skaliert, wie gut sich SMT/CMT schlägt, und auch wie am Ende die Taktfrequenzen aussehen. IPC ist natürlich auch wichtig, aber die Zahlen sind eh so ungenau, da kann man auch mal Pi*Daumen davon ausgehen, dass sie IPC ungefähr gleich wird ;-)

ciao

Alex
 
Dann hast du ja verstanden, was ich sagte. Jeder Markt erfordert separate Produktlinien = höherer Entwicklungs- und Validierungsaufwand = mehr notwendige Ressourcen. Das gleiche galt für FX. War im Endeffekt nur nicht ertragreich.

ich frag mich woher du das wissen möchtest? - wenn der FX nicht ertragreich war, warum gab es ihn dann so lange, und das teilweise auch noch auf einer deutlich teureren Plattform - siehe sockel940 ganz am beginn oder Quad FX

Das letzte Modell war übrigens der FX-74.

genau - der letzte verzweifelte versuch irgenwie gegen den Qxxxx zu bestehn bevor der totale Flop mit PhenomI kam

Deshalb starb FX und deshalb starb auch Quad FX, obwohl Quad FX als Plattform, exklusive der letztendlich eingesetzten CPUs, der Konkurrenz haushoch überlegen war

ich möchte wissen in welcher welt du lebst ... Quad FX war nix anderes als umbenannte Opterons ... Quad FX starb weil man schlicht auch mit einer Dual CPU Plattform nicht gegen den Qxxx ankam und der Stromverbrauch für dsktopverhältnisse astronomisch und jenseits von gut und böse war

mfg
 
D.h. ein einzelner vollständiger BD Kern (ohne den angehängten CMT Kern) müsste ca. 40% schneller sein als ein einzelner i7 Kern (ohne die angehängte SMT Schaltung).
Wie kommst du auf 40%? SMT bringt durchschnittlich etwa 20%. Man wird sehen, wie hoch ein 2-Modul Bulldozer takten kann. Denn alleine mit IPC wird man den Vorteil von SMT nicht wegmachen können. Ich halte aber wenig von diesem Vergleich. Der Konkurrent zu Bulldozer wird Sandy Bridge. Und am besten vergleicht man dann SMT-Kern mit Bulldozer Modul.

AMD verspricht etwas,und wir müßen erstmal abwarten.Wenn wir mal die vergangenheit uns mal so anschauen da wurde viel versprochen,aber in der tatsache sah es am ende ganz anders aus.
Nicht wirklich. AMD hat seine Ankündigungen meistens sehr genau eingehalten. Ausnahme sind unerwartete Probleme wie zB bei Barcelona. Aber das trifft auf andere Hersteller ebenso zu.
 
In dem Fall wird es eher interessant, wie sich die 6Kern Sandies mit SMT gegen die 8Kern Module schlagen werden, das wird wohl das Ethusiasten Segment für 2011 sein. Rein rechnerisch schaut es mit den aktuellen, (SMT freundlichen) aber gröbsten, ungenauen Daten so aus.
6*1,3 = 7,8 // Intel
4*1,8 = 7,2 // AMD

wichtig ist das Bulldozer 20-30% mehr IPC & höhere Taktraten als den K10 hat, +-50% mehr Leistung als K10 pro Core, dann sind die 4x1,8 ein Killer für Intel, wie wir wissen bringt Sandy Bridge nicht viel mit außer AVX, Native IGP & vielleicht 10% mehr IPC ;)
 
Ich wünschte mir das der Bulldozer nur halb so gut wird wie hier einige propagieren. Aber mich erinnert diese Schönrederei irgendwie an den Hype der gemacht wurde bevor der Phenom 1 das Licht der Welt erblickt hat. Und dessen Launch war ein ziemliches Desaster wie hier die meisten wissen. ;)
Vielleicht solltet ihr nicht so viel mit Prozentpunkten um euch werfen spondern erstmal abwarten was wirklich Sache ist.

Duplex du solltest dich umbenennen in mr.duplex. :lol:
 
Ich wünschte mir das der Bulldozer nur halb so gut wird wie hier einige propagieren. Aber mich erinnert diese Schönrederei irgendwie an den Hype der gemacht wurde bevor der Phenom 1 das Licht der Welt erblickt hat. Und dessen Launch war ein ziemliches Desaster wie hier die meisten wissen. ;)
Vielleicht solltet ihr nicht so viel mit Prozentpunkten um euch werfen spondern erstmal abwarten was wirklich Sache ist.

Duplex du solltest dich umbenennen in mr.duplex. :lol:

So schlecht war der Agena auch nicht, und spekulieren is doch schön, und auch nicht verwerflich:shot:
 
Ich wünschte mir das der Bulldozer nur halb so gut wird wie hier einige propagieren. Aber mich erinnert diese Schönrederei irgendwie an den Hype der gemacht wurde bevor der Phenom 1 das Licht der Welt erblickt hat. Und dessen Launch war ein ziemliches Desaster wie hier die meisten wissen.
Desaster kann man nicht sagen. Der Phenom I war gar nicht so schlecht. Das Desaster war eher, dass viele Leute die Zusammenhänge nicht verstehen und der TLB Bug auch noch unsinnig gehyped wurde. Was Agena gefehlt hat, war vor allem mehr Takt. Zu Beginn konnte man 2,3 GHz und später mit bis zu 2,6 GHz aufwarten. Da war die Konkurrenz schon länger bei 2,66 und 3 GHz. Bei Servern konnte man den niedrigeren Takt aufgrund der überlegenen Plattform-Architektur und anderen Workloads besser kompensieren.
Im Endeffekt war die Ursache die Fertigung, die auf den K8 Dual Core und hohe Yields ausgelegt war. Barcelona hingegen hätte einen SHP Prozess und bessere Cache-Packdichten benötigt.

All das ist mit Bulldozer nicht vergleichbar. Erstmal ist AMD mittlerweile in einer deutlich besseren Lage und hat seine Designteams schon länger besser koordiniert und aufgestockt. Zudem hat man den richtigen Fertigungsprozess mit 32 nm SOI/High-K (SHP), der sogar kleinere SRAM Zellen als die Konkurrenz ermöglicht (für zB mehr Cache auf gleicher Fläche).

Code:
--------------    Intel 45nm   Intel 32nm    AMD 45nm      IBM/AMD/FS 32nm

SRAM cell size    0.346 um2    0.171 um2     0.37 um2      0.149 um2
NMOS drive cur.   1.36 mA/um   1.55 mA/um    1.21 mA/um    1.55 mA/um
PMOS drive cur.   1.07 mA/um   1.21 mA/um    0.78 mA/um    1.22 mA/um

Und zuletzt ist Bulldozer eine komplett neue Architektur, die komplett anders performen kann als die bisherige. K10 war ja "nur" ein weiterentwickelter K8 und somit ein gewisses Grundverhalten vorprogrammiert.

Angesichts dessen darf man schon einiges erwarten. Allerdings wie immer, wer zu viel erwartet, wird am Ende nur enttäuscht. Von Schönrederei kann man bisher aber nun wirklich nicht sprechen. Ich sehe zumindest keine Aussagen, die über das Ziel hinausschiessen. Duplex mag mit der Aussage, ein 2-Modul Bulldozer wird schneller als ein i7 Quad, optimistisch sein. Aber fernab jeglicher Wahrscheinlichkeit erscheint mir das nicht. Schau dir doch mal alle Desktop Anwendungen an. Die wenigsten nutzen wirklich mehr als 4 Last-Threads. Schau dir zB den Vergleich von X4 925 und X6 1055T bei Computerbase an. Trotz theoretisch 50% mehr Rechenkapazität liegt der X6 im Gesamtrating nur 10% vorne. Am Ende wird es also hauptsächlich darauf hinauslaufen, wie 4C/4T mit Bulldozer gegenüber 4C/4T mit i7 performen. Und dass Bulldozer mit 32 nm bezüglich Takt Vorteile haben sollte, sollte klar sein. Aber wie gesagt, ich halte wenig von dem Vergleich. Der Konkurrent heisst dann Sandy Bridge.

In dem Fall wird es eher interessant, wie sich die 6Kern Sandies mit SMT gegen die 8Kern Module schlagen werden, das wird wohl das Ethusiasten Segment für 2011 sein. Rein rechnerisch schaut es mit den aktuellen, (SMT freundlichen) aber gröbsten, ungenauen Daten so aus.
6*1,3 = 7,8 // Intel
4*1,8 = 7,2 // AMD
Wenn schon, dann würde ich die Rechnung detaillierter machen. Ich glaube, die Sache mit der Skalierung und den von AMD genannten 80% wird immer noch falsch verstanden. Grundsätzlich hat jeder Multicore Prozessor eine bestimmte Skalierung von 1 auf N Kernen. Nennen wir diese X. Die Formeln schauen dann wie folgt aus (Faktor 1,25 durchschnittlich für SMT halte ich bei Sandy Bridge schon für recht optimistisch):

6 * 1,25 * X // Intel
4 * 1,8 * X // AMD

Ohne diese Skalierung für die jeweilige Architektur zu kennen, kommen wir da nicht viel weiter. Hinzu kommt, dass die 80% sehr nach konservativem Marketing klingen. Siehe die Performance Charts zu Bulldozer. Oder auch volle FPU bzw AVX Workloads berücksichtigend. Bei aktuellen Anwendungen erwarte ich aber eher eine vergleichbare Skalierung wie aktuelle Dual Cores. Schau dir zB Cinebench an. Dual Cores haben dort idR einen Speedup von >1,9, also >95% Skalierung. Das Szenario, dass die Skalierung am Ende "nur" 80% oder ähnlich beträgt, möchte ich zwar auch noch nicht ausschliessen. Dann sollte die IPC eines logischen Prozessors aber deutlich gestiegen sein. Halt was ein 2x 4-fach Frontend und die Ausführungseinheiten so hergeben.
 
Zuletzt bearbeitet:
Wie kommst du auf 40%? SMT bringt durchschnittlich etwa 20%. Man wird sehen, wie hoch ein 2-Modul Bulldozer takten kann. Denn alleine mit IPC wird man den Vorteil von SMT nicht wegmachen können. Ich halte aber wenig von diesem Vergleich. Der Konkurrent zu Bulldozer wird Sandy Bridge. Und am besten vergleicht man dann SMT-Kern mit Bulldozer Modul.

Ich wollte den BD gar nicht vergleichen - denn ich gebe offen zu: ich weiß noch nichts validiertes über seine Performance.

Aber ich habe diese - in meinen Augen sehr gewagte - These gelesen...

2 Module 4 Cores sind garantiert schneller als ein i7 Quad von Intel, ...

...und wollte sie einfach nur kritisch hinterfragen bzw einer Prüfung auf logische Konsitenz auf Grundlage der vorhandenen Informationen unterziehen.

Die 40% ergeben sich aus einer logischen Verknüpfung der hier aufgeschnappten Informationen:

Leistung eines vollständigen BD Kerns = X
Leistung eines vollständigen i7 Kerns = Y

X ist ungleich Y, die absolute Größe von X und Y sind unbekannt, was im folgenden aber keine Rolle spielt

Anzahl Kerne i7 Quad = 4 + SMT = rechnerisch 4 + 4x0,25 = 5 rechnerische (vollständige) Kerne vom Typ y

Anzahl Kerne 2 Modul BD = 2 + CMT = rechnerisch 2 + 2x0,8 = 3,6 rechnerische (vollständige) Kerne vom Typ x

5 / 3,6 = 38,888888888...% = ca. 40%

---------- Beitrag hinzugefügt um 01:41 ---------- Vorheriger Beitrag war um 01:26 ----------

Ohne diese Skalierung für die jeweilige Architektur zu kennen, kommen wir da nicht viel weiter. Hinzu kommt, dass die 80% sehr nach konservativem Marketing klingen. Siehe die Performance Charts zu Bulldozer. Oder auch volle FPU bzw AVX Workloads berücksichtigend. Bei aktuellen Anwendungen erwarte ich aber eher eine vergleichbare Skalierung wie aktuelle Dual Cores. Schau dir zB Cinebench an. Dual Cores haben dort idR einen Speedup von >1,9, also >95% Skalierung. Das Szenario, dass die Skalierung am Ende "nur" 80% oder ähnlich beträgt, möchte ich zwar auch noch nicht ausschliessen. Dann sollte die IPC eines logischen Prozessors aber deutlich gestiegen sein. Halt was ein 2x 4-fach Frontend und die Ausführungseinheiten so hergeben.

Ich bin bei meinen Berechnungen der Einfachheit halber sowohl bei Intel als auch bei AMD von einer Skalierung in Höhe von 100% ausgegangen. D.h. ich habe angenommen, dass ein echter Dual-Core, der aus zwei vollständigen Cores besteht 100% + 100% also 200% Leistung bringt.

Ein Intel Kern plus SMT ist allerdings genausowenig ein Dual-Core wie ein BD Modul ein Dual-Core ist. Es sind in beiden Fällen keine zwei vollständigen Cores, deshalb habe ich die Faktoren i.H.v. 125% für einen Intel Core + SMT und 180% für eine BD Modul angenommen. Die Faktoren beziehen sich jeweils auf einen vollwertigen Core des Anbieters als Basis (keine Skalierung im Sinne von Nutzung der Multicores durch Anwendungen!) - also auf einen i7 Kern ohne SMT bzw den einen vollwertigen Kern, der in einem BD Modul steckt.

Die +40% muss ein vollwertiger BD Kern schneller sein, allein um die höhere Anzahl der rechnerisch vollwertigen Kerne des i7 auszugleichen. Wie er das macht, ist völlig egal.

Angenommen ein vollwertiger BD Kern wäre bei gleichem Takt so schnell wie ein vollwertiger i7 Kern, dann müsste der BD nur 40% höher als der i7 getaktet sein und schon wäre die These von Duplex richtig (2 Modul BD garantiert schneller als ein i7 Quad).

Angenommen beide takten gleich schnell, dann müsste der BD nur über eine um +40% höhere Effizienz pro Takt (IPC whatever) verfügen als der i7 und die These von Duplex wäre richtig.

Natürlich kann es auch eine Kombination aus beidem sein.

Was der Fall ist, kann ich bei der derzeitigen Informationslage noch nicht beurteilen.

Mit der Skalierung der Anwedungen auf Multicores habe ich mich noch gar nicht beschäftigt. Naja, gar nicht stimmt nicht ganz, denn es ist jedenfalls kein Zufall, dass ich mir vor kurzem einen Dual-Core und keinen x3, x4 oder x6 gekauft habe... ;)
 
Zuletzt bearbeitet:
Hinzu kommt, dass die 80% sehr nach konservativem Marketing klingen. Siehe die Performance Charts zu Bulldozer. Oder auch volle FPU bzw AVX Workloads berücksichtigend.

Bei starker AVX-Nutzung wird die 256Bit-FPU eines Moduls bereits von einem einzigen Kern benötigt, der Gewinn durch CMT geht in einem solchen Beispielszenario gegen 0.
 
Es wird wohl darauf hinauslaufen, dass man einen 4-Module-BD mit einem 4-Kerne-SB vergleichen wird. Das liegt nicht zuletzt an den Tonnen Intel-Optimierter-Benchmarksoftware, die ganz sicher wieder in die ganzen Reviews einschleichen wird. Wie BD hierauf reagieren wird, ist kaum vorherzusehen.
Zudem würde ich den BD ganz unabhängig vom K10 betrachten. Jetzt zu spekulieren, ob man es schaffen kann, 50% mehr Leistung aus einer neuen Architektur rauszuholen bringt irgendwie nix. Man muss schon beachten, was man überhaupt miteinander vergleicht. Einen 32nm-HKMG-BD mit einem 45nm-K10?
Man darf nicht außer Acht lassen, was das für Fortschritte sind. Allein der neue Fertigungsprozess ist ein wahnsinns Sprung. Man sieht ja, was schon ULK gebracht hat. Jetzt kommt auch noch HKMG hinzu - einen Vorteil, den Intel schon seit dem Penryn hat und natürlich die kleinere Strukturbreite.
Fest steht, dass alleine dieser Fertigungsprozess sehr viel bringen wird (20-30%? Wenn wir also einen BD in 45nm SIO mit einem in 32nm SOI vergleichen würden).
Hinzu kommt die neue Architektur, die bisher sehr potent aussieht. Ich glaube schon, dass man einiges erwarten darf. Natürlich wird ein 8-Kern-BD keinen 8-Kern oder 6-Kern-Sandy schlagen, aber ich erwarte schon, dass er das Zeug dazu haben wird, einen 4-Kern-Sandy zu schlagen.
 
Zuletzt bearbeitet:
Hinzu kommt die neue Architektur, die bisher sehr potent aussieht. Ich glaube schon, dass man einiges erwarten darf. Natürlich wird ein 8-Kern-BD keinen 8-Kern oder 6-Kern-Sandy schlagen, aber ich erwarte schon, dass er das Zeug dazu haben wird, einen 4-Kern-Sandy zu schlagen.

So wie es im Moment aussieht, würde ich einen 4-Modul Bulldozer eher mit einem 6 Kern Sandy Bridge vergleichen. Natürlich ähnliche Taktraten vorausgesetzt.

Wenn SMT ca. 25% bringt wäre das 6*1.25 = 7.5
Und wenn CMT ca. 80% bringt wäre das 4*1.8 = 7.2

Doch da fällt gleich noch ein Sprichwort ein: "Wenn das Wörtchen wenn nicht wär" ;)
 
Ich bin bei meinen Berechnungen der Einfachheit halber sowohl bei Intel als auch bei AMD von einer Skalierung in Höhe von 100% ausgegangen. D.h. ich habe angenommen, dass ein echter Dual-Core, der aus zwei vollständigen Cores besteht 100% + 100% also 200% Leistung bringt.
In der Theorie mag das toll klingen. Die Praxis schaut aber leider etwas anders aus.

Ein Intel Kern plus SMT ist allerdings genausowenig ein Dual-Core wie ein BD Modul ein Dual-Core ist.
Dass ein Intel Kern kein Dual Core ist, sollte klar sein. Bei einem Bulldozer Modul kann man aber schon von einem "optimierten Dual Core" sprechen. Jeder Kern hat seine eigenen Ausführungseinheiten (Int + 128-bit FMAC). Der gemeinsam genutzte L2 darf zudem kein Kriterium sein, sonst wäre der C2D auch kein Dual Core gewesen. Oder warum soll es konkret kein Dual Core sein? Und selbst wenn du auf die 256-bit Unterstützung für AVX anspielst, wo ja nur ein Kern zur selben Zeit vollen Zugriff auf die FPU hat, das darf kein Kriterium sein. Befehlssatzerweiterungen dürfen nie ein Kriterium für das grundsätzliche Design sein. Darüber hinaus wirst du selbst mit AVX eine Skalierung wie ein Dual Core haben. CMT wird also auch hier voll greifen. Siehe dazu auch die Aussagen vom Analyst Day.
 
Zuletzt bearbeitet:
So wie es im Moment aussieht, würde ich einen 4-Modul Bulldozer eher mit einem 6 Kern Sandy Bridge vergleichen. Natürlich ähnliche Taktraten vorausgesetzt.

Wenn SMT ca. 25% bringt wäre das 6*1.25 = 7.5
Und wenn CMT ca. 80% bringt wäre das 4*1.8 = 7.2

Doch da fällt gleich noch ein Sprichwort ein: "Wenn das Wörtchen wenn nicht wär" ;)


Bei deiner Rechnung gehst du allerdings von identisch schnellen Kernen (ohne CMT/SMT) aus. Zu diesem Punkt wissen wir bisher leider noch gar nichts...

Darüber hinaus wirst du selbst mit AVX eine Skalierung wie ein Dual Core haben. CMT wird also auch hier voll greifen.

Definitiv nein. Du hast für einen 256Bit AVX-Befehl nuneinmal nur eine Ausführungseinheit pro Modul.
 
Zuletzt bearbeitet:
Für denjenigen, der jetzt schon wieder solchen Unsinn behauptet, CMT würde bei AVX nichts bringen, dem kann ich nur empfehlen, sich mit Maschinencode und OoO auseinanderzusetzen. :rolleyes: CMT wird auch mit AVX voll greifen.
 
Ich weiß worauf du anspielen möchtest, aber schau dir doch mal SMT in FPU-lastigem Code an. ;) Bei starker FPU-Belastung, Paradebeispiel also 256Bit AVX-Befehlen, kann CMT prinzipbedingt kaum vergleichbare Vorteile bringen wie bei Int-Operationen.
 
SMT ist damit nicht vergleichbar. SMT hat keine doppelten Int Einheiten. Und diese sind ausschlaggebend (-> Adressberechnung). Hinzu kommt, dass Bulldozer für jeden der Int Cluster und die FPU separate Scheduler hat. Sicherlich ist es wahrscheinlich, dass mit SSE Code CMT mehr bringt als mit AVX Code. Aber dass CMT mit AVX nichts bringt, ist schlichtweg falsch. Wie gesagt, die 80% werden schon AVX berücksichtigen. Ohne AVX erwarte ich eher eine höhere Skalierung, >90%.
 
Zuletzt bearbeitet:
Natürlich entfällt in keinem realen Szenario die Int-Last völlig, aber sie kann bei entsprechendem Code sehr schnell nicht mehr limitierend sein. Letztlich werden wir in AVX-Szenarien wohl keine völlig Einflusslosigkeit von CMT sehen, sicherlich aber auch keine 80% Gewinne wie sie bei starker Int-Last auftreten könnten. Nicht vergessen: Die 80% sind eine Marketingzahl, wie wir sie bereits von Phenom I/Phenom II oder auch älteren Fällen kennen. Und jeder weiß, wie da schöngerechnet wird. ;)
 
Zuletzt bearbeitet:
OK die SMT & CMT Diskussion reicht jetzt, ich kann das nicht mehr hören...

wichtig ist wie schnell wird ein Bulldozer Core eines Moduls

Die Tester werden garantiert ein BD Core mit einem Intel Core in der Praxis vergleichen.

Die Marketing Bezeichnung ist scheiss egal, entweder schafft es AMD Intel zu überbieten oder nicht, wenn es nicht reicht muss ein neuer Desktop Sockel mit mehr Pins her damit mehr Module auf einem DIE passen.
 
Richtig, bei Barcelona kennen wir die 40/10 Aussage bezüglich specrate. Tatsächlich waren es aber eher 50/20. Ebenso bei Magny Cours, hier wurde von 60% gesprochen. Tatsächlich waren es aber eher 80%. Genauso ist auch die 80% Aussage bezüglich Bulldozer zu werten. Sie ist konservativ und wird auch mit AVX nicht obsolet.
 
Die Marketing Bezeichnung ist scheiss egal, entweder schafft es AMD Intel zu überbieten oder nicht, wenn es nicht reicht muss ein neuer Desktop Sockel mit mehr Pins her damit mehr Module auf einem DIE passen.

Jep, Marketing ist halt einfach nur Marketing - entsprechend sollte man damit umgehen da man weiß, was hier dahintersteht - das gilt für Namen wie auch für Zahlen oder sonstige Versprechungen. ;) An einen Sockel G34 bzw. evntl. Nachfolger dessen für den Desktopbereich würde ich allerdings nicht glauben - das wäre Overkill und setzt sich am Markt auch nicht durch, noch schnellere Steigerungen der Kernzahlen bei gleichzeitig weniger Takt wären eher kontraproduktiv. 4 Module als Spitze des Portfolios sollten einen guten Kompromiss aus Taktbarkeit und Kernzahl für die 32nm Fertigung darstellen, wenn wir das Consumersegment betrachten. :)
 
Der Socket FM1 hat mehr Pins als AM3, evtl. könnte AMD 6 Module auf einem DIE bauen

Bulldozer 6x1.8=10.8
Sandy Bridge 8x1.3=10.4

G34 mit 1944 Pins ist nur für 8 Module 16 Cores nötig
 
Sry für OT: Wie lange hat AMD den eigentlich noch das "Pin system"?
Intel setzt ja auf Kontaktflächen anstatt Pins. Ist doch irgendwie Deppensicherer (schräg "reinpressen" ect)
Höhrt doch bitte auf CMT als Hauptsteigerung der BD's zu den Phenoms anzusehen!
lg
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh