[Sammelthread] AMD Bulldozer "New CPU Architecture" Sockel 942 AM3+ Sammelthread [Part 2]

Status
Für weitere Antworten geschlossen.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
OK, gut zu wissen. Es geisterte auch mal eine Meldung rum, wonach Llano pro Core nicht 100% der Leistung eines Propus haben, wurde glaube ich sogar direkt auf den X4 640 bezogen.
Das hatte mich dann etwas verwundert, weil wodurch sollten die IPC gegenüber Propus sinken? Und dank 32nm und Turbo 2.0 sollte der Takt eher noch deutlich steigen.
 
IPC = Instructions Per Cycle >> Instruktionen pro (Takt-) Zyklus
Könnte mir gut vorstellen, dass Llano wegen des fehlenden L3 eine geringere IPC hat als z.B. Deneb.

Um das auszugleichen braucht man einen höheren Takt. Den erreicht man in kritischen Anwendungen evtl. über Turbo 2.0
 
@Tigerfox
wegen der internen IGP & zusammenhang mit Cache muss die IPC nicht weniger ausfallen ;) und selbst wenn das Design 5% weniger IPC hätte, durch 32nm SOI + High K Metal Gates einsatz hat man mind. 20% mehr Taktspielraum als die aktuellen 45nm SOI Prozessoren :)
 
Mal ne frage zu den 4-3-2 modul BDs.
Sollte nicht die modulbauweise dazu dienen dass man sich bd-dies herschneidet wie man will? Ich meine das eine schließt das andere nicht aus bestimmt gibt es auch 4modul bd mit einem defekten modul aber bestimmt auch welche ohne^^.

Wäre dann eigentlich nicht auch ein 1 modul bd nicht Prädestiniert auch in dein Notebookmarkt zu kommen da sollte doch eine tdp von weniger als 25w ganz gut möglich sein:) und das ganze kann auch durch power gating ganz effizient werden oder ?
 
soll llano nicht niedrige frequenz bekommen und bei zu wenig threads die ipc dem anderen kern zur verfügung stellen?!

nein bull gibs nich mit einem modul
dafür gibs doch llano

find das ganze llano hier ganzschön OT
wie wärs mit einem weiteren Thread @ Duplex?
 
@Topas93
Orochi DIE = 4 Module (Zambezi, Valencia)

Der X6 wird auch das Orochi DIE benutzen, es wird einfach 1 Modul deaktiviert weil man kein 2. DIE braucht oder aber auch weil 1 Modul defekt sein kann.

Welches DIE die X4 benutzen ist noch unbekannt, entweder das Orochi DIE mit 2 deaktivierten Modulen oder ein natives 2 Modul DIE, dann könnte man auch das 2 Modul DIE um 1 Modul deaktivieren und auch 1 Modul / 2 Kerne in der 50-60 € Klasse anbieten :wink:
 
IPC = Instructions Per Cycle >> Instruktionen pro (Takt-) Zyklus
Könnte mir gut vorstellen, dass Llano wegen des fehlenden L3 eine geringere IPC hat als z.B. Deneb.

Um das auszugleichen braucht man einen höheren Takt. Den erreicht man in kritischen Anwendungen evtl. über Turbo 2.0

@Tigerfox
wegen der internen IGP & zusammenhang mit Cache muss die IPC nicht weniger ausfallen ;) und selbst wenn das Design 5% weniger IPC hätte, durch 32nm SOI + High K Metal Gates einsatz hat man mind. 20% mehr Taktspielraum als die aktuellen 45nm SOI Prozessoren :)

Es ging in der Meldung aber eben um die IPC von Llano vs. Propus, nicht Deneb. Das hatte mich verwundert.

Mal ne frage zu den 4-3-2 modul BDs.
Sollte nicht die modulbauweise dazu dienen dass man sich bd-dies herschneidet wie man will? Ich meine das eine schließt das andere nicht aus bestimmt gibt es auch 4modul bd mit einem defekten modul aber bestimmt auch welche ohne^^.

Wäre dann eigentlich nicht auch ein 1 modul bd nicht Prädestiniert auch in dein Notebookmarkt zu kommen da sollte doch eine tdp von weniger als 25w ganz gut möglich sein:) und das ganze kann auch durch power gating ganz effizient werden oder ?

Ich weiss nicht, ob Bulldozer1 in Nitebooks kommt, das ist erstmal nur Llano, der dann ja in der nächsten Generation auch "enhanced Bulldozer" basieren soll, also auch auf Modulen.
Und ich bin mir nicht sicher, ob der Aufbau in Modulen es einfacher macht, die CPU zu beschneiden. Dass ist ja erstmal nur ein toller Name für die Zusammenfassung von zwei Cores mit einer Flex-FPU.
Wenn man sich den Die-Shot so ansieht, kann ich mir schon vorstellen, dass ein "Abschneiden" von zwei Modulen recht einfach wäre, dann mit einem Teil des L3-Caches, während bei Abtrennung von nur einem Modul ein Winkelförmiger DIE entstünde.

find das ganze llano hier ganzschön OT
wie wärs mit einem weiteren Thread @ Duplex?

Gibt halt nach der CeBit wieder zu wenig News zu Bulldozer, da müssen wir das Thema etwas ausdehnen. :d Ne, hast eigtl. recht, wobei ich finde, dass Llano bezüglich der zukunft von Bulldozer interessant ist, zumindest was die Integration der Northbridge angeht.
 
Zuletzt bearbeitet:
Wäre dann eigentlich nicht auch ein 1 modul bd nicht Prädestiniert auch in dein Notebookmarkt zu kommen da sollte doch eine tdp von weniger als 25w ganz gut möglich sein:) und das ganze kann auch durch power gating ganz effizient werden oder ?
Definitiv. Sehe ich genauso. Gerade für mobile Geräte ist das CMT Design von Bulldozer klasse. Allerdings stehen dieses Jahr vor allem erstmal die "grossen" Bulldozer mit 4 Modulen und 8 Modulen als MCM Package für Desktop und Server auf dem Fahrplan. Nächstes Jahr wird Bulldozer dann aber auch im mobilen Markt Einzug halten. Mit einem Modul (teildeaktiviertes Dual-Modul Design?) lassen sich sicherlich sehr schöne Notebooks und Subnotebooks bauen. Für alle, denen ein Dual-Core Bobcat nicht ausreicht.
 
Nun ja ich bin ja mal eher auf bd2 gespannt :).
Potental hat bulldozer alle mal in jedem segment.
 
Nun ja bd vereint vieles (auf dem papier) effizienz,flexibilität und leistung.
Amd kann sehr viel aus bd herausholen. Sie können sich eigentlich ihr module her schneiden wie dsie möchten und die module sind auch noch relativ platzsparend und high-metal k gibt dem ganzen ein schön hohes takt potential. :)
und bd2 verfeinert das ganze sogar noch :d
 
Zuletzt bearbeitet:
Die HD 2900 XT sah auf dem Papier auch toll aus *gähn*
 
@y33H@:Ebenso wie die GTX480 und der Agena.

@mr.dude & Duplex: Soll heissen es gab schon genug Fälle wo Technik auf dem Papier im Vorfeld toll aussah, dann aber doch einige vorher nicht beachtete gravierende Nachteile hatte. Wobei ich das bei Bulldozer nicht befürchte. Er wird wohl kaum schlechter Takten als Thuban oder merh Energie im Verhältnis zur Fläche und Transistorzahl verbrauchen und dürfte unweigerlich ein bischen mehr IPC haben.
 
Zuletzt bearbeitet:
und was hat das mit AMD zu tun gehabt? Das war eine Eigenentwicklung von ATI ohne AMD :rolleyes:
Ist doch egal, bei dem Vergleich gings nur um den Gehalt von Papierdaten ...
Ob das nun Papier von AMD, ATi, Intel, Transmeta, oder Mercedes Benz war ist Wurst ;-)

Der Vergleich passt höchstens insofern nicht, dass die R500 auf dem Papier technisch gut war, das Problem aber die Software war. Bis AMD da auf die VLIW Architektur optimiert hatte, dauerte das.

Ist beim Thema BD viel harmloser, da altbekanntes x86. Softwareprobleme gibts nur bei FMA4/XOP bzw. Intelonly SSE4.1 Code. Harmlos ... solange GF keine Prozessprobleme hat, sollte alles ok sein. Einzigstes Architekturproblem ist vielleicht der kleine L1D Cache mit 16kB. Das gabs letztens ja nur beim P4, was schon etwas länger her ist. Aber dafür gibts ne Menge anderer Neuheiten.
 
Zuletzt bearbeitet:
nein es ist nicht egal
was hat AMD optimiert? selbst die 4870 & 5870 haben das gleiche VLIW-5 Konzept wie beim R600 2900XT, AMD hat nur die Shader um Faktor 2,5 55nm & Faktor2 40nm erhöht, DX10.1 oder DX11 sind keine Kunst, erst ab Cayman hat AMD die Shader als VLIW-4 geändert um weinger rücksicht auf Treiber nehmen zu müssen.
:btt:
zurück zum Thema Bulldozer

---------- Beitrag hinzugefügt um 20:32 ---------- Vorheriger Beitrag war um 20:18 ----------

Einzigstes Architekturproblem ist vielleicht der kleine L1D Cache mit 16kB. Das gabs letztens ja nur beim P4, was schon etwas länger her ist. Aber dafür gibts ne Menge anderer Neuheiten.
ich sehe hier kein Problem, dafür schaft das 2ALU+2AGU 17FO4 (15 Stufen Pipeline) Design 20-30% mehr Takt bei gleicher Spannung als K10 45nm, wurde doch schon im anderen Forum diskutiert, wenn es hier schwächen gibt, dann fällt der interne Takt höher aus ;)
 
Zuletzt bearbeitet:
Alle mit offenem Multi? Wofür steht das P in der Bezeichnung des 125 Watt Prozessors?
 
Ein Drei-Modul Bulldozer mit 95 Watt TDP hört sich sehr lecker an. Ich hoffe mal, daß er sich preislich nicht in zu hohe Höhen schwingt. :)
Wird DDR3-1866 denn überhaupt nötig sein oder würde man auch mit 1333er bzw 1600er gut fahren können? 1866er ist ja jetzt nicht grad das absolute Massenprodukt. :/
 
BD unterstützt DDR3 Speicher. Standard soll DDR3 1866 laufen. Ich gehe mal von einem erheblichen Leistungseinbruch aus, wenn man den DDR3 Speicher mit DDR3 1333 betreibt. Das sind bestimmt krasse 10 Minuten verlorene Zeit, bei 340 Tage am Stück entpacken. Wenn aber die Speicher Timings mehr bringen als der Takt, können es auch krasse 10 Minuten länger werden.
Der erhebliche Einbruch der Leistung durch den Einsatz von DDR3 1333 und nicht DDR3 1866, wird wohl auch damit dokumentiert werden, dass man sich bei den FPS Angaben in der Messtoleranz befindet.
 
harzer_knaller schrieb:
Alle mit offenem Multi? Wofür steht das P in der Bezeichnung des 125 Watt Prozessors?
Damits nicht untergeht - stelle mir grade dieselbe Frage.

@Techi
Aber nun ist es auch dafür ausgelegt.
Dh. werden wir IMC/Board noch mehr quälen können :d

@Plagiason
:confused:
sarcasm_detectorsi5p.jpg


Falls dem so ist bitte deutlich erkenntlich machen, sonst kommt es da noch zu missverständnissen.
zb. :rolleyes:
 
Die Positionierung ist merkwürdig, wenn sie stimmen sollte. Zu niedrig - wieso sollte man einen "8-Kerner" nur höchstens gleichauf mit dem 2600K sehen und nicht deutlich darüber in Richtung von 980X/990X?
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh