Oder Aufpreis zahlen und bei Intel fertigen lassen.. In 22nm Bulk ohne 3D-Gate. Ginge das technisch überhaupt?
Das ginge schon, macht nur keinen Sinn. Dafür müsste AMD das Transistordesign umkrempeln. Bis das fertig und validiert ist, ist 22 nm vermutlich schon wieder Schnee von gestern.
Steht da nicht OR-CO, also Orochi im C0 Stepping. Stand es beim anderen Screen vom FX8.... auch schon.
Ja, stand es. Das ist aber eher nebensächlich. Das baut sich CPU-Z aus den vorhandenen Infos selbst zusammen. Viel wichtiger sind die "Model" und "Ext. Model" Felder. Diese Infos kann man direkt aus dem Prozessor mittels CPUID lesen. Und die bisherigen technischen Unterlagen besagen folgendes:
Model 00h-0Fh = Bulldozer
Model 10h-1Fh = Trinity (Piledriver)
Model 20h-2Fh = Vishera (Piledriver)
Model 2 müsste also nach wie vor die erste Bulldozer Generation (Orochi) sein. Rev-C wäre dann auch plausibel.
Auffallend ist ja, das die Llano CPUs scheinbar problemlos VCore technisch nach unten gehen. Ich weis nicht, wie es genau auf dem Markt ausschaut, aber ich lese haufenweise Meldungen, das die User selbst dort die Spannung nach unten korrigieren und das ohne Schmerzen läuft.
Ich kann dir nicht sagen, wie die Fertigungstoleranzen allgemein ausschauen. Ich merke nur bei meinem Exemplar, dass um die 3 GHz Spannungen notwendig sind, die langsam weh tun, was die Effizienz betrifft. Für stabile 2,8 GHz sind etwa 1,15-1,175 VID notwendig. Wobei es sein kann, dass mein Board untervoltet. CPU-Z zeigt jedenfalls etwas weniger Spannung an. Für stabile 3,2 GHz sind dann schon etwa 1,225-1,25 VID notwendig. Nach unten mag eine solche Spannungsskalierung gut sein. Nach oben fällt sie dir halt auf die Füsse, wenn du eine bestimmte Taktrate erreichen willst. Allzu viele Reserven spannungstechnisch scheinen über 3 GHz jedenfalls nicht vorhanden zu sein. Erst recht, wenn man sowieso grosszügiger Reserven einplanen muss, damit die Yields passen.
Ich denke AMD hätte da ggf. mit ein wenig Willenskraft schon was schaffen können. Ggf. halt, wenn gar nix hilft, das 8 Kern Teil mit 140W einstufen und dann die kleineren Modelle (sprich weniger Takt) mit 100/125W.
Wie gesagt, mit Feintuning wäre sicherlich ein 3 GHz 8-Kerner in 32 nm nicht unrealistisch. Magny Cours mit 8 Kernen hat in 45 nm immerhin 2,6 GHz geschafft. Nur, anhand der Messergebnisse weiter vorne würde ich sagen, über 3 GHz geht nicht mehr viel. Und ob so ein Chip dann wirklich besser als Bulldozer wäre, wage ich zu bezweifeln. Aber solche Vorstellungen kommen halt raus, wenn Leute einfach nur stur auf irgendwelche nichtssagenden Benchmarkbalken gucken. Das grösste Problem von Bulldozer ist nicht die Hardware ansich. Auch wenn es da sicherlich noch Kinderkrankheiten gibt, die mit den kommenden Generation ausgemerzt werden müssen. Das grösste Problem für Bulldozer ist im Moment die Software. Anwendungen wie C-Ray zeigen ja, dass mit entsprechender Optimierung mal locker die doppelte Performance eines X6 drin ist. Was soll da ein "X8", mit womöglich sogar geringerem Takt als der aktuelle X6, gross ausrichten? Selbst in bekannteren Benchmarks wie Cinebench würde Bulldozer den X6 locker abziehen, wenn der softwareseitige Support einfach besser wäre. Aber das Thema hatten wir schon zur Genüge und dass Cinebench explizit für Intel optimiert wird. Da bleibt halt die Optimierung für AMD Chips auf der Strecke.
Die Frage ist halt, inwieweit das zuküftig strategisch gewesen wäre. So zumindest wäre bei 8 Cores wohl schluss gewesen. Im Serverbereich dann nen 2x8 Core 32nm K10 zu bringen, quasi als aufgebohrer MagnyCours wäre wohl unmöglich.
Unmöglich nicht. Aber man hätte halt recht niedrige Taktraten gehabt. Vermutlich um die 2 GHz. Eventuell auch etwas mehr. Die Serverchips gehen ja bis 140 W TDP.
Ja aber warum sollte man sich bei AMD eine Art Technik wie SMT "ans Bein binden"?
Die Übergänge zwischen den Techniken sind teilweise fliessend. Auch Bulldozer besitzt Teile, die SMT-like implementiert sind. Die Frage sollte vielleicht lauten, warum sollte AMD ausschliesslich auf SMT setzen? Die Antwort, weil CMT einfach besser skaliert. Die jetzige Aufgabe sollte aber eher sein, die vorhandenen Flaschenhälse auszumerzen, dass auch singlethreaded das vorhandene Potenzial der Pipeline ausgeschöpft werden kann.
Nur passt auch das wie gesagt absolut nicht zum aktuellen Desktopmarkt. Wie man wunderschön sieht, wird das Thema Multithreading beim Desktopmarkt immernoch stiefmütterlich behandelt. So gesellt sich ein popliger Intel Dualcore mit von dir angesprochenem "Witz SMT" in vielen Anwendungen schon ähnlich schnell bzw. teils schneller als aktuelle AMD CPUs mit besserem Ansatz zum Thema Multithreading, und somit teils gar doppelt so vielen "starken" Threadeinheiten.
Nur was bringt es, wenn die Software damit nix anfangen kann? -> nichts...
Naja, das Problem sehe ich eher darin, dass Tests von einzelnen Anwendungen idR keine realen Systeme wiedergeben. Ist ja schön und gut, wenn ein Dual-Core bei einer Anwendung mit maximal 2 Lastthreads gut dasteht. Nur kann auf einem realen System mehr als lediglich eine Anwendung mit maximal 2 Lastthreads laufen. Ich kann mich dunkel erinnern, dass das mal ein Seite ansatzweise beim Phenom I unter die Lupe genommen hatte. Könnte Anandtech gewesen sein. Macht aber ansonsten kaum jemand, leider.
Wäre es nicht denkbar, die CPUs mit unterschiedlicher Spannung zu verkaufen? Die, die weniger brauchen als EE (energy efficient) edition und die anderen eben mit 125 oder 140W. Für die EE kann man dann noch vielleicht 10% mehr verlangen.
Das macht man schon. ZB den Opteron 6128 gibt's als normale und als HE Version. Einmal mit 115 W und einmal mit 85 W TDP.
Ich frag mich eigentlich ob ein Phenom III Achtkerner überhaupt nötig wäre. Intel bietet doch im Desktop-Markt auch nur 4 starke plus vier schwache Threads an im obersten Bereich und das verkauft sich sehr gut. Sowas wie SMT dürfte AMD ja auch basteln können. AMDs aktuelle Threads sind alle gleich stark, aber die Rechnung geht ja offensichtlich nicht so ganz auf.
Intel bietet genauso wenig "4 starke plus vier schwache Threads" wie AMD "alle gleich starke" Threads. Konzeptionell betrachtet haben beide 4 physische Kerne, die jeweils 2 logische Prozessoren zur Verfügung stellen. Welche Performance dann ein logischer Prozessor liefert, hängt vom Workload bzw der Auslastung ab. Läuft lediglich ein Thread auf einem physischen Kern, dann ist die Pro-Thread Performance höher als bei zwei Threads auf einem physischen Kern. Das gilt sowohl für AMD als auch Intel. Laufen zwei Threads auf einem physischen Kern, sollten beide Threads etwa gleich schnell laufen. Auch das gilt sowohl für AMD als auch Intel. Der eigentliche Unterschied ist ein anderer. Während Intels Pipeline lediglich auf VMT (Vertikales Multithreading) setzt, um mit einem weiteren Thread die Auslastung der vorhandenen EUs zu erhöhen, setzt AMDs Pipeline auf VMT und HMT (Horizontales Multithreading), um mit zusätzlichen EUs die Performance eines weiteren Threads zu erhöhen. Der Ansatz und das Ergebnis sind also verschieden. Oberflächlich betrachtet ist die Arbeitsweise beider Threads aber sehr ähnlich.