Haswell setzt auf Breite, nicht auf Sparsamkeit. Es ist der "verzweifelte" Versuch noch mehr aus SMT herauszubekommen bei möglichst wenig IPC-Verlust. Das Backend verbreitern bringt der IPC nichts, da dort kein Engpass liegt im SingleThreading, nur SMT wird damit besser, weil man Engpässe und Blockaden verhindert. Ich sehe Haswell eher als "SMT-Fix", sodass SMT in jeder Lebenslage nachteilsfrei nutzbar ist. Dennoch ist die Technlogie der superdicken Kerne langfristig eher eine Sackgasse. Die Zukunft liegt darin, möglichst viele Transistoren einzusparen bei möglichst wenig IPC-Verlust. Intel macht derzeit das Gegenteil, nutzt seinen Fertigungsvorteil aus (22nm FinFET) und garniert das Ganze mit weiteren Stromspartechniken um Idle und Teillast weiter zu optimieren, während AMD dazu gezwungen ist, schon die IPC zu beschneiden um Transistoren einzusparen. BD ist die erste Ausprägung der neuen Strategie, war aber fehlerhaft, erst Piledriver ist Version 1 Final gewissermaßen. Der Weg ist durchaus gangbar, Piledriver ist zwar nicht wirklich konkurrenzfähig, was aber in erster Linie an der Fertigung liegt. Würde man Piledriver auf 22nm FinFET umsetzen wär das Bild ein ganz anderes.
Ich vermute auch, dass AMD daran arbeitet gleich 4 Threads in ein Modul hineinzubekommen. Letztendlich wird das auf Designs hinauslaufen, bei dem Frontends und Backends flexibel zugeteilt werden können und man dadurch einige Einheiten, vor allem die Stromfressenden und Transistorreichen, einsparen kann. Das hätte auch den Vorteil, dass man die HSA-GPU gewissermaßen als "Backenderweiterung" mitnutzen kann. Die Zukunft liegt in der Flexibilisierung der CPU-Bestandteile, native Nutzbarmachung der Parallelfähigkeiten der Grafikchips und maschineller Transistoreinsparung- und optimierung bei längerfristig laufenden Fertigungszyklen.
Hinzu kommt auch noch eine Überlegung, die man angesichts der neuen Konsolen anstellen sollte: Diese forcieren jetzt knallhart die Optimierung der Spiele auf 8 Threads. Das ist eine neue Qualität, da Jaguar ungefähr auf Core2-Niveau ist (mit seinen 2 Issues wohlgemerkt, das ist ne Leistung), aber eben mit maximal 2GHz laufen dürfte. Das ist eine Kombination aus recht wenig IPC, weil wenig Takt, und viel Multithreading. Natürlich wird das auch auf die PC-Spiele abfärben, erst recht, wenn man bedenkt, wie M$ sich die Spieleentwicklung und der Integration der XBox-Techniken auf der PC-Plattform anschaut. Das bedeutet, dass in Zukunft mehr Spiele reagieren könnten wie Crysis3 reagiert hat, nämlich problematisch auf SMT bei Nutzung von 6-8 kohärenten Threads.
Anwendungen, sofern man auf BD halbwegs Rücksicht genommen hat, laufen ja jetzt schon konkurrenzfähig schnell. Und das alles muss man angesichts eines aufkommenden Steamroller sehen, der BD Vers.2, also optimiert, in neuem Fertigungsprozess daherkommt.