Glaub ich nicht. Auch wenn das wieder sehr vage Spekulationen sind, denke ich das y33H@ recht behalten wird.
Die IPC könnte, wie bei Athlon x2 6000+ zum AMD Phenom kaum oder gar nicht verbessert werden, das wurde imho im Artikel behandelt.
Ich sage es nochmal, Andreas spekuliert auch nur. Und zwar teils in die falsche Richtung.
Was sind denn nun generelle Merkmale der Bulldozer Architektur welche die IPC steigern sollen? Ich sehe da nach verschiedenen Analysen eher wenig Potenzial, eher Potenzial für ein Hochtaktdesign Richtung 5ghz.
Andersherum, was soll denn dafür sprechen, dass die IPC nicht steigt? Andreas macht es vor allem an zwei Punkten fest, den 2 ALUs und Latenzen. Ersteres ist kein wirklich handfester Beleg, da die Integer IPC in den meisten Anwendungen sowieso bei 1 liegt oder darunter. Darüber hinaus hat Bulldozer 2 AG
LUs, welche ebenfalls einige Integer Berechnungen übernehmen können. K10 hatte lediglich AGUs. Und Latenzen sind ohne die Auslastung der Pipeline zu kennen ziemlich spekulativ. AMD schreibt zB auf den Folien "shares latency-tolerant functionality". Was dafür spricht, dass man Latenzen auch nur dort erhöht hat, wo man eben Ressourcen teilt und wo Latenzen weniger Auswirkungen haben. Auf der anderen Seite spricht sehr viel für verbesserte IPC, wie der 4-fach OoO Ausführung, verbessertes Fetch/Prefetch, verbesserter Branch Predictor, verbesserter Cache, grösserer L2, Unified Scheduler, Branch Fusion, PRF, vollständig OoO Load/Store, mehr SIMD Ressourcen, SSSE3+, usw. Ein Trace Cache bzw RRC steht ja auch noch im Raum. Man könnte sicherlich noch mehr aufzählen. Kurzum, da steckt einiges an Potenzial drin. Man hatte ja ebenfalls erwähnt, dass für die höheren Taktraten keine IPC geopfert wurde.
Hm, ja, aber nur wenn BUlldozer auch 1 Modul für einen Thread nutzt und alle Ressourcen zur Verfügung hat.
Das reicht doch auch. Bei 2 Threads hat man eh einen grossen Vorteil mit CMT gegenüber der Konkurrenz mit SMT.
Aber bei der "krassen" Performancesteigerung frage ich mich ob Superpi beide integer units eines Bulldozer-moduls für die Berechnung nutzen kann !?
Bei Super Pi geht es eher um FP Performance. Zudem ist es single-threaded. Da laufen also auch beide Integer Kerne nicht gleichzeitig. Ausser Bulldozer beherrscht sowas wie Spekulatives Multithreading. Aber das hat AMD bisher immer verneint.
Die Befürchtung habe ich auch. Die Scores sind schon wieder zu gut.