Kommt AMDs neue Architektur „Steamroller“ im Jahr 2014?

Naja, das heißt ja nicht zwingend, dass mit Steamroller nicht auch IPC oder Takt steigen. Man geht mit Steamroller ja auf 28nm das lässt ja Luft für solchen Spaß. ;) Ansonsten dürfte die IPC grob auf Phenom II-Level sein, vielleicht etwas dadrüber.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Na dann hast du zu mindest deine Antwort. ;) Mit dem hohen Takt und moderneren Befehlssätzen der FXs kommst du aber grob auf die gleiche Singlethread-Leistung oder etwas drüber wie bei den Phenoms. ;)

P.S.: Weiß meinst du wohl warum ich immer sage, das Intel so schnell nicht Bange wird? :d Nicht weil das meine Lieblings-Firma ist, sondern, weil die einen immensen Vorsprung haben...^^
 
Zuletzt bearbeitet:
Steamroller wird mehr auf Mutithreading getrimmt soll das heißen. ;) Bekommt ja jedes Modul eine zweite FPU. Was da bei Excavator steht ist quasi ein dummy für "Wird besser", das IPC oder Takt steigen ist wohl logisch, aber die Folie selbst ist auch älter als 2013, die gab es letztes Jahr genauso auch schon...

Bitte was? eine zweite FPU?
Hier mal das Blockdiagramm:
Bulldozer v Steamroller | PC Gamer

Bei steamroller wird das Frontend breiter mit 2 decoder. Man bewegt sich damit zwar etwas vom ursprünglichen Modulgedanken weg aber der Decoder bei Bulldozer war zu langsam.

Hier auch noch etwas zum nachlesen:
AnandTech | AMD's Steamroller Detailed: 3rd Generation Bulldozer Core
 
also für gamer wird der steamroller dann wohl nicht wirklich interessant bis auf den 28nm shrink richtig ?
 
Mit dem hohen Takt und moderneren Befehlssätzen der FXs kommst du aber grob auf die gleiche Singlethread-Leistung oder etwas drüber wie bei den Phenoms. ;)

Das hilft SupremeCommander aber nicht auf die Sprünge :fresse:
Wenn BD in erster Generation laut dem Link oben ~19% weniger IPC hat als die Phenom II Technik in letzter Instanz, dann liegt Bulldozer irgendwo zwischen Core2 65nm und Netburst in letzter Instanz. Die Lücke ist ja groß...
Wärend Ivy bekanntermaßen auf Core2 durchaus ~30-35% IPC drauf packt.

Ich würde schlicht behaupten, mit Steamroller kann man da bestenfalls "Kleinigkeiten" aufstocken. Der Unterschied zwischen Vishera und Zambezi ist ja auch nicht nennenswert Riesig. Zwar in die richtige Richtung, aber auch nicht mehr wie man es bei Intel macht. Sprich Lücke wird nicht! kleiner :(
Wunder darf man wohl keine erwarten. Ich verspreche mir nen Effizienzvorteil beim Steamroller im Vergleich zu Zambezi und Vishera. Mal gucken was draus wird. Taktsteigerungen sind ja auch nicht mehr soo extrem vielbringend. Selbst absolute 200MHz von 4GHz Basis sind gerade 5%. Damit rettet man nicht die Welt ;)
 
Und warum macht man es nicht?
Für mich gibts zwei Möglichkeiten:
A) bringt nicht viel
B) geht nicht (weit)

Ob man damit den IPC "Nachteil" eliminieren kann, wäre aber auch noch fraglich. Ich denke nicht, das es langt. Zumindest nicht in aktueller Umsetzung.
 
Man kann zumindest in Spielen einiges damit herausholen.
Ein NB Tak der gleichhoch wie der Chiptakt wäre, würd ebei Games wohl 20 bis 30% mehr IPC herauskitzeln.
 
Das käme rund einer Verdoppelung gleich, die den Verbrauch wiederum so ansteigen lässt, dass man mit dem Kerntakt herunter muss - und am Ende wohl insgesamt langsamer ist. AMD wird den optimalen Kompromiss für die NB-Taktrate schon wohl überlegt haben. Mobil haben wir aus Verbrauchsgründen ja sogar nur maximal 1,6 GHz...
 
also für gamer wird der steamroller dann wohl nicht wirklich interessant bis auf den 28nm shrink richtig ?

Hmmm, es kommt darauf an! Mit Steamroller werden CPU und GPU auf den gleichen Adressarum zugreifen können und HSA wird noch weiter implementiert (so ähnlich wie scheinbar bei der PS4, nur das es dort Jaguar Kerne sind). Also quasi je nach Bedarf rechnet entweder die GPU oder die CPU und man könnte sich gegenseitig Arbeit abnehmen (mehr die GPU, welche die CPU unterstützt). Finde diesen Schritt seit Jahren technologisch am Interessanteseten (neben den Fins bei der CPU Produktion).
 
mal eine frage hier zu
file.php


2t generation "imporved ipc and frequency" also verbesserte architektur und mehr takt
3t generation "greater parallelism" was wird das ausmachen ?
4t generation "greater performance" die aussage könnte das selbe wie bei der 2t generation bedeuten oder ? ich frage mich weshalb sie das so verschieden formulieren.
Ich würde da nicht allzu viel hinein interpretieren. Das sagt im Grunde ja lediglich, wo die Schwerpunkte bei den einzelnen Kernen liegen. Das sagt aber nichts darüber, wie sich die Verbesserungen der verschiedenen Kerne zueinander verhalten. Also obwohl bei Piledriver "improved IPC" steht, kann Steamroller bezüglich IPC trotzdem mehr zulegen. Diese Übersicht gibt es ja schon länger und wurde jetzt nur nochmal auf eine neue Folie gepackt. Steamrollers "greater parallelism" bezieht sich sehr wahrscheinlich auf das geänderte Frontend, also 2x Decode/Dispatch statt lediglich 1x. Das sollte dann in erster Linie eine bessere Skalierung für 2 Threads ermöglichen. Aber selbst bei lediglich einem Thread kann das für einen besseren Durchsatz sorgen, da laut AMD beide Einheiten für ein und denselben Thread arbeiten können. So wie ich das verstanden habe, kann zB ein Decoder/Dispatcher Ops an einen Integer Cluster schicken, während der zweite Decoder/Dispatcher Ops an die FPU schickt. Die Frage für mich ist, wie sich die Taktbarkeit von Steamroller aufgrund der 28nm Bulk Fertigung ändert. Excavators "greater performance" ist einfach Standardformulierung, wenn man noch nichts spezifisches sagen kann/will.


Steamroller wird mehr auf Mutithreading getrimmt soll das heißen. ;) Bekommt ja jedes Modul eine zweite FPU.
Nein, tut es nicht. ;)

P.S.: Weiß meinst du wohl warum ich immer sage, das Intel so schnell nicht Bange wird? :d Nicht weil das meine Lieblings-Firma ist, sondern, weil die einen immensen Vorsprung haben...
Nicht wirklich, wenn man sich mal tiefer mit der Materie befasst. ;)


Clock for clock, single threaded performance is about 19% slower on the FX / Bulldozer architecture than on the Phenom II CPU.
Das ist ja lediglich ein Test. Die durchschnittliche Differenz beträgt weniger. Es liegt aber nicht nur an der Hardware, vor allem auch die Software ist entscheidend. Hier mal ein paar Beispiele, was Bulldozer Optimierungen ausmachen können. Gerade Renderer wie C-Ray können davon stark profitieren. Stichwort Flex-FPU, die nicht richtig genutzt wird. Da liegt dann meist die Hälfte der Ressourcen unnötig brach. Pov-Ray ist ja eine ähnliche Anwendung.
 
ups

stimmt natürlich^^

aber denk 4,4 bis 4,5 sind realistisch da ja derzeitige bereits dort hin kommen!

wären dann ja alut der rechnung von fdsonne immerhin 10-12%
 
Zuletzt bearbeitet:
GDDR5 kommt sicherlich nur für den Grafikchip in Frage, d.h. eher verlötete Chips am Mainboard drauf, bzw später direkt auf der CPU mit stacked Ram.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh