Kommt AMDs neue Architektur „Steamroller“ im Jahr 2014?

Na offenbar hast du es nicht verstanden. Denn erstens ist Bulldozer nicht gefloppt. Und zweitens, warum sollte man wieder auf die Stars Architektur setzen, die deutlich weniger singlethreaded Potenzial als Bulldozer hat?

Bulldozer ist nicht gefloppt? das wäre mir neu... seit wann hat ein phenom2 bei gleichem takt weniger singlethreaded performance als ein bulldozer? hab ich was verpasst?
die tatsache, dass bulldozer ein flopp ist, zeigt doch alleine, dass die komplette marketing mannschaft gefeuert wurde. keine großen flüssig helium shows mehr... auf XS traut sich ja kein einziger amd user irgendwelche 3d benchmarks zu zeigen.
das einzige was noch geht ist cinebench und das traurige dabei ist, dass thuban selbst da um welten besser ist als sein nachfolger.
wenn ein prozessor schlechter performt als sein vorgänger, so kann man das nur flopp nennen, egal wie schön die architektur auf dem papier aussieht.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ein FX-8350 von Ende 2012 hat in etwa die ST-Leistung eines X4 980 von Anfang 2011.
 
Der Fx8150 ist im Cinebensch schneller als.der 1100T,um Welten schneller ist völlig falsch der Fx ist flotter.
Bulldozer ist vielleicht technisch kein Flop prformancemässig hingegen schon.
Man muss aber nicht gar immer so uebertreiben.
 
Zuletzt bearbeitet:
Thuban ist in Cinebench schneller als Bulldozer weil er mehr Ressourcen zur Verfügung hat.

Thuban
64KB L1D Cache
6x FPU
6x Decoder

Bulldozer
16KB L1D Cache
4x FPU
4x Decoder

Das Frontend von Thuban hat mehr Ressourcen und hinzu kommt noch das Cinebench 11.5 nicht für Bulldozer optimiert wurde.
 
Zuletzt bearbeitet:
Wo ist der Phenom II schneller? 5,91 vs. 6,03 mit beiderseits aktiviertem Turbo.
Immer die gleichen sinnfreien Diskussionen.

dass thuban selbst da um welten besser ist als sein nachfolger.

...

wenn ein prozessor schlechter performt als sein vorgänger, so kann man das nur flopp nennen, egal wie schön die architektur auf dem papier aussieht.

Deswegen ist die CPU bei CB in Anwendungen auch 18% flotter und bei PCGH ind Spielen sowie Anwendungen 12% vor dem 1100T?

Duplex schrieb:
Ressourcen zur Verfügung hat.

Lass es doch lieber gleich mit solchen Halbwissenaussagen.
Ressourcen sind beim Phenom II sicherlich nicht pauschal mehr da, genauso wie die Größe des L1 Cache keine Rolle spielt.

Wie kann es denn sein, dass bei gleichem Takt Vishera mit 4 FPU´s identisch schnell wie ein Phenom II x6 in Cinebench trotz "weniger Ressourcen" ist?
Nebenbei spielt die mangelnde Unterstützung von FMA3/4 oder AVX auch eine Rolle.
 
Zuletzt bearbeitet:
sinnfrei?
wie hoch ist der turbo bei einem bulldozer, oder piledriver?
bring den phenomII auf denselben takt und melde dich nochmal... halbwissen.. tz

"Wie kann es denn sein, dass bei gleichem Takt Vishera mit 4 FPU´s identisch schnell wie ein Phenom II x6 in Cinebench trotz "weniger Ressourcen" ist?"

ach du hast es ja schon... sehr schön. identisch? naja... mit viel gutem willen vielleicht. wie das sein kann? 2 threads mehr vielleicht?
womit wir wieder bei der erbärmlichen singlethread performance wären.
 
Zuletzt bearbeitet:
sinnfrei?
wie hoch ist der turbo bei einem bulldozer, oder piledriver?
bring den phenomII auf denselben takt und melde dich nochmal... halbwissen.. tz
Das ist ja mal sinnfrei. Der Phenom kann gar nicht so hoch getaktet werden und der Bulli braucht braucht bei identischem Takt auch noch weniger.
ach du hast es ja schon... sehr schön. identisch? naja... mit viel gutem willen vielleicht. wie das sein kann? 2 threads mehr vielleicht?
womit wir wieder bei der erbärmlichen singlethread performance wären.
jep der Phenom hat 2 FPUs mehr sollte also schneller sein. Das hast du zwar oben irgendwie vertauscht aber nun ja war sicher so gemeint
 
...und der Bulli braucht braucht bei identischem Takt auch noch weniger.

Welchen Sinn hat ein Takt/Watt verlgeich?

jep der Phenom hat 2 FPUs mehr sollte also schneller sein.

Jein, denn ein Modul hat 2 128bit FPU Ausführungseinheiten und kann somit 2 Threads parallel bearbeiten, ein PII X6 nur 1nen pro Kern. Macht folglich 8 vs 6 beim Vergleich 4 Moduler mit 6 Kerner. Lediglich bei AVX, welche des PII gar nicht unterstützt, wären es 6 vs 4 da hier beim BD 2 128 Bit Einheiten zur berechnung eines 256 Bit Befehls genutzt werden. Zudem hat der BD nur einen FP Scheduler pro Modul.
 
Zuletzt bearbeitet:
Jein, denn ein Modul hat 2 128bit FPU Ausführungseinheiten und kann somit 2 Threads parallel bearbeiten, ein PII X6 nur 1nen pro Kern. Macht folglich 8 vs 6 beim Vergleich 4 Moduler mit 6 Kerner. Lediglich bei AVX, welche des PII gar nicht unterstützt, wären es 6 vs 4 da hier beim BD 2 128 Bit Einheiten zur berechnung eines 256 Bit Befehls genutzt werden. Zudem hat der BD nur einen FP Scheduler pro Modul.
Hä was ist das denn für eine Rechnung es ging doch um Kerne. Intel Sandy Bridge FPU kann 2 256 bit Befehle gleichzeitig abarbeiten hat das Teil nun 8 FPUs?
Ach wenn ich schon mal dabei bin Phenom hat 3 integer Ausführungseinheiten und Bulldozer nur 2. Also steht es 18 integer vs. 16 interger für den Phenom.
 
Zuletzt bearbeitet:
maddias schrieb:
sinnfrei?
wie hoch ist der turbo bei einem bulldozer, oder piledriver?
bring den phenomII auf denselben takt und melde dich nochmal... halbwissen.. tz

Der Vishera ist bei gleichem Takt genauso schnell wie ein Phenom II x6 mltithreaded, im Cinebench, den Phenom kannst du nicht so hoch takten.
Und ich bezweifle dass der aktuelle 32nm Prozess das volle Taktpotenzial von Vishera freigibt.

Du redest Bulldozer/Vishera absolut übertrieben schlecht, ich habe das begründet. Wo ist deine Begründung?
Ich sehe nichts außer Polemik.

ach du hast es ja schon... sehr schön. identisch? naja... mit viel gutem willen vielleicht. wie das sein kann? 2 threads mehr vielleicht?
womit wir wieder bei der erbärmlichen singlethread performance wären.

Also doch nicht weniger Ressourcen? Ich habe diese Antwort auf Duplex Aussage gegeben, was mischst du das jetzt? Polemikreiter?
 
Hä was ist das denn für eine Rechnung es ging doch um Kerne.

Mit einer stupiden Kernzählung kommst du aber nicht weit wenn eine Bulldozer CPU im Spiel ist. Die hat nunmal Module.

Intel Sandy Bridge FPU kann 2 256 bit Befehle gleichzeitig abarbeiten hat das Teil nun 8 FPUs?

nein, intel macht das über SMT - 2 Threads werden von einer Ausführungsinheit bearbeitet. Das ist wieder etwas anders.
 
Zuletzt bearbeitet:
ach und was ist nun bei der amd fpu im Bulldozer so anders. Das ist auch nur eine FPU die eben 2 128bit Operationen gleichzeitig ausführen kann. Bei intel sind es eben 2 256bit Operationen. Oder anders gesagt 4 Bulli vs 6 Phenom. Die FPU im Bulli ist eben aufgemotzt worden und kann nun entweder eine 256 bit Operation ausführen oder eben 2 128bit Operationen deshalb ist es aber immer noch nur eine FPU. Sie hat damit eine höhere IPC als die FPU im Phenom. Darum ging es doch hier?
Edit: gar nicht gesehen:
Welchen Sinn hat ein Takt/Watt verlgeich?
Keinen. Schreib ich doch auch. Es ging darum, dass es nichts bringt die Prozessoren auf den gleichen Takt zu takten. Wenn Prozessor A dann zwar langsamer ist aber auch wesentlich weniger Strom verbraucht als Prozessor B. Aber es bringt was, wie zum Beispiel von Phoronix getestet, beide Prozessoren im Default Takt bzw. beide so weit getaktet wie möglich laufen zu lassen und mitzuprotokolieren wieviel sie für die gleiche Aufgabe verbrauchen und das Interessante ist, dass der Bulldozer effizienter ist. Übertaktet sogar noch effizienter als im Default Takt.
so edit2:
Ob der Bulldozer übertaktet effizienter ist oder nicht hängt stark von der Anwendung ab. Das System spielt natürlich auch eine große Rolle. Es kann sein, dass obwohl die CPU ineffizienter rechnet, man Strom sparen kann, da der Rest nicht so lange ausgelastet ist.
Solche Tests findet man im Web leider viel zu selten: http://www.phoronix.com/scan.php?page=article&item=amd_fx8350_perfwatt&num=1

edit3:
Mit einer stupiden Kernzählung kommst du aber nicht weit wenn eine Bulldozer CPU im Spiel ist. Die hat nunmal Module.
Ein Kern zwei siblings und ein fpu flag.
cpuinfo schrieb:
processor : 0
vendor_id : AuthenticAMD
cpu family : 21
model : 16
model name : AMD A10-5800K APU with Radeon(tm) HD Graphics
stepping : 1
microcode : 0x6001116
cpu MHz : 1400.000
cache size : 2048 KB
physical id : 0
siblings : 4
core id : 0
cpu cores : 2
apicid : 16
initial apicid : 0
fpu : yes
fpu_exception : yes
cpuid level : 13
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 popcnt aes xsave avx f16c lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs xop skinit wdt lwp fma4 tce nodeid_msr tbm topoext perfctr_core arat cpb hw_pstate npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold bmi1
bogomips : 7586.10
TLB size : 1536 4K pages
clflush size : 64
cache_alignment : 64
address sizes : 48 bits physical, 48 bits virtual
power management: ts ttp tm 100mhzsteps hwpstate cpb eff_freq_ro
 
Zuletzt bearbeitet:
ach und was ist nun bei der amd fpu im Bulldozer so anders. Das ist auch nur eine FPU die eben 2 128bit Operationen gleichzeitig ausführen kann.

Du gibts dir die Antwort eh schon selbst:

Das ist auch nur eine FPU die eben 2 128bit Operationen gleichzeitig ausführen kann.

Genau das ist anders, es gibt eben 2 parallele FP Ausführungseinheiten die von einem FP Scheduler gespeist werden und nur eine beim Phenom II. Die vorhandenen Ressourcen sind also deutlich höher.


Bei intel sind es eben 2 256bit Operationen.

Es sind auch 2 128 bit Operanden - nur halt nach einem anderen Prinzip, nämlich SMT bei dem beide Threads auf derselben Ausführungseinheit berechnet werden.

Oder anders gesagt 4 Bulli vs 6 Phenom.

Hör doch bitte endlich mit dieser stupiden zählweise auf, das bringt rein gar nichts. Es bleiben bei den FPUs 8 vs 6 128 bit Ausführungseinheiten und 4 vs 6 FP Scheduler.

...deshalb ist es aber immer noch nur eine FPU.

Wenn du das so bezeichnen willst meinetwegen, aber was sie sicher nicht ist, 1:1 mit jener des Phenom vergleichbar ohne das man ins Detail geht.

Sie hat damit eine höhere IPC als die FPU im Phenom.

Was aber bei 100% mehr 128 bit Verarbeitungseinheiten auch keine Kunst ist. Vergleicht man die IPC der Ausführungseinheiten, also zB mit einer Anwendung die nur in einem Thread läuft, sieht das ganze leider anders aus.
 
Zuletzt bearbeitet:
Was aber bei 100% mehr 128 bit Verarbeitungseinheiten auch keine Kunst ist. Vergleicht man die IPC der Ausführungseinheiten, also zB mit einer Anwendung die nur in einem Thread läuft, sieht das ganze leider anders aus.
Und da hakt es bei mir etwas. Wieso? Ein FPU Scheduler bekommt von 1 nem Thread 2 128 bit Operationen hintereinander. Sagen wir mal die Berechnung braucht 40 Takte. Das Holen des Befehls braucht 5 Takte. Also 5 Takte um die erste Ausführungseinheit zu stopfen. Die rechnet nun 40 Takte. Weitere 5 Takte um die zweite Ausführungseinheit zu stopfen. Die rechnet auch noch mal 40 Takte. Alle Werte frei erfunden. Dann ist der hypothetische Bulldozer nach 50 Takten mit beiden Operationen fertig.
Das sollte eigentlich vom Thread völlig unabhängig sein. Ob das Modul nun mit 2 oder 1 Thread gefüttert wird sollte dem 1 FPU Scheduler egal sein.
Klar wenn da nur ein 128 bit Operand vorhanden ist, können die beiden Ausführungseinheiten auch nicht ausgelastet werden. Aber dann nutzt das Programm eben nicht die vorhandenen Resourcen des Prozessors.
 
Zuletzt bearbeitet:
Seit der Vorstellung der PS4 plagt mich ne Frage: laut Sony haben GPU und CPU Zugriff auf den selben Adressraum, was laut AMD erst mit Kaveri auf dem Desktop passieren wird. Was haben die Jaguar Kerne damit zu tun? Einfach ne custom Lösung für die Konsolen, also ne Art Mischung aus neuer HSA Architektur?
 
Die teilen sich den Speicher, aber wo sagt Sony was von gleicher Adressraum?
 
Uaaaahhhh, habe davon in der ISSCC Präsentation gelesen, bezüglich Jaguar Kerne + GCN Graka und coherent memory between CPU & GPU...was bei der PS4 eigentlich der Fall ist, oder? Ich kann da natürlich auch etwas falsch verstanden haben :fresse:
 
In der ISSCC-Präsentation steht nichts von "memory", der gemeinsame Adressraum kommt AFAIK erst mit Kaveri.
 


Jo sorry; zwar wirklich Kaveri (hatte es vergessen. Hat nichts mit Jaguar zu tun; hab jetzt wirklich lange danach suchen müssen), aber doch ISSCC :asthanos:
 
Zuletzt bearbeitet:
Kommt Steamroller vielleicht doch noch dieses Jahr?
In der Präsentation von AMD über die weitere Zukunft ist eine Folie auf der Steamroller für 2013 steht.
 
bei dem reicht auch ne sehr sehr sehr gut selektierte CPU in kombi mit ner wirklich guten wakü :d
 
Kommt Steamroller vielleicht doch noch dieses Jahr?
In der Präsentation von AMD über die weitere Zukunft ist eine Folie auf der Steamroller für 2013 steht.
Was anderes war auch nie geplant. ;) Die Frage ist lediglich, ob dieses Jahr eventuell noch Opterons mit Steamroller kommen. Kaveri war schon immer für 2013 vorgesehen.
 
Achso, mit Steamroller sind die Kerne gemeint, welche in Form von Kaveri dieses Jahr kommen, und nicht der Nachfolger von Vishera. Hatte mich auch gewundert, weil es doch immer hieß, dass Vishera V2 (ich nenn es mal so) dieses Jahr kommt.
 
Das bezieht sich vermutlich auf den Produktionsstart, ähnlich wie Intel auch von 14nm-CPUs für 2013 spricht. Das Kaveri H1/2014 kommt, ist ja nun schon mehrfach durchgesickert.
 
@[-Dead Eye-]

Richtig, Steamroller ist der Name des Kerns. Bulldozer war der erste Kern. Nicht zu verwechseln mit dem Namen der Architektur, welcher ebenfalls Bulldozer ist. Der zweite Kern der Bulldozer Architektur heisst Piledriver, der dritte Steamroller, der vierte Excavator. Zambezi, Trinity, Vishera, Richland und Kaveri sind die Namen für den gesamten Prozessor.

Kaveri soll jedenfalls in Q4 2013 gelaunched werden. Siehe letzte Roadmap. Gerüchte sprechen von November. Allerdings gilt das erst mal nur für Desktop Modelle. Mobile Modelle folgen dann wohl Q1 2014. Für die nächsten Opterons hingegen gibt es nur eine Roadmap für 2014. Bleibt also abzuwarten, ob hier wirklich noch was basierend auf Steamroller in diesem Jahr kommt.
 
Zuletzt bearbeitet:
mal eine frage hier zu
file.php


2t generation "imporved ipc and frequency" also verbesserte architektur und mehr takt
3t generation "greater parallelism" was wird das ausmachen ?
4t generation "greater performance" die aussage könnte das selbe wie bei der 2t generation bedeuten oder ? ich frage mich weshalb sie das so verschieden formulieren.
 
Steamroller wird mehr auf Mutithreading getrimmt soll das heißen. ;) Bekommt ja jedes Modul eine zweite FPU. Was da bei Excavator steht ist quasi ein dummy für "Wird besser", das IPC oder Takt steigen ist wohl logisch, aber die Folie selbst ist auch älter als 2013, die gab es letztes Jahr genauso auch schon...
 
also wird bei steamroller die IPC bei singlecore anwendungen nicht steigen. schade

also wird die schmach bis 2014 anhalten.

mit welcher cpu ist die vishera IPC eig zu vergleichen ? glaube selbst der 2006er Conroe hatte eine bessere oder ? dann müsste sie ja dem K8 entsprechen oder ?
das traurige ist einfach, Intel kann die gleichen takt frequenzen wie amd schaffen :d
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh