Quartalszahlen: AMD hat weiter zu kämpfen

also wenn das wahr ist, dann dürfte Haswell ca 85-90% mehr IPC als der Bulldozer MK1 von 2011 haben. Dann dürfte Broadwell, spätestens Skylake welche 1Q-2Q 2015 kommen, mindestens 100% mehr leistung bei gleichem takt gegen über meiner jetzigen CPU haben. Das wäre ja mal ein Krasses Upgrade :fresse:

Neja du darfst halt nicht einfach die Werte 1:1 runterrechnen. Mit Steamroller hat AMD eindrucksvoll gezeigt, das CMT auch extrem gut skalieren kann... Wenn ich mir die 1 auf n Skalierung von Cinebench bspw. ansehe, dann sind das Werte, wie es bspw. ein Phenom II als nativer Quadcore auch in etwa zeigt. Bei den ersten BD Modellen hingegen war die Skalierung noch deutlich schlechter...
Es ist natürlich dann auch logisch, das ein Steamroller aufgrund der besseren Skalierung über die Module bei Benches mit hoher CPU Last besser dasteht.
IPC soll aber eigentlich nicht primär die Werte bei Volllast aufzeigen. Sondern pro Takt. Und historisch bedingt, weil es vor Jahren mal nur einen Core gab, eben auch nur pro Core/Modul. Dieser Wert wird dann mit dem Skalierungsfaktor multipliziert und du erreichst die gesamt Leistung der CPU.

Würde man dies nicht so machen, dann würde ein Intel Prozessor mit SMT deutlich weniger IPC haben als einer ohne ;) Was ja nicht der Fall ist. Ob SMT oder nicht, die CPU ist pro Thread gleich stark (unter gleichen Bedinungen). Und SMT kommt als Technik für Multithreading oben drauf. Bei AMD läuft das analog. Nur das dort eben CMT anstatt SMT genutzt wird. Die Basisgeschwindigkeit eines Moduls hat es aber trotzdem noch. Und Steamroller scheint die CMT Skalierung stark verbessert zu haben im Vergleich zu Bulldozer oder Pilldriver :wink:

Wie kommst du drauf? Die letzten beiden Intel Generationen haben im Grunde das Gegenteil gezeigt... 5Ghzer werden seltener, nicht häufiger. Je kleiner der Chip ist, desto schwerer ist die Kühlung und mit zunehmender Komplexität des Chips, wird OC auch nicht grade vereinfacht.

Wobei man das nicht wirklich pauschal auf die Produkte ummünzen kann.
Ein wichtiger Part dabei dürfte bspw. die Packdichte sein... Dicht gepackte Prozessoren haben wohl prinzipbedingt da deutlich das nachsehen. Auch kommt es noch auf den Prozess selbst an.

Zur "Not" gibts ja immernoch Mittel und Wege einfach das DIE größer zu machen als eigentlich benötigt. Was die Fläche erhöht um besser die Hitze abtransportieren zu können. Sowas hat man bspw. seinerzeit mal beim RV770 zu RV790 gemacht. Und siehe da, gleicher Prozess, andere Anordung der Bauteile, mehr Fläche und deutlich erhöhtes Taktpotential ;)

Es gibt 2 Turbo Stufen bei CMT, 100% Load und 50% Load.
Der 100% Turbo setzt aber den "HPC Mode" vorraus, z.B. ein FX-8350 hat dann 8x 4.1GHz oder ein FX-9590 8x 4.8GHz.

Nur wo steht das?

Aber sei es drum, mit den 100MHz mehr Takt zwischen Basistakt und AllCore Turbo gewinnst du schlicht und ergreifend gar nix. Bei dem 4,7GHz Baseclock des 9590 sind 100MHz schlappe 2,1%. Die nichtmal 1:1 skalieren. Wie die Messungen zwischen 8350 zu 9590 zeigen... :wink: Das reißt es definitiv nicht raus und macht den Kohl nicht fett.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
@ FDSonne.

Ja, aber 100% schneller als Bulldozer wird skylake dennoch wie es aussieht. zumindest in spielen wie supreme commander oder anwendungen wie cinebench.

evtl sogar mehr als 100% schneller.

Ihr habt ja Berechnet das Haswell 65-70% schneller in single thread leistung ist als ein Steamroller, und ein Steamroller ist mindestens 15% schneller in single thread als der erste Bulldozer.

Das heißt Broadwell brauch nur 5% drauflegen und man wäre schon bei 90% gegenüber Bulldozer version 1 von 2011. Skylake wird ja wieder ein Architektur Update, und dank DDR4 bestimmt definitiv insgesamt 10% auf Broadwell drauflegen können.

somit wären es 100% gegenüber Bulldozer version 1 in Multi Core und 100% gegenüber Bulldozer version 3 in single thread anwendungen.

in multi thread gegen Bulldozer 3 wären es dann immernoch 70% weil die version 3 gegenüber version 1 ca 30% schneller in multithread anwendungen ist.
 
Zuletzt bearbeitet:
@Techtrancer
das schimpft sich dann aber overclocking... Und klappt im übrigen bei Intel auch. Selbst ohne ein "K" Modell.

Was AMD als Angabe für den Turbo macht, ist allseits bekannt. Meines erachtens nach gehört Allcore Load nicht dazu ;)
Bei Thuban war das wenn mich nicht alles täuscht = Turbo bis Last auf 50% der Cores. Und bei den CMT based CPUs war ebenso Turbo Angabe ungleich Volllast...
Berichtige mich gern, wenn ich da falsch liege...
Nö. Mit OC hat dies nichts zu tun. Takt bleibt ja ident
Auch gibt es die Funktion schon seit es AOD gibt
 
Zuletzt bearbeitet:
Der Ton spielt die Musik.

Achso...
Hast du dir über deine Tonart schonmal Gedanken gemacht?
Wer eine Begründung verlangt, diese nicht versteht und sich dann darüber lustig macht, hat meines Erachtens nicht das Recht darauf, mit Samthandschuhen angepackt zu werden.

Wenigstens wissen wir jetzt, dass du es mit Zahlen nicht so hast und jeder Post von dir, der Zahlen (egal in welcher Form) enthält, mehr als philosophischer Gedankengang, anstatt als Basis für praxisbezogene Argumentation zu verstehen ist. 380k Jahre... ;) ich hör lieber auf
 
380k Jahre... ;) ich hör lieber auf
Da hat er aber nicht Unrecht.
Leider hat jede Testmethode (für CPUs) auch Nachteile. Nur weil eine CPU soundsoviel besser in z.B. Chinebench ist, muss sie auch nicht in gleichem maße besser in z.B. WoT sein und umgekehrt!
Da ist es aber durchaus naheliegend die Software die deutlich mehr genutzt wird, zuallermindest miteinzubeziehen, wenn nicht gar unter Umständen den Vorttritt zu geben.
 
Nur wo steht das?

Aber sei es drum, mit den 100MHz mehr Takt zwischen Basistakt und AllCore Turbo gewinnst du schlicht und ergreifend gar nix. Bei dem 4,7GHz Baseclock des 9590 sind 100MHz schlappe 2,1%. Die nichtmal 1:1 skalieren. Wie die Messungen zwischen 8350 zu 9590 zeigen... :wink: Das reißt es definitiv nicht raus und macht den Kohl nicht fett.
Das wurde 2012 im Video gezeigt vom "HPC Advisory Council" auf der ISC im Hamburg:

hpc_modesfs5t.jpg


Ja den stellt man im Bios/UEFI ein.

100MHz machen den Kohl nicht fett, aber das umgehen der zwischen P-States reist es raus. ;)
 
Zuletzt bearbeitet:
Da hat er aber nicht Unrecht.
Leider hat jede Testmethode (für CPUs) auch Nachteile. Nur weil eine CPU soundsoviel besser in z.B. Chinebench ist, muss sie auch nicht in gleichem maße besser in z.B. WoT sein und umgekehrt!
Da ist es aber durchaus naheliegend die Software die deutlich mehr genutzt wird, zuallermindest miteinzubeziehen, wenn nicht gar unter Umständen den Vorttritt zu geben.

Demnächst installieren wir dann alle WoW und Fifa14, weil das ja die am meisten verkaufte/genutzte Software ist?
Wenn eine CPU so und soviel besser in Cinebench ist, ist sie höchstwahrscheinlich auch in anderen Dingen besser. Vielleicht nicht in gleichem Maße, aber Wunder werde ich wohl auch bei WoT nicht erwarten dürfen. Immerhin ist es ein Spiel und somit verdammt Treiber/API -abhängig.

Wer wirklich IPC Zuwächse sehen will, sollte sich mal die SuperPI Zahlen eines Kabini auf 2,8GHz reinziehen. Ich weiss.. uraltes Proggi, keiner nutzt es, aber dennoch der leichteste Weg reines Zahlenstampfen zu simulieren.
 
In Battlefield 4 schneiden die AMD,s nicht so Schlecht ab.

In Boinc mit AVX gehen die Bulldozer auch sehr gut ab weil AVX ihre größte Schwäche Kompensiert. Single Thread IPC ala Cinebench ist eben nicht alles.
 
In Boinc mit AVX gehen die Bulldozer auch sehr gut ab weil AVX ihre größte Schwäche Kompensiert. Single Thread IPC ala Cinebench ist eben nicht alles.

Sicher ist ST nicht alles... Aber es gibt halt bei Intel nicht nur die kleinen günstigen S1150 CPUs ;)
Willst du mehr, kaufst du mehr... Und dann ist eben die Lücke noch gewaltiger. Ein aktueller Haswell-E 18 Core Xeon dürfte minimum Faktor 2,5-3 schneller sein als das Opteron Topmodell, dabei nicht nennenswert (wenn überhaupt) mehr Strom verbrauchen und eben auch alle aktuellen Befehlssätze supporten. Wenn also durch AVX der AMD Prozessor schneller arbeitet, dann trifft das auf blau halt auch zu...

Und unterm Strich bleibt halt immernoch die Verbreitung solcher Befehlssätze... Das nutzt wohl sogut wie keiner. Das ist doch viel eher das Problem.
Schwächen über solche Mittel zu kompensieren hat AMD in der Vergangenheit viel zu oft versucht. Und sind bis dato immer dran gescheitert... Selbst HSA als Ansatz mehr Arbeit auf die GPU zu legen ist seit fast einem Jahr nach Release von Kaveri ein "Rohrkrepierer". Außer ein paar wenige spezielle Tools interessiert das den Markt genau Null.
 
Da hast du leider Recht.
 
Ein aktueller Haswell-E 18 Core Xeon dürfte minimum Faktor 2,5-3 schneller sein als das Opteron Topmodell, dabei nicht nennenswert (wenn überhaupt) mehr Strom verbrauchen und eben auch alle aktuellen Befehlssätze supporten. Wenn also durch AVX der AMD Prozessor schneller arbeitet, dann trifft das auf blau halt auch zu...
FYI:
Die 18 Kerne gibt es nur bis 2P: ARK | Intel® Xeon® Processor E5-2697 v3 (35M Cache, 2.60 GHz)
AMD´s Top Modell wird auch in 4P verbaut, also 64 Kerne pro Rack.
 
Für 4P Systeme gibt es Ivy-EP mit bis zu 12 Kernen oder Ivy-EX mit bis zu 15 Kernen (die EX gibt es auch für 8P Systeme inkl. Features von denen man bei AMD nur träumen kann).
 
Immer das rumgezicke AMD vs. Intel... xD
Wartets nur ab, am ende wird VIA nen richtigen hammer rausbringen mit ner ganz neuen generation von technik, welche alle anderen CPUs als Radiowecker-prozessor deklariert :-D
 
Zuletzt bearbeitet:
Für 4P Systeme gibt es Ivy-EP mit bis zu 12 Kernen oder Ivy-EX mit bis zu 15 Kernen (die EX gibt es auch für 8P Systeme inkl. Features von denen man bei AMD nur träumen kann).
Hab jetzt nicht alles hochgerechnet, aber 128MB Exklusiver Cache mit 64 Kerne dazu quadXquad Channel DDR3-1866 ECC sind nicht schlecht bei 8GByte pro Riegel mit x86-64. :sick:

Von XOP und FMA4 träumen auch viele, 25% mehr durch ein doppel Klick kann auch nicht jeder. :sleep:
 
Zuletzt bearbeitet:
FYI:
Die 18 Kerne gibt es nur bis 2P: ARK | Intel® Xeon® Processor E5-2697 v3 (35M Cache, 2.60 GHz)
AMD´s Top Modell wird auch in 4P verbaut, also 64 Kerne pro Rack.

Es gibt bzw. wird demnächst auch v3 E5 Xeons der 4000er Reihe geben ;)
Dann gibts höchstwarscheinlich auch 4x18 Cores.
Ansonsten eben Ivy-EX (Haswell-EX folgt wohl später) mit bis zu 8x15 Cores.

Nein Phantomias, AMD ist da einfach lange schon kein Konkurent mehr im Serverbereich. Weder im Preis, der Leistungsaufnahme/Effizienz noch in der absoluten Leistung. Seit Ivy ist auch dort der Vorsprung derart angewachsen, dass es für AMD ne ziemlich harte Nuss ist, das wieder aufzuholen.
Nach aktuellen Infos zur Folge kann und will AMD da auch nichtmal ansatzweise gegensteuern... Wir haben seit Jahren schon die gleichen Modelle im Servermarkt bei AMD. Nix mit Refresh, nix mit neuer Technik. Der Chipsatz ist sowas von Alltbacken, da sieht alles auf AM3+ Basis noch neu gegenüber aus usw.

Mal ganz davon ab, die absolute Core Anzahl ist nicht primär ausschlaggebend. Die Leistung muss passen und oft auch die Effizienz. Und im Multithreading steht es bei AMD in etwa so, das das größte Modell der aktuellsten Opteron Reihe irgendwo im Bereich von einem Intel Sandy-E based acht Kerner mit ca. 2-2,4 GHz agiert. Jetzt kannst du dir ausrechnen, was passiert, wenn man die Anzahl der Cores bei Blau auf 18 anhebt und den Takt nochmal um 20% erhöht sowie den IPC Sprung von ~15%. + neueste Featuresets...

Hab jetzt nicht alles hochgerechnet, aber 128MB Exklusiver Cache mit 64 Kerne dazu quadXquad Channel DDR3-1866 ECC sind nicht schlecht bei 8GByte pro Riegel mit x86-64. :sick:

Auch das stimmt nur bedingt. AMD Opteron CPUs haben kein QuadChannel Interface... Der Prozessor besteht intern aus zwei NUMA Nodes. Was so viel heißt wie 2x Dualchannel, jeder NUMA Node hat ein DC Interface. Ein Thread hat nur Zugriff auf ein DC Interface. Es sei denn, es geht um MT. Aber dann hast du Querzugriffe über die NUMA Nodes. Was einiger Software nicht schmeckt, weil die Skalierung extrem einbricht. In Mehrprozessorsystemen macht das die Sache nur noch schlimmer. Der Opteron hätte in einer vier Sockel Ausführung acht NUMA Nodes. Im Vergleich zu einem aktuellen Haswell-EP System mit 2x18 Cores, der da nur auf zwei kommt.
Ist die Software nicht auf die Skalierung über NUMA Nodes angepasst, wirst die Mehrleistung bei Verdopplung der Ressourcen über die Nodes schlicht sehr mau sein. Das gleiche gilt auch für Intel. Aber 2 skaliert da eben bei weitem besser als 8 ;)

So ist es. Mit ARM hat ja wohl auch niemand mehr gerechnet

Warum? Der Trend kündigte sich doch lange vorher schon an...
Vor allem war doch quasi gesichert, das Intel da nur zweite Geige spielen wird mit ihren Atom und Co. CPUs. Gerade im Smartphone/Tablet Markt, der extrem absatzreich zu sein scheint.

Die Frage bleibt, ob Intel dort mit ihren Milliarden an Dollars, die sie da reinpumpen irgendwann profit draus schlagen kann?
Wenn ja, dann könnte sich nämlich auch AMD ein Stück vom Kuchen abholen.
Ich halte AMDs Plan im ARM Geschäft einzusteigen bspw. auch für einen Fehler. Warum? Das kostet heiden Geld für die Entwicklung und am Ende besteht immernoch die sehr große Gefahr, das es einfach nicht reicht und niemand die Dinger kaufen wird. Auch wenn AMD klar den Vorteil hat, die Modelle mit anständiger GPU zu paaren sehe ich da sehr große Risiken, das der Plan nicht aufgeht. -> und dann wird das wieder nur ne Niesche, die man bedient. Aber damit macht man nicht das bitter nötige große Geld!

Hingegen die Vorstellung auf nem Mini Gerät ein vollwertiges Betriebssystem (Windows, Linux, Unix, whatever...) wie auf dem Notebook/PC fahren zu können, mit jeder erdenklichen Anwendung abseits irgendwelcher simpler Apps, hat schon was.

Ich liebäugel aktuell bspw. mit so nem Mini HDMI Stick. Da gibts irgendwie ne Firma in China, die nen Intel Atom Quadcore mit RAM und Flash in ein USB-Stick Format untergebracht haben. Zwei micro USB Buchsen dran, HDMI Port dran und fertig ist der Mini PC. 2,5W Verbrauch (angeblich?) für den Prozessor + etwas Rest lässt sich wohl simpel über USB einspeißen. Nen micro SD Card Slot als Zusatzspeicher hat es wohl auch noch.
Das wäre der ideale Streaming Client für Filme und ggf. auch als Steamclient fürs Inhome Streaming.
Hätte das Ding noch HDMI 2.0 als Ausgang, wäre es quasi perfekt für sowas geeignet. In erster Version aber scheinbar nur HDMI 1.4 irgendwas.
 
Zuletzt bearbeitet:
Auch das stimmt nur bedingt. AMD Opteron CPUs haben kein QuadChannel Interface... Der Prozessor besteht intern aus zwei NUMA Nodes. Was so viel heißt wie 2x Dualchannel, jeder NUMA Node hat ein DC Interface. Ein Thread hat nur Zugriff auf ein DC Interface. Es sei denn, es geht um MT. Aber dann hast du Querzugriffe über die NUMA Nodes. Was einiger Software nicht schmeckt, weil die Skalierung extrem einbricht. In Mehrprozessorsystemen macht das die Sache nur noch schlimmer. Der Opteron hätte in einer vier Sockel Ausführung acht NUMA Nodes. Im Vergleich zu einem aktuellen Haswell-EP System mit 2x18 Cores, der da nur auf zwei kommt.
Ist die Software nicht auf die Skalierung über NUMA Nodes angepasst, wirst die Mehrleistung bei Verdopplung der Ressourcen über die Nodes schlicht sehr mau sein. Das gleiche gilt auch für Intel. Aber 2 skaliert da eben bei weitem besser als 8 ;)
Ich weiß was du meinst bezüglich DC und QC, aber es sind nun mal 4x QuadChannel a 12 Speicher Riegel: http://images.tecchannel.de/images/tecchannel/bdb/392947/890.jpg

Bezüglich Skalierung, da hast du auch nicht unrecht, beim Opteron heißt das Zauberwort: Probe Filter oder HT-Assist: HT Assist
 
Da steht aber nicht Quadchannel, sondern four controllers. Ja es sind zweifelsfrei vier Controller pro CPU... Aber es sind eben paarweise zwei pro NUMA Node, was der entscheidende Faktor bei der Geschichte ist.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh