[Sammelthread] AMD Bulldozer "Zambezi" 32nm "New CPU Architecture" Sockel AM3+ [Part 3]

Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
So ich verlasse den Kindergarten jetzt. Die Moderatoren hier waren auch schon mal besser in Form. Eigentlich sollte es hier ja nur um die Architektur gehen. :rolleyes:

Nope. Nur Intel war sich nicht sicher. Denn von ihnen stammt ja die AVX Spezifikation. AMD hat diese letztendlich nur übernommen, um Konsistenz für den Markt zu gewährleisten. Weil Intel sich aber umentschied, hat es eben nur die erste Intel FMA Spezifikation, FMA4, in Bulldozer geschafft.
SSE5 war jedenfalls auf 128 Bit-Vektoren beschränkt - AVX mit 256 Bit Vektoren kommt von Intel. Deren Sandybridge Kern kann's auch in voller Vektorbreite verarbeiten, AMDs Bulldozer nur durch einen Trick (Kombinieren zweier FPUs). Nur damit wir das mal festgehalten haben - dann verwundert auch die Skalierung wenig.

Gibt's für gcc schon -sse4 und -avx Flags?

Die c't schreibt in ihrer aktuellen Ausgabe übrigens ein paar Worte zur Leistungsaufnahme des Bulldozers, bzw. warum die Messwerte so auseiander klaffen. Mit dem im Review-Kit verschickten Asus Crossair V Formular 990FX Mainboard mit 990FX Chipsatz war der Verbrauch deutlich höher als mit einem Asus Board mit 880G Chipsatz.
Mit letztgenannten pegelt sich Bulldozer mit 200 W bei Volllast (wie auch immer gemessen) zwischen 1055T (189 W) und 1100T (223 W) ein. Insofern ist der Verbrauch beim FX eigentlich etwas weniger zu hoch, als zuerst angenommen.
 
@Nighteye
na dann hoffe ich mal das alles ankommt und bin gespannt.

lg

Danke. Kurioser weise kam heute eine Email von Mindfactory, das das Gehäuse heute Verschickt wurde. in dem DHL link der dabei war stand aber drin das sie es am FR schon verschickt hatten. und ich hatte es auch am Samstag morgen angenommen. diese komiker :lol:

bin mal gespannt wann die anderen teile eintreffen. evtl kommen diese ja auch 2 Tage vor der Bestätigungs E mail :d
 
Mit dem im Review-Kit verschickten Asus Crossair V Formular 990FX Mainboard mit 990FX Chipsatz war der Verbrauch deutlich höher als mit einem Asus Board mit 880G Chipsatz.
Das waren doch von AMD verschickte Kits, oder? Die hätten das doch wissen müssen? :stupid:

Steht in der c't auch was zur Performance zwischen 990 und 880?
 
Einige von euch scheinen mal wieder Sehnsucht nach frischer Post zu haben. Diese wird bei gewissen Usern auch eintreffen, wenn hier nicht langsam mal angemessen diskutiert wird, ohne Provokationen.
 
Hier der erste ausführliche Linux Test von Phoronix mit FX8 und FX4.

[Phoronix] AMD FX-8150 Bulldozer On Ubuntu Linux Review


Und hier noch ein Vergleich mit Bulldozer Optimierung anhand von POV-Ray. Leider nur Version 3.6.x, also ohne Multicore Unterstützung. Bis zu 30% mehr, nett. MMn allerdings mit Vorsicht zu geniessen, da die Compilerflags nicht vollständig angegeben werden. Unterschiede können also zB auch durch unterschiedliche -Ox Flags zustande kommen.

http://www.abload.de/img/pov-ray_bdver17jr4.png

is ja schonmal ne geile sache
+30% performance durch ne compileroption
hoch lebe opensource ;)
 
wie siehts aus ulukay du hast doch einen FX 8150 vom ditech ne ?

geht schon was ? oder wartest noch auf die cpu ?
 
Das ist eigentlich nichts ungewöhnliches. Wenn die Programmierer innerhalb der letzten zehn Jahre ähnliche Leistungen wie die CPU-Hersteller gezeigt hätten, könnten wir die selbe heutige Software auf Pentium III PCs mit 512MB RAM laufen lassen...
 
is ja schonmal ne geile sache
+30% performance durch ne compileroption
hoch lebe opensource
Ganz so einfach ist es dann doch nicht. Das muss vorher schon in den Code implementiert werden. Ist viel Arbeit.

@Timbaloo: Steht nichts in der c't, Unterschiede zwischen 880G und 990FX sind aber nicht zu erwarten, da alles 'Wichtige' zwischen CPU und Speicher abläuft. Die Northbridge wird wohl nur interessant, wenn man dort noch etwas 'mitrechnendes' ankoppelt - z.B. eine Grafikkarte. Wurde aber nicht erwähnt.


Es ist aber auch noch ein Artikel zur Architektur im Heft und da sind mir zwei Punkte aufgefallen (die auch für die [wenigen] interessierten Leser dieses Threads neu sein dürften):

a) Die vier x86-Befehlsdekoder im Bulldozer betrachten pro Takt zwei 16-Byte große Code-Fenster. Die volle Brandbreite von vier dekodierten x86-Instruktionen (pro Fenster?) schaffen sie er nur, wenn die Instruktionen so codiert sind, dass sie nicht über die Fenstergrenzen hinaus gehen. Für die Geschwindigkeit des Frontends wäre es immanent wichtig, dass der Code auf diese 16-Byte-Fenster ausgerichtet ("alligned") ist. (Die Frage ist, was passiert, wenn der Befehl nicht ins Fenster passt?)
Bei SSE und AVX-Befehlen (die sind neu und daher recht lang, laut c't im Schnitt 5 Byte Maschinen-Code) passen in ein Fenster im Mittel günstigstenfalls nur 3 Befehle, ist der Code nicht auf die 16-Byte Fenster ausgerichtet sogar weniger.
So ganz versteh' ich den Abschnitt des Artikels aber nicht - Hatte aber vor einiger Zeit mal etwas von einem Cache-Aliasing-Problem gelesen, mangelndes Alignment ist ja auch eine Form von Aliasing :-?

b) die viel größere Überraschung: Die beiden FPUs (bzw. 128 Bit FMACs) können zwar 256 Bit 'Rechenergebnisse pro Takt produzieren', aber nur genau 128 Bit wegschreiben. Gibt zwar Puffer dafür, unter Dauerbeschuss (Linpack...?) dürften die aber sehr schnell volllaufen.
Was dran ist, weiß ich nicht. Die L1-Datencache-Schreibraten waren aber ja wirklich richtig mies. Nur weiß man jetzt nicht, obs von der FPU zum L1D-Cache oder von den Integerkernen aus gemessen wurde.
 
SSE5 war jedenfalls auf 128 Bit-Vektoren beschränkt - AVX mit 256 Bit Vektoren kommt von Intel. Deren Sandybridge Kern kann's auch in voller Vektorbreite verarbeiten, AMDs Bulldozer nur durch einen Trick (Kombinieren zweier FPUs).
Wenn du AMDs Lösung als Trick bezeichnest, dann ist Intels Lösung ein Doppeltrick. AMD hat zwei gleichwertige 128-bit FMACs, die je nach Auslastung geteilt werden oder gemeinsam genutzt werden können. Ob SSE oder AVX, ist hier belanglos. Denn auf unterstem Level wird eh alles in 8-bit bis 64-bit Skalare zerlegt, je nach Instruktion. Diese FMACs sind jedenfalls eine saubere Lösung innerhalb eines solchen Clusterdesigns. Intel hat letztendlich auch lediglich 128-bit Rechenwerke. Im Gegensatz zu AMD "klauen" die sich die zweiten 128-bit aber von den Integer SIMD Einheiten. Das ist alles andere als eine saubere Lösung. Bulldozer hat hier 2 zusätzliche 128-bit Integer SIMD Einheiten. Anandtech hatte den Aufbau bei SB schon mal erläutert. Daraus resultieren zwei Nachteile. 1., SB kann kein 256-bit Integer SIMD. Und 2., solange SB eine AVX Instruktion in den EUs verarbeitet, ist der jeweilige Port für 128-bit Integer SIMD Ausführung blockiert. Zumindest bei packed Instruktionen sollte das so sein. Beide Probleme hat Bulldozer nicht. Nur um das mal festgehalten zu haben. Also bitte erst die Details näher studieren, dann Halbwissen verbreiten. ;)
Mal davon abgesehen ist es uninteressant, ob SSE5 nun 128-bit oder AVX 256-bit ist. Es geht um die Funktionalität, die dahinter steckt. AVX erweitert diese einfach nur auf die doppelte Datenbreite. Das ist ein No-brainer. Und bezüglich Funktionalität hatte SSE5 sogar mehr zu bieten. Weil nicht alles von AVX abgedeckt wird, unterstützt AMD den Rest mittels XOP.

Ganz so einfach ist es dann doch nicht. Das muss vorher schon in den Code implementiert werden. Ist viel Arbeit.
Ich welchen Code? Den der Anwendung? Nope. Nur der Compiler braucht entsprechenden Support. Das machen aber die Compilerhersteller.
 
Ganz so einfach ist es dann doch nicht. Das muss vorher schon in den Code implementiert werden. Ist viel Arbeit.

von was redest du?
ich rede von einer compiler option.
d.h. klar, das hat den leuten arbeit gemacht, jetz ists in gcc drin. d.h. alles was du tun musst ist deine software, mit den richtigen flags, neu kompilieren. fertig!
 
mhh, mein 65€ i3 ist iwie schneller :fresse:

Ja gut, aber mal abgesehen vom direkten Vergleich

by2q9qudjyontm5kr.gif


ist es doch schon irgendwie verwirrend das bei Intel eine kontinuierliche Entwicklung von den S775 CPUs über die ersten core iX bis zu den aktuellen core iX von statten ging (auch wenn von core iX generation 1 zu generation 2 das mehr durch den Mehrtakt lief). AMD tritt da irgendwie auf der Stelle und ist in der Entwicklung bei vor 3 Jahren stehen geblieben. Finde ich schon sehr merkwürdig.

:confused::confused::confused:
 
Stimmt.

Wobei Anno für AMD besonders böse aussieht - ist das ein single thread Spiel?

Intel scheint halt die single thread Leistung von Generation zu Generation gesteigert zu haben und AMD packt einfach nur mit jeder Generation ein paar Kerne dazu. Als nächstes gibt es dann bestimmt 10-"Kerner".
 
Stell dir da nen AMD Athlon II, Nen Phenom I, Nen Phenom II und nen FX hin. Du wirst das (fast) gleiche Bild sehen. Halt nur mit weniger Frames. Die Entwicklung ging genauso voran. Nur halt nicht auf dem Niveau von Intel.
 
erste Eindruecke meines FX-8150
- nette metallbox, sieht aus wie ne keksdose. passt super zu weihnachten.
- mir fallen gleich die ohren ab. der cpuluefter ist ein radaubruder. 5500rpm ftw :fresse:
- turbo scheint in linux nicht zu funktionieren? er laeuft immer auf allen cores mit 3,6ghz. bzw sehe ich keine taktaenderungen in /proc/cpuinfo. kann aber sein dass CnQ und TurboCore in der neuen kernel version nachkommen. zumindest sah ich schon benches bei phoronix die darauf hindeuten
- trotz nur 3,6ghz und single-threaded benches, ist er schneller als ein phenom 2 (deneb) kern mit 3.0ghz. soooooo schlimm kanns um die ipc also nicht bestellt sein.
 
Zuletzt bearbeitet:
Zumindestens sollte sie mit dem schon lang existenten weitverbreitetsten Betriebssystem klar kommen auf dessen Fahrgestell die CPU ja letztendlich hin optimiert wurde

Sie kommt doch klar. Nur scheint es noch Optimierungspotenzial zu geben.

Überall hört man die Boards sind Schuld das Windows ist Schuld ec pp nur der ware Schuldige sitzt doch ganz wo anderst

So trivial zusammengefasst ist die Sachlage aber leider nicht. Du fängst schon wieder ohne Grautöne an zu argumentieren, wie episch.
Wer stürzt sich denn auf die rettende Windows 8 Insel? Ich sehe niemanden, wenn du welche siehst, dann hinterlege das doch mal mit Quotes und nicht mit sinnlosen übertriebenen Zusammenfassungen die scheinbar deiner Phantasie entspringen und das Thema neu für neu anheizen.

Vielmehr gibt es aus Absicht keine Samples der kleineren Versionen für die Presse, da diese Bulldozer in ein noch viel schlechteres Licht rücken als es das Topmodell zeigt.

DAs Topmodell kann sich doch auch kaum von den Phenom II Prozessoren absetzen und landet da doch viel eher Beinbruch als ein FX-4100 der auf Phenom II 955 Niveau liegt.
Also für mich ergibt das keinen Sinn. Da kann man aber auch anderer Meinung sein.

In beiden Fällen gewinnt in der Gesamtheit die "alte" CPU.

Computerbase Performancerating mit Anwendungen+ Spielen in geringer Auflösungen zeigen da aber eher eine Kopf an Kopf rennen.
Test: AMD

Und vergiss nicht. FX6100 und FX4100 laufen ohne Turbo, nur simuliert und mit niedrig taktendem RAM, also insgesamt auf dem selben Niveau. Plus minus 5%.

Und warum macht der Bulldozer nicht bereits unter W7 das was er soll ohne Abstriche frag ich dich?

Frag das doch am besten AMD oder Microsoft, warum ihn?
Du scheinst wirklichen ohne konkreten Diskussionsanatz hier weitermachen zu wollen.?!

Ach so MS ist Schuld das es so gekommen ist wie es ist stimmt "leuchtet mir vollkommen ein"

Na du scheinst dich ja ohne Basis darauf versteifen zu wollen es wäre AMD´s Schuld.?
Zumal diese Schuldfrage sowieso ziemlich lächerlich ist.
Was willst du uns also im Zusammenhang mit deinen vorherigen inhaltlich genau gleichen Posts also mitteilen? Erläutere das mal etwas genauer.
Wessen Schuld ist es denn nun ich frage dich.

Grummel schrieb:
Intel scheint halt die single thread Leistung von Generation zu Generation gesteigert zu haben und AMD packt einfach nur mit jeder Generation ein paar Kerne dazu.

Nun, so trivial ist es nun doch auch nicht, oder willst du das ernshaft jetzt diskutieren?
Nimm doch mal die kommenden Sandy Bridge E Prozessoren.
Wo kommt denn da die intelsche Revolution? Man ist doch dort auch schon längst am Limit, was die DieGröße angeht und was womöglich den zu erwartenden Verbrauch angeht und das all in all auch kaum schneller als aktuell Ivy Bridge, weil viele Kerne bis jetzt immernoch nicht gefragt sind. Ähnlich läuft es aktuell mit Bulldozer. Einfach kein auf den Desktop zugeschnittenes Design.
Man wird sich da bis ivy Bridge noch mit Verbesserungen >= 20% retten müssen.

Man kann die IPC nicht ins unendliche steigern.
Man braucht da anderweitige Mittel.
 
Zuletzt bearbeitet:
Frag das doch am besten AMD oder Microsoft, warum ihn?
Du scheinst wirklichen ohne konkreten Diskussionsanatz hier weitermachen zu wollen.?!



Na du scheinst dich ja ohne Basis darauf versteifen zu wollen es wäre AMD´s Schuld.?
.

Microsoft brauch ich da denke ich nicht fragen oder entwickeln die mittlerweile die CPUs für AMD

und um gleich vorzugreifen

Die Softwareplattform W7 hat schon weit vor dem Bulldozer Release bestanden jetzt klatscht man die B2 Stepping CPU hin und hofft auf W8?

Andere Firmen müssen für Veränderungen am OS auch bezahlen wenn sie Anpassungen für ihre Architektur wollen,wenn das aufgefallen ist warum hat man dann nicht vor Release reagiert?

Will man jetzt auch noch die User abstrafen die sich erst vor kurzen W7 gekauft haben?

und um gleich wieder vorzugreifen

sag mir jetzt bloß nicht W7 ist nicht mehr aktuell und deshalb hat man gleich mit Bulldozer auf W8 gewartet
 
Zuletzt bearbeitet:
Du kannst doch nicht verlangen, dass neue CPUs auf existierende Betriebssysteme optimiert werden. Wenn es so etwas geben sollte, dann höchstens vom Hersteller des OS selbst. Ansonsten hätten wir noch immer 16 Bit CPUs, weil die für DOS optimiert sind. Jeder baut eben seine CPU, und ob die Softwareindustrie irgendwann etwas Gescheites damit anfangen kann, zeigt sich dann später. Die wichtigste Vorraussetzung dafür ist übrigens, soweit ich das die letzten Jahrzehnte beobachten konnte, dass leistungssteigernde Features ohne unverhältnismässig großen Aufwand nutzbar gemacht werden können, ansonsten macht sich kein Softwarehersteller die Mühe.
 
Du kannst doch nicht verlangen, dass neue CPUs auf existierende Betriebssysteme optimiert werden. Wenn es so etwas geben sollte, dann höchstens vom Hersteller des OS selbst. .

Auf was sollten sie denn sonst hin optimiert werden?

Der geneigte Endanwender nutzt dieses Spielzeug nunmal mit existenter Software und nicht mit Software von übermorgen

Andere CPUs/Hersteller schaffen das doch auch ohne signifikante Einbußen im Leistungspotential,warum ist das was jahrelang funktionierte mit Bulldozer auf einmal negiert?
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh