[Sammelthread] AMD Bulldozer "New CPU Architecture" Sockel 942 AM3+ Sammelthread [Part 2]

Status
Für weitere Antworten geschlossen.
Der Bulldozer mit 8 Modulen wird doch ebenfalls deutlich niedriger takten als der Bulldozer mit 4 Modulen, analog zu Magny-Cours <-> Thuban.

Magny Cours 12 x 2,3GHz vs. 8 Modul Bulldozer 16 x ? (evtl. 2,0-2,5GHz)

Thuban 6 x 3,3GHz vs. 4 Modul Bulldozer 8 x 3,5GHz

Kann in beiden Fällen (Desktop und Server) 50% Leistungssteigerung bedeuten.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn die dinger ohne die implementierungen die Leistung haben würden ...
Was sie laut JF, wie Duplex schon richtig anmerkte, auch haben sollen.

... könnte Intel sich Ivy sparen, weil Amd einen Prozessor hätte der Intel Jahre vorraus ist
Kann man so nicht sagen. Es kommt ja auch noch ein 10-Kern Westmere und ein 8-Kern Sandy Bridge. Letzteren soll es auch für Desktop geben. Ein 8-Modul Bulldozer wird jedoch Servern vorenthalten bleiben. Letztendlich geht es vielmehr darum, wie man ein Produkt vermarktet. Die schnellsten Modelle sind sowieso keine Massenware. Es wird also wichtig sein, flächendeckend im Value-, Mainstream- und Performance-Markt attraktive Pakete anzubieten.
 
:drool:
Wenn die dinger ohne die implementierungen die Leistung haben würden, könnte Intel sich Ivy sparen, weil Amd einen Prozessor hätte der Intel Jahre vorraus ist und Intel nix mehr verkaufen würde

So siehts aber aus ... die Spec Werte *mit* dem AMD Compiler inkl. aktiviertem FMA4 werden mit nem 4Modul/8Thread Orochi sogar SandyE ins schwitzen bringen.

Hatte JF-AMD selbst im amdzone Forum deswegen gefragt, da ich eben auch dachte, dass die 50% inkl. AVX/FMA4/XOP/AES wäre .. .Antwort. Nöö das ist der SPeedUp alter legacy Software.

Wenns Dich interessiert, dann benützt dort mal die SuFu.
 
So siehts aber aus ... die Spec Werte *mit* dem AMD Compiler inkl. aktiviertem FMA4 werden mit nem 4Modul/8Thread Orochi sogar SandyE ins schwitzen bringen.
[...]

Oh, dann könnte es sogar sein, daß sich mal ein AMD-Prozessor hier einfindet.
Hoffentlich gelingt AMD ein ähnlicher Wurf wie damals der A64 einer war.
 
So siehts aber aus ... die Spec Werte *mit* dem AMD Compiler inkl. aktiviertem FMA4 werden mit nem 4Modul/8Thread Orochi sogar SandyE ins schwitzen bringen.
Nun ja, soweit würde ich noch nicht gehen. Unterschätze mal Sandy Bridge E nicht. Das wird kein Leichtgewicht, selbst ohne FMA. Den zu knacken, ist aber auch nicht die Aufgabe von Zambezi/Valencia. Da gibt's ja noch Interlagos.
 
Nun ja, soweit würde ich noch nicht gehen. Unterschätze mal Sandy Bridge E nicht. Das wird kein Leichtgewicht, selbst ohne FMA. Den zu knacken, ist aber auch nicht die Aufgabe von Zambezi/Valencia. Da gibt's ja noch Interlagos.
Na ich sag ja schwitzen, nicht schlagen ;)

MC schlägt sich auch so schon ganz gut in SpecRate, und Spec bekommt bei AMD neben den bereits erwähnten FMA4 und AVX noch nen Zusatzschub durch AES & SSE4.1/2 (bzw. halt dem AVX Äquivalent). Der fällt bei Intel geringer aus, da beides eh schon genutzt wurde. In SPec gibts da ein paar Crypto und Stringsachen die davon gut profitieren.

Natürlich wird Sandy bei 8core/16Thread gegen den kleinen BD mit 4m/8th vorne liegen, aber es wird enger als bisher werden. Der 8c SandyE sollte ausserdem nur eher moderat takten.

@Sven Bode & pajaa:

Compiliert Ihr selbst ? ;-)
Ohne FMA4 Code etc. hat man nicht viel davon :(

Im Gegensatz zu 3dnow! gibts jetzt nen AMD Compiler, der es nützen kann und man wird die tollen Resultate sicherlich an die große Glocke hängen und gut Werbung damit machen können. Aber der praktische Nutzen von FMA4 & Co ist erst einmal der gleiche wie 3dnow!.
Und im SSE4.1 Fall ist die Frage ob aktuelle Programme keine Intel Abfrage eingebaut haben ... :(
 
Zuletzt bearbeitet:
[...]

@Sven Bode & pajaa:

Compiliert Ihr selbst ? ;-)
Ohne FMA4 Code etc. hat man nicht viel davon :(

Im Gegensatz zu 3dnow! gibts jetzt nen AMD Compiler, der es nützen kann und man wird die tollen Resultate sicherlich an die große Glocke hängen und gut Werbung damit machen können. Aber der praktische Nutzen von FMA4 & Co ist erst einmal der gleiche wie 3dnow!.
Und im SSE4.1 Fall ist die Frage ob aktuelle Programme keine Intel Abfrage eingebaut haben ... :(

Ich gehe einfach mal davon aus, daß die Software, die die meiste Leistung braucht, auch so compiliert wird. Das mag blauäugig sein, aber ich fürchte, daß der S2011-Sandy ein zu dickes Schwergewicht wird.
Außerdem wollte ich auch mal was geschrieben haben :d
 
Na ich sag ja schwitzen, nicht schlagen ;)
Na dies kommt wohl auf den Kühlkörper an :d
MC schlägt sich auch so schon ganz gut in SpecRate, und Spec bekommt bei AMD neben den bereits erwähnten FMA4 und AVX noch nen Zusatzschub durch AES & SSE4.1/2 (bzw. halt dem AVX Äquivalent). Der fällt bei Intel geringer aus, da beides eh schon genutzt wurde. In SPec gibts da ein paar Crypto und Stringsachen die davon gut profitieren.
Wenn Amd das, was bisher in jeder offiziellen Leistungsangabe die ich bei luxx base und co. NICHT lesen konnte, wirklich hinbekommen sollte. RESPEKT

Ich kann es mir aber nicht vorstellen!
1. weil der grosse Bulldozer *nur*900mill Transen hat also gleichauf mit Intels 2600k aber dabei 30 Watt mehr verbrauchen soll...
Das erklärt auf jeden fall bei gleicher Struktur und mehr *Instuktionsverarbeitungsmöglichkeiten/wege* eine mehrleistung gegenüber dem 2600k halt in Richtung Gulftown.

Allein die Aussage wir machen kleinere Kerne 80% mit mehr Leistung *shrink* und Instuktionen...
Wenn man glauben würde das alle Instuktionen nix mit der angegebenen mehrleistung zu tun hätte, würde Amd aus seinem Bulldozer *designunabhängig* fast 100% Leistungszuwachs haben.
Technisch nicht möglich! Also unglaubwürdig...

Natürlich wird Sandy bei 8core/16Thread gegen den kleinen BD mit 4m/8th vorne liegen, aber es wird enger als bisher werden. Der 8c SandyE sollte ausserdem nur eher moderat takten.
Ja Stimmt :rolleyes: der Strom wird das ganze begrenzen... hab ich garnicht dran gedacht 130?W
@Sven Bode & pajaa:

Compiliert Ihr selbst ? ;-)
Ohne FMA4 Code etc. hat man nicht viel davon :(

Im Gegensatz zu 3dnow! gibts jetzt nen AMD Compiler, der es nützen kann und man wird die tollen Resultate sicherlich an die große Glocke hängen und gut Werbung damit machen können. Aber der praktische Nutzen von FMA4 & Co ist erst einmal der gleiche wie 3dnow!.
Und im SSE4.1 Fall ist die Frage ob aktuelle Programme keine Intel Abfrage eingebaut haben ... :(

Ich finds ja toll wie ihr Bully vergöttert, aber ein wenig objektiv kann man schon bleiben.
 
Zuletzt bearbeitet:
wann ist denn dieser Bulldozer im Laden erhältlich?
 
MC schlägt sich auch so schon ganz gut in SpecRate, und Spec bekommt bei AMD neben den bereits erwähnten FMA4 und AVX noch nen Zusatzschub durch AES & SSE4.1/2 (bzw. halt dem AVX Äquivalent). Der fällt bei Intel geringer aus, da beides eh schon genutzt wurde. In SPec gibts da ein paar Crypto und Stringsachen die davon gut profitieren.
Schon richtig. Dafür hat Sandy Bridge E aber auch noch einiges zu bieten gegenüber seinen Vorgängern, zB einen fetten L3 Cache und erstmals Quad-Channel Support. Valencia bekommt zB nur Dual-Channel Support. Es würde mich doch stark wundern, wenn FMA und höherer Takt ausreicht, damit Valencia in specrate mit einem Prozessor mit doppelt so vielen logischen Prozessoren und doppelt so breiter Speicheranbindung gleichzieht oder zumindest sehr nahe kommt.
 
Ich kann es mir aber nicht vorstellen!
1. weil der grosse Bulldozer *nur*900mill Transen hat also gleichauf mit Intels 2600k aber dabei 30 Watt mehr verbrauchen soll...
Das erklärt auf jeden fall bei gleicher Struktur und mehr *Instuktionsverarbeitungsmöglichkeiten/wege* eine mehrleistung gegenüber dem 2600k halt in Richtung Gulftown.
Sry, aber les dich mal in das Thema Intel TDP vs AMD TDP ein. Intel benutzt einen "Druchschnittsverbrauch" für diese Angabe, AMD den Maximalwert. Bei AMD ist der ACP = Intels TDP. Aber das ist OT und gehöhrt hier nicht hin.

Allein die Aussage wir machen kleinere Kerne 80% mit mehr Leistung *shrink* und Instuktionen...
Wenn man glauben würde das alle Instuktionen nix mit der angegebenen mehrleistung zu tun hätte, würde Amd aus seinem Bulldozer *designunabhängig* fast 100% Leistungszuwachs haben.
Technisch nicht möglich! Also unglaubwürdig...
Was? Wo hat er 100% mehr Leistung? Aus dem Wirrwar werde ich irgendwie nicht schlau.

Ja Stimmt :rolleyes: der Strom wird das ganze begrenzen... hab ich garnicht dran gedacht 130?W
Siehe ersten Quote.
 
Ich kann es mir aber nicht vorstellen!
Hmm, dann konntest Du Dir den Sprung von auf Cothan -> Conroe sicher auch nicht vorstellen ;)

Wenn man glauben würde das alle Instuktionen nix mit der angegebenen mehrleistung zu tun hätte, würde Amd aus seinem Bulldozer *designunabhängig* fast 100% Leistungszuwachs haben.
Technisch nicht möglich! Also unglaubwürdig...
Hmm, schau mal z.B. Westemeres der AES SpeedUp an, das sind "etwas" mehr als 100% :asthanos:

Sowas ist mit neuen Instruktionen Gang und Gäbe. Würde FMAC unterstützt werden, dann hat die BD FPU z.B. mal schnell die doppelte, theor. Leistung ... also 200%.

Ja Stimmt :rolleyes: der Strom wird das ganze begrenzen... hab ich garnicht dran gedacht 130?W
Jupp.
Ich finds ja toll wie ihr Bully vergöttert, aber ein wenig objektiv kann man schon bleiben.
HMm, war ich das nicht, indem ich darauf hinwies, dass man auch passende Compilate bräuchte ?

@mr.dude:

Ahh Mist, hab den QuadChannel vergessen. Ok, dann wirds doch nicht so einfach, SpecRate profitiert ja auch von der Speicherbandbreite.

Danke

Alex
 
selbstverständlich takten die Server niedriger als die Desktop Modelle, das war doch schon immer so.
 
Was es da genau für Prozzis gibt weiß man noch nicht oder'?
 
doch schon
2 moduler mit 4 kernern
4moduler mit 8 kernen mit ca. 3,5ghz

nur wann die rauskommen grübelt man seid 2007 :)
nich das die ausgenudelt sind bevor die aufn markt kommen :d

Außerdem noch 3 Module mit 6 Kernen. die könnten P/L technisch wohl am interessantesten werden.

ja es wurde seit 2007 noch viel am BD rumgeschraubt, der hat halt mit dem K10.5 nicht mehr viel zu tun, in weiten Bereichen. Und über 32nm war das Konzept halt nich zu verwirklichen und der prozess musste ja auch erstmal bereitstehen.
 
Jup
ich hab mir die Seite die mir Opti empfohlen hat mal durchgelesen... naja zumindest ansatzweise :)

Wenn ich JF oder wie der heisst richtig interpretiere, sollen die einzelnen Kerne wenn alle angesprochen werden die gleiche ops haben wie der Phenom.
Wenn aber nur die hälfte der Kerne angesprochen wird soll sich das Verdoppeln.
Das war das was ich mich gefragt hatte.

Wie gesagt nur ansatzweise durchgelesen
wenn man sich allerdings
Interlagos 16 Kernen 3,5 GHz 224 GFlops und das teilt kommt man auf die 112 gflops edit Theoretisch oder praktisch konnt ich nicht rauslesen
was angesichts der tatsache das
2600k 4Kerne 900mio transen mit integr gpu glaub um die 200transen von 900..
und bully 4 moduler 8Kerne knapp 900mio transen hat
recht realistisch erscheint

wäre im vergleich
2600k 104gflops pro kern 26...
bully 4 modul 112 gflops pro kern 14 bzw. 28gflops wenn sich der 2te abschaltet. Allerdings sollen diese fma befehle noch nicht reif sein um das zu realisieren was aber nur eine frage der zeit ist und nicht vom kauf abhalten muss.
Mit wohl 125W?*mal reininterpretiert* aber etwas hoch... und im vergleich
2600k 4 kerne
bully 8 kerne
was heissen könnte das bully sein ghz potenzial recht hoch ausreizt, sandy noch potenzial hat *oc*

Also abwarten und tee trinken.
 
Zuletzt bearbeitet:
Ja Bulldozer hat einen TDP zwischen 95 und 125 (4Modul) oder zwischen 65 und 95 (2Modul?) gab dazu mal ne Folie von AMD.

Aber wie schon in #735 geschrieben du kannst die TDP Werte von Intel und AMD nicht vergleichen!

Mal durchlesen: AMD: TDP ist out, neue Opterons bald mit 2,5 GHz - Magnus.de Ist zwar nicht mehr ganz aktuell aber es stimmt immer noch, was da steht.

Hinzu kommt noch, das AMD die TDP in Gruppen einteilt: sprich <65W, <95W, <125W.

Und wenn man jetzt den TDP des 120W Prozessors in dem Link anschaust, hat er ein ACP von 105W, was man so vermutlich auch auf den Bulldozer übertragen kann. Das ganze ist jetzt vllt. etwas naiv aber ich würde beiden Prozessoren ein ähnlich gutes Taktpotenzial zumuten.
 
Ob Bulli was mit SB-E anfangen kann oder nicht, wird daraum ankommen, wie Intel den SB-E überhaupt vermarktet bekommt im Desktop-Segment.
Er hat mit 8 Kernen und 16 Threads im Desktop-Bereich in sich schonmal ein Problem. Der Sprung von 6 auf 8 Kerne sollte im Desktop-Bereich auf absehbarer Zeit vernachlässigbar sein. Auf der Verbrauchsseite sind die zwei Kerne mehr aber nicht das Schlimme, der L3-Cache ist es. Er ist viel grösser als beim Gulftown und zu allem Überfluss läuft er auchnoch mit vollem Takt. Bei dem L3-Cache-Design kann man fast davon ausgehen, dass Intel den SB-E niedriger, aber maximal genauso hoch takten wird als Gulftown.
Orochi ist ganz sicher nicht in der Lage mit dem Geschoss zu konkurrieren, muss er aber auch nicht, denn Orochi ist, wie es bisher aussieht, von Grösse und Wärmeentwicklung eher mit Deneb vergleichbar. Er ist, wenn man so will, eher ein 4-Kerner mit Option auf 8-Kerner-light, eben ein Desktop-Prozessor, der die "Leichtigkeit" eines 4-Kerners mit der Wucht eines 8-Kerners verbindet.
Der große Joker kann aber die FPU sein, denn wenn FMA wirklich genutzt wird, kann das gewaltige Konsequenzen haben. Da ist der große Unsicherheitsfaktor. Mit 3DNow!-Zeiten ist das aber aus folgenden Gründen nicht mehr vergleichbar:
1.) AMD ist bei den Compilerherstellern inclusive Microsoft mittlerweile etabliet, das waren sie damals nichtmal ansatzweise.
2.) Es gibt nurnoch AMD und Intel. Zu 3DNow!-Zeiten gab es mehr Wettbewerber.
3.) FMA/XOP ist keine Komromisslösung. Das originale 3DNow! war ein Kompromiss zwischen AMD und Cyrix/IBM, was es schwächer machte, als es eigentlich sein sollte.
4.) Intel wird FMA ebenfalls nutzen, wenn auch viel später. Dann könnte es aber zu spät für einen eigenen FMA-Befehlssatz für Intel sein.
5.) AMD hat einen "eigenen" Compiler. Die entsprechenden Hersteller werden den auch einsetzen, um insbesondere mit Interlagos optimal arbeiten zu können.
 
Ne laut analysten ist fma derzeit viel z früh integriert und soll erst in 2 jahren effektiv nutzbar sein...
deswegen hat intel sich wohl dafür entschieden erstmal die ops zu verdoppeln... was sich mit dem fma bei intel dann nochmal einen gewaltigen schub bringt...

der 8kerner sandy wird schon ne bombe der dann mit dem interlagos 16 kerner vergleichbar wird...

der bully wird also mit den jahren seine gesammte leistung nutzen können, was vielleicht auch für die etlichen launch verschiebungen spricht...

sandy wird noch kein fma unterstützen, ist angesichts der leistung auch erstmal zu vernachlässigen...
wenn haswell mit dem shrink dann 16 kerne haben sollte :hail: wird die cpu leistung geradezu explodieren... aber das ja zukunftsmusik

bully wird sicher ein schöner prozessor
 
Gibts denn jetzt schon Benchmarks, wo man auch als Laie sieht wie schnell das Ding ist? Wenn ich in diesem Thread lese verstehe ich ehrlich gesagt weniger als nur Bahnhof?:confused:

Und ein Release Date gibts immer noch nicht? Verstehe nicht wieso AMD nicht klipp und klar sagt wann es rauskommt:kotz:
 
Ich hatte vorhin sowas gefunden wo ein 16kerner gebencht wurde

hab leider den link nich übertragen :( daher hab ich dann die 224gflops copy paste und wegen der gleichen ghz zahl halbiert auf den bully übertragen

ob das seriös war weiss ich allerdings auch ned...
 
Ne laut analysten ist fma derzeit viel z früh integriert und soll erst in 2 jahren effektiv nutzbar sein...
deswegen hat intel sich wohl dafür entschieden erstmal die ops zu verdoppeln... was sich mit dem fma bei intel dann nochmal einen gewaltigen schub bringt...

Auf dem Server ist das kein Thema, da ist es eigentlich normal das man die wirklich Performance kritischen Anwendungen entsprechend kompiliert, generic code kann man sich da nicht leisten.

Auf dem Desktop kommt es auf Marketing an. Wenn AMD clever ist bringen sie gleichzeitig eine Art "App-Shop" in dem sie optimierte Software verbreiteter OpenSource Software kostenlos zum Download anbieten (alleine ein schneller Server und keine Werbung wären ja schon was wert). Man sollte den möglichen Gewinn nicht unterschätzen. Swiftfox legt im Sunspider z.B. ordentlich zu, 1275ms gegenüber 2487ms bei mir!. VLC, ffmpeg, imagemagick,... der ganze Kram den jeder nutzt würde davon ordentlich profitieren.
 
JF sagte, die EMEA-Truppe würde nichts zeigen, was das US-HQ nicht schon publik gemacht hätte. Bulldozer BCD adé? :(
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh