Angeblich erste Taktraten von AMDs Bulldozer-Plattform aufgetaucht

Neurosphere · 27.05.2011

HardlineAMD schrieb:
@Neurosphere
Mit anderen Worten, du weißt es NICHT.
Irgendwelche Vermutungen aufstellen und einen auf Ingenieur machen kann jeder.

Ähm, doch, ich weiß es. Nur ob eine kürzere Pipeline außerhalb der Möglichkeiten lag weiß ich nicht. Eine längere Pipeline hat vor und Nachteile. Frage ist halt nur wie gut man die Vorteile ausnutzen und die Nachteile umgehen kann.

Das Paper was dude gepostet hat ist interessant, muss ich mir mal zu gemühte führen.

Wo hab ich eigentlich Jehova geschrien das viele gleich immer nen Angriff gegen ihre Lieblingsmarke vermuten?

Duplex · 27.05.2011

Die Pipeline von Bulldozer ist garnicht mal so lang, Sie ist sogar kürzer als Nehalem-P6

K7 = 12 Stufen
K15 = 15 Stufen
Nehalem P6 = 16 Stufen

Neurosphere · 27.05.2011

Wie lang ist den die Pipeline von Bulldozer? Bisher geht man soweit ich weiß von gleich oder Länger als 18 aus.

15 sind es meines wissen jedenfalls nicht.

Terr0rSandmann · 27.05.2011

Ich wette ich werde mich tierisch ärgern, dass ich mir kürzlich ein 2600k geholt habe

Aber hatte einfach keine Lust mehr auf das ewige Warten.

Aber ich glaube echt, dass Bulldozer Sandy ordentlich einheizen wird und die Sandys kein Land mehr sehen werden, aber naja ... schauen wir mal.

mr.dude · 27.05.2011

Einen schönen Artikel zu den Pipelines gibt es von Opteron hier. Demnach wären es 12 Stufen für K8/K10. Zumindest was die Integer Verarbeitung betrifft. Ich habe mal irgendwo aufgeschnappt, dass es für Bulldozer 3 Stufen mehr sein sollen. Keine Ahnung, ob da was dran. 15 könnte da aber durchaus hinkommen. Core 2 hatte übrigens 14 Stufen.

Opteron · 27.05.2011

Also an 15 Stufen kann ich mich ebenfalls nicht erinnern, eher an 17-18 wie Neurospehre sagte.
Im 15h Manual steht unter Schlüsselmerkmale ja auch:

• Deep out-of-order integer and floating-point execution

15 Stufen wären doch kein "deep" ;-)

Irgendwas zw. Nehalem und Northwood sollte der SweetSpot sein. Da passt 18 ganz gut ;-)

mr.dude · 27.05.2011

Na ja, "Deep out-of-order integer and floating-point execution" stand auch schon im 10h Optimization Guide. Das sagt uns irgendwie recht wenig.

w0mbat · 27.05.2011

1. mydrivers.com ist nicht die quelle!
2. das bild stammt von mir.
3. die genannten zahlen stehen nicht auf der slide, die wurde falsch erraten.
4. selbst ASUS weiß die finalen GHz noch nicht, deshalb wurden dort platzhalter verwendet.
5. warum recherchiert eigentlich niemand mehr sonder man schreibt einfach so alles ab?

Opteron · 28.05.2011

@mr.dude:
Achso, na dann ist das nur wieder copy/paste aus 10h, lol.

w0mbat · 28.05.2011

Opteron schrieb:
P.S: recherchiert

damn. ich wusste das es schräg aussieht :heul:

gott sei dank habe ich mein deutsch abi schon seit ein paar jährchen

Mondrial · 28.05.2011

w0mbat schrieb:
5. warum recherchiert eigentlich niemand mehr sonder man schreibt einfach so alles ab?

Weils nur um Sensationsgier geht und man muss natürlich ERSTER sein...Aktuelles Negativ-Beispiel mal wieder von PCGH. Da kam ja vor ein paar Tagen die News, dass Bulldozer angeblich zu spät kommt. Diese wurde auch mit "weiteren Hinweisen" geupdatet...vom Dementi seitens AMD jedoch bisher keine Spur auf der Seite.

Plagiason · 28.05.2011

Wo gibt es ein offizielles Dementi von AMD?
Das es keine Recherche gibt wunder doch nicht bei dem billig Journalismus auf den einschlägigen Hardwareseiten. Es wird nur abgeschrieben, niemals rechercheirt und auch nicht ein paar Tage später nochmals nachgeschaut, ob der Müll, den man verzapft hat auch wirklich stimmt. Siehe zB MSI Tablet mit angeblich E-350 APU. Man kann einfach nur lachen, das es sich eine Hardwareseite traut, so einen Witz auch nur zu veröffentlichen. Nur weil der Shop zu dumm ist und eben auch die gleichen Fehler macht, wie man sie in der Zeitschrift von Hardwareluxx findet, müssen diese nicht wahr sein. Trotzdem ist man einfach zu faul diesen Fehler auszubessern und pflegt seinen billig Journalismus.

mr.dude · 28.05.2011

BSN hat wohl nochmal direkt bei AMD nachgefragt. Und die haben die Gerüchte dementiert.

Plagiason · 28.05.2011

Nun ein wirkliches Dementi sehe ich nicht darin. Hat aber genau den Wert wie all das andere Bulldozer kommt später Gequatsche. Natürlich wird es keine News darüber geben. Man macht sich doch jetzt schon zum Depp, also zum billig Journalist und würde mit einer weiteren Meldung sich damit die Krone aufsetzen. Doch für die ganzen billig User, die sich ereifern ihre billig Theorien mit billig Meldungen zu veröffentlichen reicht das doch. So kann jeder seinem billig Fanclub nacheifern und einfach nur billig sein.

mr.dude · 28.05.2011

Nun ja, wie immer man Dementi interpretiert. Die AMD Leute sagen:

... we indicated early summer for desktops and late summer for servers. And that's still where we're at. ... Our public roadmap has not changed. ...

Das ist zumindest eindeutig.

CyLord · 28.05.2011

Plagiason schrieb:
Nun ein wirkliches Dementi sehe ich nicht darin. Hat aber genau den Wert wie all das andere Bulldozer kommt später Gequatsche. Natürlich wird es keine News darüber geben. Man macht sich doch jetzt schon zum Depp, also zum billig Journalist und würde mit einer weiteren Meldung sich damit die Krone aufsetzen. Doch für die ganzen billig User, die sich ereifern ihre billig Theorien mit billig Meldungen zu veröffentlichen reicht das doch. So kann jeder seinem billig Fanclub nacheifern und einfach nur billig sein.

Eine Verschiebung wäre längst offziell gewesen. Bei den Herstellern muss man ja auch planen. Ich gebe nicht viel darauf, was da ein paar einzelne Leute sagen.

brasillion · 28.05.2011

man sieht aber schon an den am3+ boards(970,990) die gelistet sind,das es net mehr lange dauert.

Chezzard · 28.05.2011

brasillion schrieb:
man sieht aber schon an den am3+ boards(970,990) die gelistet sind,das es net mehr lange dauert.

Reihe Spekulation, zumal AMD plötzlich einen Grundlegenden Fehler bemerken kann, der es nötig macht, alle bisher hergestellten Prozessoren zu vernichten und nochml deteailarbeit zu leisten.

Dieses "Chipsatzdilemma" hatte am anfang auch keiner bemerkt, bis sich ein Paar "Experten" wichtig gemacht haben....

brasillion · 28.05.2011

mhm glaub ich nicht dran das sowas passiert,was aber passieren könnte wäre so etwas wie beim phenom 1. Mhm mal schaun,ist ja nicht mehr lange bis dahin.

Aber meine glaskugel sagt das er die tage kommt und sich nicht verzögern wird.

Chezzard · 28.05.2011

brasillion schrieb:
mhm glaub ich nicht dran das sowas passiert,was aber passieren könnte wäre so etwas wie beim phenom 1. Mhm mal schaun,ist ja nicht mehr lange bis dahin.

Aber meine glaskugel sagt das er die tage kommt und sich nicht verzögern wird.

Wie gesagt, möglich ist ja alles, was dann wirklich ist, wird uns die Zeit zeigen.

Auch wäre noch feilen am BIOS ein Möglicher Grund für eine leichte verzögerung und und und.....

Villeicht verspätet er sich aber auch nicht.

Meine Glaskugel ist noch auf RMA.
Wo hast du deine eingeschickt, dass die schon wieder flott ist :wink:

??

brasillion · 28.05.2011

meine war bei evga,da geht der support ja etwas schneller :P.

Meine hoffnung liegt auf dem bully,er muss gut werden

Chezzard · 28.05.2011

Die einen Sagen ja : Bulldozer ist nichts besonderes und haben dafür "Quellen" .
Die anderen widerum: Bulldozer ist der burner und haben natürlich auch "Quellen".

Bekanntermaßen liegt die Wahrheit ingendwo dazwischen.

Wie sieht es mit den Sprungvorhersagen bei AMD aus, sollte BD ja eine Elendig lange Pipe-line haben?

Ja brasillion, EVGA sind wirklich etwas schneller.
Meine nächste hol ich mir auch von dort.
Vor allem wegen der erhaltenbleibenden Garantie bei umstieg auf Wakü.....

Schaffe89 · 29.05.2011

Elandig lang? Vergleich mal mit Sandy oder dem Pentium 4.
Selbsternannte "Kenner" meinen, dass sich durch die längere Pipeline die IPC verschlechtern solle.
Die Wirklichkeit wird aber laut AMD´s Fruehe anders aussehen.
Eine verschlechterung der IPC hat er vehement abgestritten, sogar wenn 2 Threads mit zwei Integer Einheiten laufen.
Integer Kerne will ich gar nicht mehr sagen.

mr.dude · 29.05.2011

Chezzard schrieb:
Wie sieht es mit den Sprungvorhersagen bei AMD aus, sollte BD ja eine Elendig lange Pipe-line haben?

Was ist denn für dich eine "elendig lange Pipeline"? Ich vermute, dass sich Bulldozer in Nehalem / Sandy Bridge Regionen bewegen wird.

Der Optimization Guide sagt folgendes:

To predict and accelerate branches, AMD Family 15h processors employ a combination of next-
address logic, a 2-level branch target buffer (BTB) for branch identification and direct target
prediction, a return address stack used for predicting return addresses, an indirect target predictor for
predicting indirect jump and call addresses, a hybrid branch predictor for predicting conditional
branch directions, and a fetch window tracking structure (BSR). Predicted-taken branches incur a 1-
cycle bubble in the branch prediction pipeline when they are predicted by the L1 BTB, and a 4-cycle
bubble in the case where they are predicted by the L2 BTB. The minimum branch misprediction
penalty is 20 cycles in the case of conditional and indirect branches and 15 cycles for unconditional
direct branches and returns.

Nimmt man die Penalty als Indikator, dann sollte die Pipeline irgendwo zwischen 15 und 20 Stufen lang sein.

Mal einige Zahlen zum Vergleich aus Agner Fogs Mikroarchitektur Optimization Guide:

In the PMMX, the penalty for misprediction of a conditional jump is 4 clocks in the U-pipe,
and 5 clocks if it is executed in the V-pipe. For all other control transfer instructions it is 4
clocks.

In the PPro, P2 and P3, the misprediction penalty is higher due to the long pipeline. A
misprediction usually costs between 10 and 20 clock cycles.

Branch mispredictions are much more expensive on the P4 and P4E than on previous
generations of microprocessors. The time it takes to recover from a misprediction is rarely
less than 24 clock cycles, and typically around 45 µops. Apparently, the microprocessor
cannot cancel a bogus µop before it has reached the retirement stage. This means that if
you have a lot of µops with long latency or poor throughput, then the penalty for a
misprediction may be as high as 100 clock cycles or more.

The misprediction penalty is approximately 13 clock cycles in the PM and 15 clock cycles in
the Core2

Nehalem: The misprediction penalty is longer than on Core2 due to a longer pipeline. The measured
misprediction penalty is at least 17 clock cycles.

Sandy Bridge: The misprediction penalty is often shorter than on the Nehalem thanks to the µop cache
(see page 94 below). The misprediction penalty was measured to 15 clock cycles or more
for branches inside the µop cache and slightly more for branches in the level-1 code cache.

Atom: The penalty for mispredicting a branch is up to 13 clock cycles.

VIA Nano: The misprediction penalty is typically 16 clock cycles, max. 20.

K10: AMD manuals say that the branch misprediction penalty is 10 clock cycles if the code
segment base is zero and 12 clocks if the code segment base is nonzero. In my
measurements, I have found a minimum branch misprediction penalty of 12 and 13 clock
cycles, respectively.

Man sieht, dass Bulldozer im Rahmen anderer Mikroarchitekturen liegt. Die einzige Architektur, die hier sichtbar aus der Reihe tanzt, mal abgesehen vom Pentium MMX, ist Netburst. Man sollte Bulldozer daher nicht so betrachten, als ob er eine ungewöhnlich lange Pipeline hätte. K8/K10 hatte schlichtweg eine relativ kurze Pipeline. AMD scheint sich mit Bulldozer nun anderen aktuellen Architekturen anzunähern. Selbst wenn Bulldozer die eine oder andere Stufe mehr haben sollte als Nehalem / Sandy Bridge, so ist das noch nicht wirklich kritisch. Auch bezüglich Sprungvorhersage besitzt Bulldozer jede Menge verbesserte Logik, um falsche Vorhersagen zu minimieren. Am Ende muss man schauen, was sich mehr rentiert. 1% mehr IPC wegen weniger falscher Sprungvorhersagen? Oder 5% mehr Takt? Die Ingenieure werden das sicherlich besser beurteilen können als wir.

Opteron · 29.05.2011

mr.dude schrieb:
1% mehr IPC wegen weniger falscher Sprungvorhersagen? Oder 5% mehr Takt? Die Ingenieure werden das sicherlich besser beurteilen können als wir.

Ja, wobei das jetzt ein schlechter Vergleich ist.
Je länger die Pipeline, desto wichtiger ist die Sprungvorhersage, da man eben jetzt 20 Takte anstatt der bisherigen 10 oder 12 verliert.
D.h. eine falsche Vorhersage hat bei BD ungefähr den doppelten Bremseffekt.

Aber dafür wurde die Vorhersage ja im Vergleich zu K10 drastisch aufgebohrt. Wollen wir hoffen, dass es jetzt besser mit dem Vorhersagen klappt ;-)

mr.dude · 29.05.2011

Opteron schrieb:
Ja, wobei das jetzt ein schlechter Vergleich ist.
Je länger die Pipeline, desto wichtiger ist die Sprungvorhersage, da man eben jetzt 20 Takte anstatt der bisherigen 10 oder 12 verliert.
D.h. eine falsche Vorhersage hat bei BD ungefähr den doppelten Bremseffekt.

Der Vergleich bezog sich auch nicht auf K10, sondern auf "die eine oder andere Stufe mehr als Nehalem / Sandy Bridge". Gegenüber K10 sollen es auch nicht nur 5% mehr Takt sein, sondern irgendwas 20+%.

Phantomias88 · 29.05.2011

Ist die selbe News, allerdings von den Schweden und mit Google übersetzt: Google Übersetzer

Ich fand den letzten Satz interessant:

Der Start von AMDs FX-Serie mit dem Bulldozer ist auf der E3 in Los Angeles in den Vereinigten Staaten. Sie findet am 7-9 Juni statt, und kurz danach, sind diese Prozessoren für den Verbraucher in den Geschäften erhältlich.

Sollte man jetzt nicht auf die Goldwage legen, aber das Jahr sollte stimmen! :fresse:

MfG

Chezzard · 30.05.2011

Auf jeden Fall dude.

Und noch was zu neurosperes Aussage dass Takt ein wichtiges Leistungs und Marketing argument ist.

Das ist schlichtweg Falsch.

Takt ergibt sich aus der Architektur und der Qualität der geleisteten Arbeit in der Produktion/ Spannungsversorgung.

Es ist rein Theoretisch mögich, einen Dual Core herzustellen der bei 2 ghz alles biser dagewesene in den Schatten stellt.

Und im Marketing zählt Leistung nicht GHZ.
(Kommt mir ja nicht mit Blödmarkt...)

giga lightstorm · 30.05.2011

Es ist rein Theoretisch mögich, einen Dual Core herzustellen der bei 2 ghz alles biser dagewesene in den Schatten stellt.

Warum macht man das dann nicht? Wäre doch das beste, denn mit höherem Takt gibt es ja auch Probleme wie z.B. den Energieverbrauch, und für mehr Cores muss man die Software erst mal parallelisieren.

Bitch · 30.05.2011

Chezzard schrieb:
Und im Marketing zählt Leistung nicht GHZ.
(Kommt mir ja nicht mit Blödmarkt...)

NENENE
Beim Marketing ist die REALE LEISTUNG vollkommen egal...

Marketing ist lediglich die Wissenschaft die dummheit des Menschen psychologisch auszunutzen...

Erinnern wir uns an Athlon xp und Intel p4

Angeblich erste Taktraten von AMDs Bulldozer-Plattform aufgetaucht

Enthusiast

Urgestein

Enthusiast

Legende

Urgestein

Semiprofi

Urgestein

Enthusiast

Semiprofi

Enthusiast

Urgestein

Banned

Urgestein

Banned

Urgestein

Enthusiast

Urgestein

Semiprofi

Urgestein

Semiprofi

Urgestein

Semiprofi

Banned

Urgestein

Semiprofi

Urgestein

Banned

Semiprofi

Enthusiast

Banned