[Sammelthread] AMD 45nm K10.5 "Shanghai"-Generation

redfirediablo · 11.07.2008

Welcher aktuelle Phenom schafft den bitte 3,5 ghz? Abgesehen davon waren das 2,3 ghz Modelle die so hoch gezogen worden sind. Stell dir mal vor was ein BE mit standardtakt 2,8 oder vielleicht 3,0 ghz schaffen wird mit den neuen 750er und 800er SBs!

Frei mich schon auf Weihnachten, das wird ein Spaß, noch dazu bei der verbessertern IPC des Shanghai.

Ero Sennin · 11.07.2008

Es ist ja ein ES und der Multi ist frei von daher ist es wayne als was er später mal rausgebracht wird. Und ja ich sag ja das es noch sehr früh ist! Und mit 1,6V hab ich auch schon Phenoms gesehen, welche die 3,5Ghz machen. Ein gut rausgesuchter Deneb dachte ich sollte das mit weniger Vcore machen..aber es ist ja noch Zeit.

btw: Nehalem legt wohl auch in der SuperPi Performance zu den jetztigen 45ern zu.
Link

FX · 11.07.2008

Wann werden die Denebs voraussichtlich erscheinen? In einem anderen Thema wurde gesagt, dass AMD den Start vorzieht.

mr.dude · 11.07.2008

Siehe erste Seite. Dass AMD irgendetwas vorziehen möchte, ist zudem nicht bekannt.

[HOT] · 12.07.2008

@mr.dude kurze Ergänzung:
Sowohl Intel als auch AMD haben ab dem K10 eine 128Bit breite FPU. Intel kann aber 2 x87 Befehle pro Takt berechnen, weil die einzelnen Einheiten sehr universell gehalten sind. Intel nutzt z.B. die gleichen Einheiten für Integer, FPU und SIMD (SSE) Berechnungen, wähend AMD Integer und FPU-Berechnungen generell in 2 unterschiedlichen Einheiten verrichtet. Die FPU des K10 kann nur eine x87 Berechnung übernehmen, oder eben 128Bit SIMD pro Takt. Bei SIMD ist die AMD-FPU also gleichwertig, bei x87 zieht der K10 unweigerlich den Kürzeren bei SuperPI und anderen Anwendungen, bei denen x87 gefragt ist (Anno1701 wäre ein tolles Beispiel). Damit der 45nm K10 besser in SuperPI bei annähernd gleichen Cache-Latenzen wird, muss AMD also die generellen Berechnunslatenzen, die bei x87 Berechnungen auftreten, verringert haben, um mehr x87 Berechnungen bei gleichem Takt durchführen zu können. Man wird aber die FPU nicht aufgebohrt haben, sodass sie 2 x87 Berechnungen durchführen kann, sonst würde sich das SuperPI-Ergebnis noch viel deutlicher absetzen können - das würde auch keinen Sinn machen, weil in x64 garkeine x87 Befehle mehr zugelassen sind und nurnoch inoffiziell im Rahmen der x86-Kompatibilität von WoW64 toleriert werden. Lustigerweise ist auch bei WoW64 mindestens SSE2 vorgegeben, aber SSE und x87 sind inoffiziell kompatibel. Die Latenzverringerung wäre dann ein sogenanntes IPC-Enhancement, weil der Kern pro Takt generell mehr Befehle verarbeiten kann. Das würde auch alle Bereiche anderer Berechnungen, die über die FPU laufen, betreffen und den K10.5 generell um ca. 15% schneller machen. Warten wir aber bitte bessere Benches ab als SuperPI, weil das doch sehr theoretisch ist und sich in der Praxis noch andere Flaschenhälse auftun können.
Aber das der K10.5 ausgerechnet bei SuperPI erheblich schneller ist, ist schonmal sein sehr gutes Zeichen, zeigt aber evtl. auch, dass dem K10 in 65nm doch ziemlich die Daumenschrauben angelegt sind, aufgrund der Rev.B, die ja doch noch eine recht frühe Rev. für ein so komlexes Gebilde wie der K10 zu sein scheint... eben ähnlich wie bei der Rev.B des K8 damals.

Bei AMD gehen übrigens sicherlich noch 2 Steppings ins Land, bis der Endkunde den Chip zu kaufen bekommt. Die C0 ist nur ein Sample für Mobohersteller, OEMs, Serverentwickler und Softwareentwickler, das die generelle Kompatibilität des 45nm K10 sicherstellt, aber keine Endkundenversion. Da der 45nm K10 erst für Mitte November schätzungsweise vorgesehen ist, hat man sicherlich noch 2 weitere Rev.steppings eingeplant, um ihn fit für AM3 und höhere Taktraten zu machen. Firmenkunden werden den Shanghai-Opteron sicherlich schon früher im C1-Rev.step mit niedrigen Taktraten (2,0-2,5GHz) und ausschließlich reg.DDR2-Support bekommen, der Endkunde wird aber sicherlich erst die C2 erhalten, die dann auch hohe Taktraten und eine bessere DDR3-Performance und Kompatibilität ermöglichen wird. Wer also denkt, AMD wird da was vorziehen, weil es gut läuft, der irrt - AMD wird die Zeit nutzen um ein möglichst gutes Produkt auf den Markt zu bringen. Es geht ja auch um was, das Nehalem ein Kracher wird, daran gibt es eigentlich kein Zweifel - Nehalem ist ein Core2 ohne Nachteile bis auf einen - der Cache ist 3-Stufig und im Grössenverhältnis langsamer. Ansonsten räumt Nehalem mit allen Core2-Nachteilen auf und wird eine verdammt saugute CPU. Da muss man mit dem Shanghai schon ein heißes Eisen im Feuer haben um mithalten zu können. Fest steht eines: Ab Shanghai gehört der Core2 endgültig zum alten Eisen.

Levithan300 schrieb:
Ist der Screen hier neuer? Da er unter 20Sec ist?
Man achte auf den HT-Link..

http://www.itocp.com/attachments/month_0807/20080711_f425b33e53adaef2d5d5GPI0QYH9CgFe.jpg.thumb.jpg

Fast 3,5GHz mit der allerersten 45nm Rev.step?! Das ist ein verdammt positives Ergebnis.

Techtrancer · 12.07.2008

Levithan300 schrieb:
Es ist ja ein ES und der Multi ist frei von daher ist es wayne als was er später mal rausgebracht wird. Und ja ich sag ja das es noch sehr früh ist! Und mit 1,6V hab ich auch schon Phenoms gesehen, welche die 3,5Ghz machen. Ein gut rausgesuchter Deneb dachte ich sollte das mit weniger Vcore machen..aber es ist ja noch Zeit.

btw: Nehalem legt wohl auch in der SuperPi Performance zu den jetztigen 45ern zu.
Link

ist aber kein schnelles ergebnis!

ein intel core duo mit 2,7 ghz braucht doch auch so lange oder?

hab letztens nen original getakteten core duo mit 2,7 ghz mit meinem X2 @ 3,4 ghz ein wenig verglichen.

trotz superpi bei mir von ca 27s und 18s beim core duo war ich bei nuclearus um ein schönes stück vor dem core duo!

na nuclearus find ich es auch fein, das schnelle rams bei dem bench fast nichts bringen und dadurch das ergebnis gleichmässiger ist

187Proof · 12.07.2008

@Techtrancer

Es geht hier nicht um Vergleich zwischen Intel und AMD bei SuperPi, sondern um den Vergleich zwischen Deneb und Phenom bei SuperPi!

Techtrancer · 12.07.2008

187Proof schrieb:
@Techtrancer

Es geht hier nicht um Vergleich zwischen Intel und AMD bei SuperPi, sondern um den Vergleich zwischen Deneb und Phenom bei SuperPi!

desshalb hab ichs ja gepostet. superpi ist für nen intel vs amd vergleich nicht geeignet!

rein nur für den internen vergleich

also amd vs amd oder intel vs intel

für amd vs intel ist nuclearus oder cinebench 9 viel besser

Ero Sennin · 12.07.2008

Techtrancer schrieb:
ist aber kein schnelles ergebnis!
ein intel core duo mit 2,7 ghz braucht doch auch so lange oder?

Ein E6600 braucht etwa 3Ghz! Deswegen ja mein Link von XS. Um zu zeigen das sich da beim direkten Konkurenten auch was getan hat! Intel mit AMD über SuperPi zu vergleichen ist heutzutage eh unsinnig.

Nur im Vergleich zu den alten Architekturen machen hier eben beide Hersteller Boden gut.

neowkewl · 13.07.2008

Levithan300 schrieb:
Die haben wohl SuperPi nur laufen lassen weil es für anderes nicht stabil genug war. Das sind ja keine stablen Systeme sondern für nen einzelnen schnellen Bench hochgezüchtete Systeme. Und auch das macht die Benches nicht wirklich schöner..es fehlt eben noch der Zug nach oben mit dem Takt. 1,57V für 3,48Ghz sind nunmal zu viel. Btw die Vcore sollte stimmen. Jedenfalls sagen die Leute nix anderes.

wenn selbst bei der ersten vorstellung des 45nm phenoms seitens -AMD die vcore falsch ausgelesen wurde @ cpu-Z wirds wohl jetzt kaum anders sein... aber wer weis...

freu mich auf jedenfall über gamebenches und cinebench

Ero Sennin · 13.07.2008

Jo wenn ich aber als privater Tester 1,3V einstelle und cpu z zeigt 1,6V an wird man das schon dabei schreiben oder?

[TLR]Snoopy · 13.07.2008

Levithan300 schrieb:
Jo wenn ich aber als privater Tester 1,3V einstelle und cpu z zeigt 1,6V an wird man das schon dabei schreiben oder?

Nur haben die nichts geschrieben, nur Bilder sind zu sehen.
Sich festnageln auf die 1,588V die vielleicht auch noch Vcore Schwankungen sein können und dann auch noch dieses Aufrunden hier auf 1,6V ist für mich eher belustigend.
Es ist ein Vorserien Modell welches angeblich schon im April ausgeliefert wurde.
Wenn ihr schon auf Experten machen wollt, dürft ihr nicht eine Zahl 1,588V die visuell nicht weit weg ist von der Zahl 1,6V aufrunden. Für einen Prozessor ist das ein enormer Unterschied.

Nachtrag:
Es sind sogar 1,568V und somit ist es noch schlimmer auf 1,6V aufzurunden.

mr.dude · 13.07.2008

Techtrancer schrieb:
ist aber kein schnelles ergebnis!

ein intel core duo mit 2,7 ghz braucht doch auch so lange oder?

Von dem, was ich bisher sehen konnte, hat Nehalem auch gut 10% zulegen können. Das ist hier allerdings offtopic.

@Xptweaker
Das Thema hatten wir doch schon mal. Solche Beiträge haben hier NICHTS zu suchen. Dafür gibt es einen eigenen Thread. Ich hoffe, du hältst dich endlich mal daran.

mirko10 · 13.07.2008

[TLR]Snoopy schrieb:
Nur haben die nichts geschrieben, nur Bilder sind zu sehen.
Sich festnageln auf die 1,588V die vielleicht auch noch Vcore Schwankungen sein können und dann auch noch dieses Aufrunden hier auf 1,6V ist für mich eher belustigend.
Es ist ein Vorserien Modell welches angeblich schon im April ausgeliefert wurde.
Wenn ihr schon auf Experten machen wollt, dürft ihr nicht eine Zahl 1,588V die Visuell nicht weit weg ist von der Zahl 1,6V aufrunden. Für einen Prozessor ist das ein enormer Unterschied.

Dann kannst du aber auch exakt bleiben, sind genau 1,568V auf dem screen.

[TLR]Snoopy · 13.07.2008

mirko10 schrieb:
Dann kannst du aber auch exakt bleiben, sind genau 1,568V auf dem screen.

Oh danke, ich war mir nicht sicher ob es nun 1,568 oder 1,588 sind.
Somit sollte man erst recht nicht aufrunden. Denn 1,568V auf 1,6V sind extrem mehr für einen Prozessor.

[HOT] · 13.07.2008

Die Spannung, die von CPU-Z nicht validiert wurde. Die Anzeige ist also 100% falsch. Ich frag mich auch, wie man ernsthaft glauben kann, dass eine 45nm-ULK-CPU auf 1,6V stabil betrieben werden kann... das ist einfach nicht plausibel. Bei 1,6V rauchen die ULK-Gates sehr schnell ab. Selbst Penryns mit ihren HighK-Metalgates vertragen nicht soviel Spannung.
http://valid.x86-secret.com/show_oc.php?id=387395
Das Herumreiten auf der Spannung sollte echt aufhören finde ich, weil das einfach offensichtlich auf nicht korrekten Werten beruht. Statt 1,6V wird die Spannung real bei 1,35V, vllt 1,4V gewesen sein.

Ero Sennin · 13.07.2008

@snoopy: Joa dann eben 1,568V..aber bei einem 45nm Prozzi wird das in Bezug auf die Lebenserwartung kaum nen unterschied tun..es ist einfach viel!

@hot:Ist dein Chinesisch so schlecht?
http://www.itocp.com/thread-11103-1-1.html
Meins schon :fresse:

Aber ne anders angegebene VCore kann ich auch nicht finden. Kann aber gut sein das die Vcore trotzdem nicht stimmt, allerdings gibt es auch Penryns die mit 2V betrieben werden! Und das auch nur für SuperPi.
Muss man mal abwarten..

Hab mal google bemüht:

Die FSB ist nach wie vor K10 Sixue, 230 MHz, nicht nachgekommen waren die Gründe für die Analyse von .... nicht ausschließen, die BIOS-Codierung Probleme
(Die Tatsachen haben bewiesen, dass der FSB könnte sogar noch höher, Laufen PI Rekord 270 FSB)
Luftgekühlte schließlich erreichte 3,44 G, 3.5G in das Betriebssystem neu starten, CPU-Spannung erforderliche Spannung ah

Tatsächlich luftgekühlten 3,44 G ist nicht gehen, aber K10 ist ein großer Fortschritt, sonnige sehr aufgeregt.
HW durch das BIOS oder später geändert CPU-Spannungsbereich, und glauben, sie werde Maßstab neue Höhen

Mehr kam dabei nicht raus..

Wolla · 13.07.2008

Sieht man doch schön auf den Screens in dem Thread das die VCore immer schön mit dem Takt ansteigt, ich weiss nicht was daran unrealistisch sein soll.

cypher_botox · 13.07.2008

Schön, daß der Fehler mit der Spannung nun festgestellt ist. :fire:

Aber was läßt sich denn bis jetzt zusammenfassen? Release etwa Mitte Q4/08. Der Erfahrung nach also nicht vor Mitte Q1/09.

Mit - ich sag mal - ernsthaften Benches können wir nicht vor Ende August, wahrscheinlich sogar Ende September rechnen.

Die Server-CPUs kommen - wie imer - etwas früher und erhalten wohl auch nur DDR2-Support. Desktop-CPUs dann auch DDR3.

Neben scheinbar verbesserten Latenzen wohl noch einige kleine Bugs behoben, bzw die Architektur als solches noch eine "kleine" Ecke verbessert.

Paßt das nun soweit? :hmm:

btw @ mr.dude
Du schreibst was von Branching (11.Juli) ... Kannst mich da ne kleine Ecke weiter einführen? Hab zwar grob ne Vorahnung, ne Erklärung wär aber trotzdem nich verkehrt, danke ...

Gruß

Cypher

PS: evtl wärs nich verkehrt, wenn das zusammengetragene (bzw zusammengereimte) auf der "Ersten" unter Spekulationen zusammengefaßt würde ... :banana:

mirko10 · 13.07.2008

[HOT] schrieb:
Die Spannung, die von CPU-Z nicht validiert wurde. Die Anzeige ist also 100% falsch. Ich frag mich auch, wie man ernsthaft glauben kann, dass eine 45nm-ULK-CPU auf 1,6V stabil betrieben werden kann... das ist einfach nicht plausibel. Bei 1,6V rauchen die ULK-Gates sehr schnell ab. Selbst Penryns mit ihren HighK-Metalgates vertragen nicht soviel Spannung.
http://valid.x86-secret.com/show_oc.php?id=387395
Das Herumreiten auf der Spannung sollte echt aufhören finde ich, weil das einfach offensichtlich auf nicht korrekten Werten beruht. Statt 1,6V wird die Spannung real bei 1,35V, vllt 1,4V gewesen sein.

Der nächste der aufrundet. Es sind keine 1,6V, sondern 1,568V, ein riesen Unterschied! Darum ging es [TLR]Snoopy, dem ich zustimme. Aber 1,6V klingen halt extremer. Penryns vertragen eine noch viel höhere Spannung für nen kurzen Super PI Bench und mit der richtigen Kühlung.
http://oc.xise.de/view.php?dbID=4

[HOT] · 13.07.2008

Der K10 ist aber kein Penryn, hier wird (noch) anderes Material für die Gates verwendet, der Vergleich mit Penryn hinkt also sowieso, das war mich schon klar als ich das brachte.
Dennoch ist die Spannung nicht validiert, weswegen ich sie einfach anzweifle.

mr.dude · 13.07.2008

cypher_botox schrieb:
btw @ mr.dude
Du schreibst was von Branching (11.Juli) ... Kannst mich da ne kleine Ecke weiter einführen? Hab zwar grob ne Vorahnung, ne Erklärung wär aber trotzdem nich verkehrt, danke ...

Branching ist grob erklärt, das Sprungverhalten einer CPU. In x86 µCode wird das über die jxx Instruktionen realisiert, welche wiederum den Status der Prozessorflags abfragen. Mal ein kleines Beispiel:

Code:

label1:
    ...
    cmp eax,1
    jz label1
    ...

Hier arbeitet der Prozessor eine Codesequenz ab, bis er zu dem Punkt kommt, wo das Register eax (32 Bit) mit dem Wert 1 verglichen wird (cmp=compare). Das Ergebnis der Gleichheit wird nun in einem Flag gespeichert. In dem Fall zf (zero flag). Mit der Sprunganweisung jz (jump zero) wird nun entsprechend dem Zustand des Flags der IP (instruction pointer), also der nächsten zu bearbeitenden Instruktion, verschoben.
Genau hier kommen die Branching Fähigkeiten einer CPU zum tragen. Erfolgt kein Sprung, passiert im Grunde nicht nicht viel und die Verarbeitung kann ganz normal mit den nächsten Instruktionen im Prefetch Buffer fortgesetzt werden. Wird jedoch gesprungen, hat das mehrere Auswirkungen. Das fängt beim Cache und Prefetcher an, die uU die nächsten zu bearbeitenden Daten erstmal wieder besorgen müssen. Und geht hin bis zu den Recheneinheiten und der Pipeline, die uU geflusht und erst wieder neu aufgebaut werden muss, um die Leistung durch Befehlspipelining, also dem parallelen Verarbeiten von Instruktionen, zu maximieren, so wie das bei modernen Architekturen üblich ist.
Und je besser und cleverer die Logik letztendlich implementiert wurde, umso effektiver kann die Architektur dann auch arbeiten. Da es sich eben nicht nur auf die einzelnen Instruktionen auswirkt, wie das zB bei Int oder FP Berechnungen der Fall ist, sondern auf die gesamte interne Infrastruktur.

daysleeper83 · 22.07.2008

Mal ein Vergleich zum Verbrauch von Deneb gegen Agena

http://www.xtremesystems.org/forums/showthread.php?t=195780

12 % zu Gunsten des Deneb

[HOT] · 22.07.2008

bei gleicher Spannung offenbar. Das hat aber eigentlich keine wirkliche Aussage, weil es nur ein Einzelexemplar ist. 12% bei gleicher Spannung wär schon ganz schön viel.

harzer_knaller · 22.07.2008

Wenn die sich dann auch noch gut undervolten lassen *sabber*

FireStar · 22.07.2008

Moooooment.... Das ist dort ne Messung vom Gesamtsystem... 200W vs. 176W...

Wenn wir von voller Ausnutzung der 95W TDP bei dem 9600BE ausgehen (die er eh nicht erreicht) und dann 24 Watt weniger nehmen beim Daneb kommt man auf 71 Watt, was einen Mindervebrauch von...25,2% bedeuten würde.

So find ich den Test schon viel besser

EDIT: Rechnet mal weiter, und geht von einem Realverbrauch von 9600BE von etwa 70 Watt aus, so würde der 45nm Daneb nur noch 46 Watt verbrauchen, was ein Minderverbrauch von 34,3% wäre

FischOderAal · 22.07.2008

Wenn ich das richtig gelesen habe, verwendeten die für den Test außerdem ein 1200 W-Netzteil...

mr.dude · 22.07.2008

Gibt es eigentlich schon C1 Samples? Die bisherigen waren ja alle C0.

maniac1985 · 23.07.2008

Ich habe eine Frage, ich wollte mein 939 System bald in Rente schicken und es durch ein AM2+ System ersetzen. Als Prozessor wollte ich einen 9350e einbauen, weil ich eine sparsamere CPU als wollte als die, die jetzt drinnen ist (die hat TDP 89 Watt). Gibt es schon Infos ob zum Release der 45nm Prozessoren auch welche mit TDP 65 Watt rauskommen?
Hoffentliuch kosten die nicht mehr als 150€

harzer_knaller · 23.07.2008

Die sollen Ende 2008/Anfang 2009 erst erscheinen und düften durchaus eine niedrigere TDP bei gleicher/hörer Leistung haben.

[Sammelthread] AMD 45nm K10.5 "Shanghai"-Generation

Semiprofi

Enthusiast

FX

Guest

Urgestein

Enthusiast

Urgestein

Legende

Urgestein

Enthusiast

Semiprofi

Enthusiast

Semiprofi

Urgestein

Semiprofi

Semiprofi

Enthusiast

Enthusiast

Neuling

Enthusiast

Semiprofi

Enthusiast

Urgestein

Enthusiast

Enthusiast

Razupaltuff!

Enthusiast

Keksjunkie

Urgestein

Neuling

Razupaltuff!

Ähnliche Themen