Server-CPU: Neue Informationen zu AMD Opteron Zen „Naples“

Also Haswell IPC ist schon mal gut - meine ich komme mit meinem 3.4Ghz Haswell ja locker durch alles was man so braucht.
Dazu nur 65W für den 4kerner - das ist auch schon auf Intel Niveau.

Schauen wir mal was sonst noch kommt :)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Die IPC soll jetzt gerade so auf Intel Niveau liegen
Definiere Intel Niveau! Dort ist von Haswell die Rede, inzwischen ist Intel weiter, mit Broadwell und Skylake gab es auch jeweils eine Steigerung und bis Zen kommt, ist Kaby Lake da. Ob der nun nur mehr Takt oder wirklich Verbesserungen bei der IPC bekommt, wird man abwarten müssen, aber Haswell ist heute nicht mehr das aktuelle Intel Niveau.
und der Takt soll nun 25% unterhalb von Intel liegen
Maximal 3,2GHz sind wenig, da wäre die Frage was noch für Spielraum zum Übertakten bleibt, aber schaut man sich die Taktraten der neuen GPUs von NVidia und AMD an, so scheint die 14nm GF Fertigung der 16nm von TSMC bei Taktraten und Effizienz doch deutlich unterlegen zu sein.

Ich hoffe mal sehr dass dies nur die Opterons sind und dann noch 4GHz Zen für Consumer kommen! Allerdings wirds dann nicht bei den angegebenen 95W bleiben!
Dann aber nicht für den AM4, denn der soll ja nur für CPUs mit bis zu 95W TDP sein und man wird sehen müssen, was die Boardhersteller noch extra ermöglichen und welches Übertaktungspotential die CPUs überhaupt aufweisen werden.

128 Lanes bei 2 Dies hälts du echt für realistisch
Bei den Server CPU, ja. Die brauchen heute mehr den je viele PCIe Lanes.

pro Die 32 PCIe Lines , damit wäre man schon besser als Intel ...
Das hängt vom Sockel ab den man sich ansieht, für den S. 2011-3 sind 40 PCIe bei den CPUs Standard (nur die billigsten i7 werden auf 28 Lanes kastriert) und dessen Nachfolger S. 2066 wird 44 Lanes bieten, der kommende LGA 3684 wohl 48.
 
schaut man sich die Taktraten der neuen GPUs von NVidia und AMD an, so scheint die 14nm GF Fertigung der 16nm von TSMC bei Taktraten und Effizienz doch deutlich unterlegen zu sein.
Das liegt aber nicht an der Fertigung, sondern an der Architektur. Die GTX 1060 erreicht beispielsweise mit ihren 1280 ALUs bei 1.708 MHz 4,37 TFLOPS, während die RX 480 bei 2304 ALUs und 1266 MHz 5,8 TFLOPS leistet. Wäre ziemlich wahnwitzig, wenn die RX 480 2GHz erreichen könnte und damit bei 9,21 TFLOPS landen würde, also doppelt so viel Leistung aus gleich viel Silizium herausholen würde...

Und die Effizienz der RX 480 mag im Vergleich zur GTX 1060 schlechter sein, aber auch nur, weil AMD den Chip schon im Referenzdesign "übertaktet" hat. Schon die 60MHz niedriger getaktete RX 470 soll ja nur eine TDP von 110W haben und das ist meiner Meinung nach auch noch ein Stück weit vom SweetSpot entfernt. Meine 290X macht mit perfekt abgestimmtem Custom- Bios bei 900MHz auch ihre 5 TFLOPS und verbraucht in Furmark nur ca. 200W, in Unigine Heaven ca. 130W. - Ist also ähnlich effizient wie die RX 480 mit Standardparametern.

Edit: Beim Wechsel von 28nm auf 14nm(Grafikkarten) hat sich die Effizienz(Leistung/Takt, Leistung/Watt) um 70% verbessert. Deshalb gehe ich bei den CPUs(32nm -> 14nm) von ca. 80% aus, bzw. hat AMD ja auch schon so gesagt... Wenn AMD mit diesem Leistungsschub gleichauf mit Intels Skylake oder gar schneller bei gleichem Takt sein sollte, dann kann man davon ausgehen, dass AMDs Prozessoren technisch durchdachter sind, weil Intels 14nm besser sind, als die 14nm von GF. Allerdings muss man davon ausgehen, dass sie dem Verfahren geschuldet ein klein wenig hinterher hinken.
Trotzdem kann bei entsprechendem Preis beispielsweise ein Achtkerner für die breite Masse interessant werden und Intel deutliche Marktanteile abknöpfen, bzw. wenn meine pro-Core-Leistung nicht allzu sehr leidet, würde ich auch auf einen Achtkerner aufrüsten, solange der Preis stimmt.
 
Zuletzt bearbeitet:
Das liegt aber nicht an der Fertigung, sondern an der Architektur.
Das ist möglich und die Architektur wird da sicher auch eine Rolle spielen, aber auch bei Apples A9 SoCs ist der bei TSMC in 16nm gefertigte Chip effizienter als der bei Samsung in 14nm gefertigte A9.
Die GTX 1060 erreicht beispielsweise mit ihren 1280 ALUs bei 1.708 MHz 4,37 TFLOPS, während die RX 480 bei 2304 ALUs und 1266 MHz 5,8 TFLOPS leistet.
Es geht nicht um die theoretischen TFLOPS, sondern um die Frequenzen und die Leistungsaufnahme und da liegt die AMD GPU zumindest bei den Frequenzen klar zurück und wie es aussieht, den Vergleich zwischen der GTX1060 und der RX480 können wir erst morgen ziehen und daher derzeit die RX480 nur mit den größeren GTX1070/1080 vergleichen. Dort sieht es bei Betrachtung der jeweils real erzielten Leistung zum der realen Leistungsaufnahme bzgl. der Effizienz der RX480 nicht gut aus.
die Effizienz der RX 480 mag im Vergleich zur GTX 1060 schlechter sein, aber auch nur, weil AMD den Chip schon im Referenzdesign "übertaktet" hat.
Und trotzdem nur auf rund 2/3 der Taktraten kommt wie NVidias neuen GPUs schaffen, was genau der Punkt ist auf den ich ja anspreche: Hohe Taktraten scheinen nicht die Stärke des 14nm Prozesses von Samsung zu sein, den GF ja auch übernommen hat. Zen wird auch in 14nm bei GF gefertigt und um den geht es hier, nicht um die GPUs und bei welchem Takt welche theoretisch wie viele TFLOPS hat. Das war nur ein Verweis darauf, warum ich Zen keine zu hohen Taktraten unterstellen würde, denn da scheint einfach nicht die Stärke der 14nm Fertigung von Samsung/GF zu liegen und dabei hatte man ja nun schon einige Zeit um den zu optimieren.
Wenn AMD mit diesem Leistungsschub gleichauf mit Intels Skylake oder gar schneller bei gleichem Takt sein sollte
Von "gleichauf mit Skylake" ist nur in den Träumen von Fanboys die Rede, realistisch kann man zufrieden sein, wenn bei den IPC das Niveau von Haswell erreicht wird. Das wäre für die ersten Version der neuen Architektur schon eine tolle Leistung und AMD würde die Lücke zu Intel erheblich verkleinern.
weil Intels 14nm besser sind, als die 14nm von GF. Allerdings muss man davon ausgehen, dass sie dem Verfahren geschuldet ein klein wenig hinterher hinken.
Eben, Intels 14nm CPUs können inzwischen über 4GHz erreichen, von Zen sollten dies nicht erwarten und im übrigen hat die Fertigung keinen Einfluss auf die IPC, wohl aber auf die Singlethreadperformance, die eben die IPC * dem Takt ist. Hängt man beim Takt 25% zurück, wird man bei der Leistung nicht weniger zurück hängen.
Trotzdem kann bei entsprechendem Preis beispielsweise ein Achtkerner für die breite Masse interessant werden und Intel deutliche Marktanteile abknöpfen, bzw. wenn meine pro-Core-Leistung nicht allzu sehr leidet, würde ich auch auf einen Achtkerner aufrüsten, solange der Preis stimmt.
Da kommt es wieder, alle wollen die AMD CPUs nur, wenn sie günstig sind, aber wie soll AMD dann damit Geld verdienen? Und wie soll man Pro-Core-Leistung denn bei 8 Kernen mit 95W TDP im Vergleich zum 8 Kerner von Intel mit 3,2 bis 3,7GHz bei immerhin 140W TDP (fast 50% mehr), mit Quad Channel RAM und sehr wahrscheinlich auch noch rund 10% mehr IPC, nicht deutlich zurück liegen? Die Effizienz ist ja eben offenbar nicht die große Stärke des Prozesses und damit muss der Takt entsprechend gering sein um die TDP einhalten zu können, die im Forum von Anandtech genannten Werte von 2,8 bis 3,2GHz sind ja rund 15% unter denen des i7-6900K, rechnet man nochmal etwa 10% weniger IPC, wäre man bei grob 25% weniger Leistung und damit etwa in den Regionen eines Intel 6 Kerners, bei geringerer Singlethread Performance. Da wohl auch nur 16 PCIe 3.0 Lanes vorhanden sein dürften, wäre der i7-6800K für rund 440€ also die Intel CPU gegen die ein 8 Kern Zen antreten müsste, auch preislich. Was wärst Du bereit für eine 8 Kern CPU mit 16 PCIe Lanes, rund einem Viertel weniger Pro-Core Performance und der Gesamtleistung eines i7-6800k auszugeben?
 

Das hatte ich mittlerweile wieder vergessen. Ist eine interessante Idee.
Was ich aber nicht ganz nachvollziehen kann: Warum sollte bei einem Shrink der Takt sinken? Aktuell taktet AMD ja bei 4-5GHz. Normalerweise verschiebt sich der optimale Takt bei einem Shrink durch die kürzeren Wegstrecken nach oben, während sich der Energiebedarf um ein Elektron, bildlich gesehen, durch das Tor zu schubsen, bzw. die Schwellenspannung zu erreichen, verringert und folglich auch Energiebedarf und Abwärme sinken. So ist es ja auch bei den GPUs - bei AMD war das Optimum bei ca. 900MHz, jetzt dürfte es bei etwa 1150 liegen. Bei Nvidia war es bei etwa 1 GHz und dürfte jetzt bei ca. 1,4GHz liegen. Gleichzeitig kann die Wärme schlechter abgeführt werden, was AMD durch Verlötung ausgleichen könnte.
Also komme ich insgesamt mindestens auf 4GHz, falls man die Kühlung in den Griff bekommt. (OK, wegen der Sockel- TDP kann es sein, dass er per Default niedrig getaktet sein muss...)

Zum letzten Punkt: Ja, es ist einleuchtend für den normalen Konsumenten. Aus meiner Sicht ist es mir völlig egal, wie viel Takt die CPU per Default hat - da kommt es mehr auf eine günstige Ausgangslage an :d. Für einen Octacore 1.000€ preislich zu unterbieten halte ich auch nicht schwer, und auch die Sixcores haben eine dicke Marge. Wichtig für AMD sollte erst mal sein, überhaupt Produkte platzieren zu können, die jemanden interessieren. (Also nur auf die Prozessorsparte bezogen.)
 
Zuletzt bearbeitet:
Darüber hinaus soll der L3-Cache mit 64 MB besonders groß ausfallen, womit Berechnungen schnell abgearbeitet werden sollen.
das sind gerade einmal 2 mb pro kern bzw. 1 mb pro thread. die alten opterons bieten ja auch 2 mb je modul, 1 mb je thread.
aber ich finde es schade, dass amd vom modul-konzept weggeht. so langsam wird es interessanter und jetzt gibt amd das konzept auf?
 
Zuletzt bearbeitet:
Nach den leaks derzeit ist der verdacht eher das aus den 2 kern je modul auf 4 kern je modul geworden sind.
Und das amd diese nicht teil deaktivieren kann heißt keine 6 cores
Und somit lediglich je modul deaktiviert werden können
damit wird amd sich keinen gefallen tun quadcore sind im überfluß von intel seit 2011 aufn markt und amd wird kaum schneller sein als diese
wer soll das kaufen.
Und die octa werden mit Sicherheit nicht billiger als 400€ sein eher tendiere ich auf knapp 800€ wenn die ipc an den broadwell e heran kommt.
Dabei wäre die 6core für 250€ perfekt Leistung etwas höher als c i7 6700k etwa bei 11 amd zen 6 core mit smt gegen 9 ci7 6700k
so aber kann der amd zen 8core bei ci7 6800k oder den ci7 6900k liegen oder besser gesagt entweder 400€ oder 1000€
beides wäre für mich uninteressant dann kann ich gleich den ci7 6800k kaufen weil kein unterschied beim Preis weniger core höhere ipc.
Und diesen bekomme ich sogar schon jetzt
 
Zuletzt bearbeitet:
Das liegt aber nicht an der Fertigung, sondern an der Architektur. Die GTX 1060 erreicht beispielsweise mit ihren 1280 ALUs bei 1.708 MHz 4,37 TFLOPS, während die RX 480 bei 2304 ALUs und 1266 MHz 5,8 TFLOPS leistet. Wäre ziemlich wahnwitzig, wenn die RX 480 2GHz erreichen könnte und damit bei 9,21 TFLOPS landen würde, also doppelt so viel Leistung aus gleich viel Silizium herausholen würde...

Wäre das so möglich, hätte AMD eine Karte, die irgendwo auf dem Leistungsniveau der 1080er agieren würde... Denn die sieht doch ähnlich aus. 2560 ALUs und sehr hoher Takt im Vergleich. Vorteil 2 von hohen Taktraten, die anderen Einheiten skalieren in der Leistung mit. Wenig Takt bei hoher ALU Anzahl heist idR auch, dass viele ROPs, TMUs, TAUs usw. notwendig sind, weil einfach deren Leistung ebenso mit dem Takt skaliert. Es sei denn, man baut andere Taktdomains, ähnlich wie es NV damals mit den HotClocks tat. Bzw. wie der Fiji? Da gibts doch auch so ne andere Taktdomain, welche bei Anhebung A) den Speicher mit übertaktet und B) irgendwelche anderen Chipteile, die dann für überduchschnittlich viel Mehrleistung sorgen kann...

Übrigens, nicht nur die Architektur ist dabei ausschlaggebend... Bspw. wäre es auch denkbar, dass AMD auf Packdichte geht/ging. -> Polaris 10 ist dichter gepackt als Pascal GP104. Höhere Packdichte ist ebenso ein Indiz für weniger hohe Taktraten...

Bricht man das auf Zen runter -> könnte es ähnlich ausschauen. Hohe Packdichte für wenig Siliziumfläche und niedrigere Taktraten bei hoher Coreanzahl für das gleiche. Wie es aufgehen könnte am Ende? Abwarten... Ich bin nach wie vor der Meinung, die größeren/breiten Intels sind angreifbar. Bei den gleichen Quadcores mit sehr hohem Takt? Bin ich immernoch skeptisch...

Nach den leaks derzeit ist der verdacht eher das aus den 2 kern je modul auf 4 kern je modul geworden sind.

Neja, von den Modulen, welche mit Zen erwähnt werden existiert aber schon ein Unterschied zu den Modulen aka CMT, wie sie bei Bulldozer verwendet werden... Luebke meinte wohl klar die CMT Geschichte. Wie die Dinger intern aufgeteilt sind, dürfte bestenfalls nebensächlich interessieren ;)
 
Zuletzt bearbeitet:
Bricht man das auf Zen runter -> könnte es ähnlich ausschauen. Hohe Packdichte für wenig Siliziumfläche und niedrigere Taktraten bei hoher Coreanzahl für das gleiche. Wie es aufgehen könnte am Ende? Abwarten... Ich bin nach wie vor der Meinung, die größeren/breiten Intels sind angreifbar.
Das sehe ich auch so, der 32 Kerner ist damit AMDs größter Trumpf, nur wird der sich in einem Markt etablieren müssen, den AMD sehr, sehr lange stark vernachlässigt hat und wo AMD heute überhaupt keine Rolle mehr spielt.
Bei den gleichen Quadcores mit sehr hohem Takt? Bin ich immernoch skeptisch...
Das fürchte ich auch, einem i7-6700k wird man nichts entgegen setzen können, außer eben einen 8 Kerner der dann zwar vermutlich Multithreaded mehr leisten kann, aber bei der Singlethread Performance deutlich hinterher hängen wird und da gerade bei Heimanwendern immer noch viel SW stark von der Singlethread Performance anhängt, verringert AMD dann gegenüber der heutigen Situation nur den Abstand und überholt die schnellen 4 Kerner vermutlich bei den massiv Multithreaded Anwendungen, was die aktuellen 8 Kerner von AMD ja nicht mehr schaffen.

Neja, von den Modulen, welche mit Zen erwähnt werden existiert aber schon ein Unterschied zu den Modulen aka CMT, wie sie bei Bulldozer verwendet werden.
Wobei da auch noch die Frage bleibt, wie gut diese beiden Cluster mit den 4 Kernen im einem 8 Kerner zusammenarbeiten werden. Die haben ja offenbar nicht einmal einen wirklich gemeinsamen L3 Cache.
 
Zuletzt bearbeitet:
Hohe Packdichte für wenig Siliziumfläche und niedrigere Taktraten bei hoher Coreanzahl für das gleiche. Wie es aufgehen könnte am Ende? Abwarten... Ich bin nach wie vor der Meinung, die größeren/breiten Intels sind angreifbar.
AMDs großes Problem war die NUMA Performance. Seit dem Intel QPI hat, sah es hier für AMD sehr schlecht aus. Wie ZEN sich hier schlägt, wird man erst bei konkreten Tests sehen können.
 
AMDs großes Problem war die NUMA Performance. Seit dem Intel QPI hat, sah es hier für AMD sehr schlecht aus. Wie ZEN sich hier schlägt, wird man erst bei konkreten Tests sehen können.

Theoretisch dürfte sich am Grundproblem ja nix ändern, wenn man weiterhin auf MCM setzt -> was zumindest auf die größten Modelle zutreffen wird. Da man allerdings mindestens wohl mit 16 Cores pro DIE ankommen wird und diese Teile wohl als ein NUMA Node fungieren, gibts zumindest mal eine Verdopplung ausgehend von Bulldozer. Ggü. Intels 22-24 Kern CPUs wirds dann aber schon eher eng was dieses Thema angeht...
Auf der anderen Seite, weiter bleibt ja der Spaß mit dem L3 Cache interessant... Wenn die "Single NUMA Node CPUs" trotzdem intern verschiedene Caches verteilt haben ohne einen gemeinsamen shared Bereich, könnte zumindest Speicherlastige MT Software wohl wieder zu einem Problem werden...

PS: das "angreifbar" bezog sich übrigens eher auf dei 8-10 Core Intel S2011 i7 CPUs ;)
 
@fdsonne
Das mit dem L3 Cache blick ich auch noch nicht ganz.
Aber es gab ja die Gerüchte von GMI von über 100GByte/s klingt ein bischen nach PCI-Express 3.1
Wenn die Kerne alle auf den integrierten PCI-Express Controller zugreifen können, sollte ein Transfer weder Bandbreiten noch Latenz Probleme haben. :)
 
Um 100Gbyte/s zu übertragen wären mehr als 100 PCIe 3.0 Lanes nötig.
 
… Aber es gab ja die Gerüchte von GMI …
Darauf gebe ich gar nichts. AMD hat viele Jahre lang bezüglich der Opteron 6x00 "gelogen". Es sind zwei aneinander geklebte Desktop Dice, und bilden deshalb zwei NUMA-Nodes. Und man hat bei diesen CPUs DualChannel RAM Anbindung nicht wie behauptet QuadChannel, man sieht das eindrucksvoll an der maximalen Speicherbandbreite an einem Core. Damit man die volle Leistungsfähigkeit ausschöpfen kann, muß man NUMA aware programmieren, und dann wird der Vergleich zwischen den CPUs von AMD und Intel ein ganz anderer.

Nachtrag: Warten wir ab was AMD wirklich liefert. Gerüchte sind Gerüchte und auf diese kann man nicht viel geben.
 
Zuletzt bearbeitet:
Wer solche CPUs kauft, weiß aber i.d.R. auch schon, ob seine SW gut darauf laufen wird oder nicht und die meisten Enterprise Anwendungen die auch Rechnern mit so vielen Kernen laufen, sind NUMA Aware. Für Heimanwender sind diese CPUs ja auch nicht gedacht.
 
Wer solche CPUs kauft, weiß aber i.d.R. auch schon, ob seine SW gut darauf laufen wird oder nicht und die meisten Enterprise Anwendungen die auch Rechnern mit so vielen Kernen laufen, sind NUMA Aware. Für Heimanwender sind diese CPUs ja auch nicht gedacht.
Wenn die Sache so einfach wäre, es ist ein nicht unerheblicher Aufwand das richtig zu programmieren. Intel liefert für die eigenen CPUs die bessere Software für diese Aufgabe mit. AMD hatte hier in der Vergangenheit sehr große Probleme, so daß Intel Compiler und Libraries auch auf AMD Hardware die besseren Ergebnisse lieferten. Aber - NUMA aware geht nur auf Intel Hardware(!), so daß man das auf AMD Hardware immer von Hand machen muß, und eben nicht auf die Bibliotheken bauen kann - nervend und zeitraubend.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh