Genoa und das SoC-Design
Werbung
Zwölf CCDs und ein IOD sowie in einer 2S-Konfiguration auch die beiden Sockel müssen miteinander verbunden werden. Insgesamt stellt Genoa 128 Lanes an 32 GBit/s SerDes-Verbindungen zur Verfügung, die für die unterschiedlichen Standards genutzt werden können. Diese können in einer 1S-Konfiguration als 128 PCI-Express-5.0-Lanes (plus 8x PCI-Express 3.0) verwendet werden. In einem 2S-System sind es 160 PCI-Express-Lanes. Anstatt der PCI-Express-Lanes können auch 64 CXL-Lanes realisiert werden.
In den bisherigen Generationen konnte AMD durch das gute I/O-Angebot einen großen Vorteil für sich verbuchen. Genoa setzt dies in Form einer Vielzahl von PCI-Express-Lanes fort. Sapphire Rapids wird vermutlich 80 PCI-Express-Lanes anbieten können, was eine Steigerung gegenüber Ice Lake darstellt, aber noch immer weniger als bei AMD ist.
Den Serverherstellern wird aber auch hier etwas Flexibilität geboten. So können sie in einem 2S-System entweder drei oder vier Links verwenden. Bei drei Links stehen dann 160 PCIe-5.0- und zwölf PCIe-3.0-Lanes zur Verfügung. Bei vier Links zwischen den Prozessoren sind es 128 PCIe-5.0- und zwölf -3.0-Lanes.
Eine weitere Ebene an Flexibilität kommt hinzu, da die Hersteller die vier Links nicht auf einer Seite ausführen müssen, sondern diese als 2+2 auf zwei Seiten umsetzen können.
Die PCI-Express-Lanes können in verschiedenen Konfigurationen ausgeführt werden: Diese Konfigurationen unterscheiden sich in der Anzahl der x16-, x8-, x4-, x2- und x1-Blöcke. Pro x16 Block wiederum können neun Geräte angeschlossen werden (8x x1 + 1x x8).
Ein maßgeblicher Anteil der Leistungsaufnahme eines EPYC-Prozessors geht in die Anbindung der CCDs zum IOD. Für den GMI3-Interconnect hat AMD einige Verbesserungen vorgenommen und will damit eine leicht verbesserte Effizienz erreichen – man spricht hier von <2pJ/Bit. Bisher war von etwa 2 pJ/Bit die Rede. Die SerDes mit 36 Gbit/s arbeiten in einem 20:1 Taktverhältnis zum Infinity Fabric der Prozessoren, der mit 1,8 GHz arbeitet. Werden die Links nicht genutzt, verbrauchen die GMI3-Links um etwa 20 % weniger Energie als beim Vorgänger.
Erstmals bereiten die EPYC-Prozessoren den Weg zu CXL. Dazu werden die SerDes verwendet, die ansonsten für PCI-Express verwendet werden. Unterstützt wird CXL 1.1(+) mit ausgewählten Funktionen von CXL 2.0 für Typ 3. Bis zu 16 CXL-Geräte pro Sockel können angebunden werden. Nicht unterstützt werden die weiteren beiden CXL-Typen:
- Type 1: nicht unterstützt (Beschleuniger mit eigenem Speicher)
- Type 2: nicht unterstützt (Caching Device oder Beschleuniger)
Auf diesen CXL-Speichererweiterungen unterstützt, bzw. darauf zugreifen können Hyperviser und eine Visualisierung, die auf dem Prozessor ausgeführt werden. Per CXL angebundener Speicher auf Basis von DDR-Speicher hat Latenzen wie sie von Sockel zu Sockel zu erwarten sind. AMD sieht hier also keine großen Nachteile durch die externe Anbindung.
AMDs eigene Benchmarks
Zum Start liefert AMD natürlich einige Benchmarks, die sich auf die Ice-Lake-Prozessoren von Intel sowie den eigenen Vorgänger konzentrieren. Die vierte Xeon-Generation auf Basis von Sapphire Rapids spielt mangels Verfügbarkeit also noch keine Rolle.
In fast allen Metriken sieht sich AMD nicht nur weit vor dem eigenen Vorgänger, sondern natürlich auch weit vor der Konkurrenz. Die SpecINT-Leistung gegenüber Milan wurde verdoppelt, und man ist dreimal so schnell wie Ice Lake mit seinen 40 Kernen. Beim Integer-Durchsatz pro Watt sieht man sich um den Faktor 2,6 vor der Konkurrenz – 6,75 W/Kern bei Intel vs. 4 W/Kern bei Genoa.
Die 96 Kerne pro Sockel eröffnen natürlich die Möglichkeit, anstatt zwei Sockeln eben nur einen einzusetzen. Bei fast gleicher Leistung will AMD hier 25 % weniger verbrauchen. Die per Core/Thread-Leistung fällt laut diesen Daten um +50 % besser als bei Intel aus. In diesem Bereich geht es auch darum, Lizenzen zu sparen, bzw. pro Lizenz auf eine möglichst hohe Leistung zu kommen. Pro Lizenz bekommt der Kunde laut AMD eine um 50 % höhere Mehrleistung oder für eine Zielleistung über mehrere Kerne sind weniger Lizenzen notwendig.
Ein laut AMD praxisbezogener Vergleich ist einerseits die Einsparung bei den Anschaffungskosten, da weniger Server für die gleiche Rechenleistung angeschafft werden müssen und hinzu kommen auch noch geringere Kosten für den Betrieb dieser Server. Auf eine gewünschte Leistung von 8.500 Punkte im SPECrate 2017_int_base ausgelegt sind laut AMD 15 Server mit jeweils zwei Intel Xeon Platinum 8380 notwendig, während es nur fünf Server mit jeweils zwei EPYC 9654 mit wiederum jeweils 96 Kernen sein sollen. Die Stromkosten liegen laut AMD bei 103.000 kWh für die Intel-Systeme und mit 47.000 kWh bei nur rund der Hälfe, wenn die neuen EPYC-Prozessoren eingesetzt werden.
Weitere Beispiele und Benchmarks sind in den beiden Galerien über diesem Text zu finden. Die Kollegen von ServeTheHome und Phoronix haben zum Start der Genoa-Prozessoren auch unabhängige Benchmarks erstellt bzw. ihre Testberichte Veröffentlicht.
Die Prozessoren in der Übersicht
Warum die Genoa-Prozessoren nicht als 8000er Serie eingeführt wird, erklärt AMD damit, dass der Sprung in der Leistung einfach zu hoch sei. Die Namensgebung als solches kann wie folgt beschrieben werden:
Die "9" am Anfang eines jeden Produktnamens beschreibt die Serie – hier Genoa. Dies gilt auch für die letzte Zahl, die hier immer eine "4" sein wird. Die dritte Zahl gibt die Anzahl der Kerne an (0=8, 1=16, 2=24, 3=32, 4=48, 5=64, 6=84/96). Die zweite Zahl ist ein Leistungs-Rating – je höher die Zahl, desto höher die zu erwartende Leistung. Der Buchstabe an letzter Stelle beschreibt mit einem "F" die Modelle mit höherem Takt sowie als "P" die Modelle, die ausschließlich in Single-Socket-Systemen eingesetzt werden können.
Kerne | Basis-/Boost-Takt | L3-Cache | Default TDP | cTDP | Preis | |
EPYC 9654/P | 96 | 2,4 / 3,7 GHz | 384 MB | 360 W | 320 - 400 W | 11.805 USD |
EPYC 9634 | 84 | 2,25 / 3,7 GHz | 384 MB | 290 W | 240 - 300 W | 10.304 USD |
EPYC 9554/P | 64 | 3,1 / 3,75 GHz | 256 MB | 360 W | 320 - 400 W | 9.087 USD |
EPYC 9534 | 64 | 2,45 / 3,7 GHz | 256 MB | 280 W | 240 - 300 W | 8.803 USD |
EPYC 9474/F | 48 | 3,6 / 4,1 GHz | 256 MB | 360 W | 320 - 400 W | 6.780 USD |
EPYC 9454/P | 48 | 2,75 / 3,8 GHz | 256 MB | 290 W | 240 - 300 W | 5.225 USD |
EPYC 9374F | 32 | 3,85 / 4,3 GHz | 256 MB | 320 W | 320 - 400 W | 4.850 USD |
EPYC 9354/P | 32 | 3,25 / 3,8 GHz | 256 MB | 280 W | 240 - 300 W | 3.420 USD |
EPYC 9334 | 32 | 2,7 / 3,9 GHz | 128 MB | 210 W | 200 - 240 W | 2.990 USD |
EPYC 9274F | 24 | 4,05 / 4,3 GHz | 256 MB | 320 W | 320 - 400 W | 3.060 USD |
EPYC 9254 | 24 | 2,9 / 4,15 GHz | 128 MB | 200 W | 200 - 240 W | 2.299 USD |
EPYC 9224 | 24 | 2,5 / 3,7 GHz | 64 MB | 200 W | 200 - 240 W | 1.825 USD |
EPYC 9174F | 16 | 4,1 / 4,4 GHz | 256 MB | 320 W | 320 - 400 W | 3.850 USD |
EPYC 9124 | 16 | 3,0 / 3,7 GHz | 64 MB | 200 W | 200 - 240 W | 1.083 USD |
360 W sind die offizielle TDP für die leistungsstärksten Modelle. AMD lässt seinen Kunden aber die Möglichkeit offen die TDP je nach Modell auf bis zu 400 W zu konfigurieren. Bislang lag die Schwelle hier bei 280 W. Die Basis- und Boost-Taktraten fallen teilweise deutlich höher als beim Vorgänger aus und das bei bis zu 50 % mehr CPU-Kernen.
Besonders hervorzuheben ist, dass der Basis-Takt mit 84 oder gar 96 noch immer auf Niveau dessen legt, was die Milan-Prozessoren erreichen konnten. Hier spielt sich die Fertigung der CCDs in 5 nm aus. Bei den Boost-Taktraten gibt es wie gesagt sogar ein leichtes Plus. Die F-Modelle kommen dahingehend optimiert auf die höchsten Taktraten. Der EPYC 9174F erreicht beispielsweise 4,1, bzw. 4,4 GHz für den Basis- und Boost-Takt.
Anstatt wie bisher maximal 256 MB an L3-Cache bieten die EPYC-Prozessoren auf Basis des Genoa-Designs nun mit den 12 CCDs bis zu 384 MB. Der Ausbau des L3-Caches ist abhängig von den aktiven CCDs. Wie wir bereits bei den vorherigen Generationen gesehen haben, setzt AMD auf einen aktiven Kern pro CCD, um auf der anderen Seite die maximale Kapazität an L3-Cache zur Verfügung stellen zu können. Genoa wird mit zwölf CCDs und Modellen mit 16 oder 24 Kernen auf leicht veränderte Package-Konfigurationen setzen müssen.
Die EPYC-Prozessoren auf Basis des Genoa-Designs sind ab heute verfügbar. Preise wurden uns im Vorfeld nicht genannt, diese will AMD aber während oder kurz nach der Keynote veröffentlichen. Wir werden diesen Artikel entsprechend aktualisieren. Die Partner von AMD im Serversegment, HPE, Lenovo, Atos, Inspur, AWS, Azure und viele mehr, bieten ihre Server und Services mit der vierten Generation der EPYC-Prozessoren ebenfalls ab heute an.
Mercury Research hat zufälligerweise in diesen Tagen neue Zahlen zu den CPU-Marktanteilen veröffentlicht. Demnach kommt AMD inzwischen auf 17,5 %, eine Steigerung von mehr als 7 % gegenüber dem Vorjahr (10,2 %) sowie ein weiteres kleines Plus gegenüber dem zweiten Quartal 2022 mit 13,9 %.