TEST

#AMD #Ryzen #Ryzen-7000 #Zen-4 #AM5 #DDR5 #PCIe-50 #PCI-Express-50 #Ryzen-9-7950X #Ryzen-7-7700X

Zen 4 mit DDR5

Ryzen 9 7950X und Ryzen 7 7700X im Test (Update) - Zen-4-Architektur im Detail

Von Andreas Schilling
Montag, 26.09.2022 um 15:00 Uhr

Seite 2: Zen-4-Architektur im Detail

725

Auch wenn wir bereits einige Änderungen erwähnt haben – diese sind im Vergleich zu Zen 3 weitaus umfangreicher als gedacht und daher einen gesonderten Blick wert.

Genau wie bei der CPU-Architektur setzen sich die Designer gewisse Ziele, die entsprechend der weiteren Planung auch den Weg vorgeben. Für Zen 4 stand ein gewisses IPC-Plus im Lastenheft, aber auch die Latenzen sollten reduziert werden. Zugleich war geplant, den L2-Cache zu verdoppeln, während der L3-Cache unangetastet blieb. Neben der reinen Leistung war Steigerung der Effizienz eine weitere Maßgabe.

Die Sprungvorhersage ist einer der Punkte, der mit der Zen-4-Architektur überarbeitet und verbessert wurde. Pro Taktzyklus können nun zwei Sprungvorhersagen gemacht werden. Der Op Cache fällt um 68 % größer aus und kann nun neun statt acht Micro-Ops pro Taktzyklus in die Micro-Op Queue liefern. An den Funktionseinheiten für ganzzahlige und Fließkomma-Operationen gibt es keine Änderungen. Die Register Files fallen allerdings größer aus. Die Fließkomma-Einheiten sind unter anderem dazu verantwortlich, die AVX-512-Befehlssätze auszuführen.

Im Backend gibt es Detailverbesserungen in den Load/Store-Einheiten, die eine um 22 % größere Queue vorzuweisen haben. Am D-Cache wurden Optimierungen durchgeführt, sodass es zu weniger Konflikten bei Zugriffen auf die Daten kommt.

Die Cache-Hierarchie bleibt fast identisch. Der L2-Cache wird auf 1 MB verdoppelt. Der L1-Cache kann weiterhin 32 kB an Instruktionen und Daten fassen. Beide Bereiche des L1-Caches können 32 Byte an Daten pro Taktzyklus mit dem L2-Cache austauschen. Dieser wiederum erreicht ebenfalls 32 Byte an Daten pro Taktzyklus im Austausch mit dem L3-Cache.

Die eben erwähnten Änderungen in Zahlen ausgedrückt, zeigen die obigen Tabellen. Dort zu sehen sind der größere Micro-Op Cache, L2-Cache, L2 TLB, Integer Register, Fließkomma Register sowie L2 und L2 BTB.

Aber es gibt auch Punkte, in denen Zen 4 auf dem Papier schlechter dasteht, als Zen 3. So vergrößert sich die L2-Latenz von 12 auf 14 Taktzyklen. Beim L3-Cache sind es nun 50 anstatt 46 Taktzyklen.

Ein echtes Highlight soll die Integration von AVX-512- in die Zen-4-Architektur sein. Wie schon in der Einleitung erwähnt, setzt AMD dies in Form einer 256-Bit-Operation um – zweimal ausgeführt ergibt dies 512 Bit. Laut AMD gibt es keinerlei Einfluss auf die Taktfrequenz des Kerns, wenn dieser AVX-512-Befehlssätze ausführt. Dies ist bei den Intel-Prozessoren häufig anders.

Unterstützt werden die AVX-512-Befehlssätze:

AVX512F
AVX512DQ
AVX512_IFMA
AVX512CD
AVX512BW
AVX512VL
AVX512_VBMI
AVX512_VBMI2
GFNI
AVX512_VNNI
AVX512_BITALG
AVX512_VPOPCNTDQ
AVX512_BF16

Die Stärken von AVX-512 wird AMD wohl erst bei den EPYC-Prozessoren ausspielen können. Für die Ryzen-7000-Prozessoren spielt es nur eine Nebenrolle und dennoch werden wir dedizierte Benchmarks ausführen und das Thema noch genauer beleuchten.

Seite 1: Zen 4 mit DDR5: Ryzen 9 7950X und Ryzen 7 7700X im Test (Update) Seite 3: AM5-Plattform mit neuen Chipsätzen

Quellen und weitere Links