Werbung
Die Ryzen-7000X3D-Prozessoren bewegen sich technologisch hinsichtlich der Fertigung, vor allem dem Packaging, an der Grenze dessen, was aktuell machbar ist. Wir reden hier davon, dass AMD bzw. TSMC auf ein bestehendes CCDs noch einen weiteren Chip aufsetzt und diese beiden via TSVs miteinander verbindet. Das CCD muss dazu die notwendigen TSVs bzw. Kontaktpunkte sowie die Control- und Power-Logic bereits vorsehen, die Platzierung des SRAM-Chips muss extrem präzise erfolgen und gehalten wird dies alles rein durch Adhäsion der Kupfer-Kontaktpunkte.
Der Unterschied zwischen Zen 3 mit 3D V-Cache und Zen 4 mit 3D V-Cache ist nicht besonders groß. Der SRAM-Chip wird vermutlich in 6 nm gefertigt und ist etwas kleiner. Davon zu sehen gibt es am Ende aber nicht mehr viel, da eine Silizium-Schicht den CCD plus SRAM in der Höhe wieder mit dem zweiten CCD bzw. dem IOD angleicht. Viele weitere Details dazu haben wir bereits mehrfach im Rahmen der Berichterstattung zusammengefasst.
Was sich unter dem Heatspreader verbirgt, interessiert die meisten aber auch nicht. Funktionieren muss es und dennoch sind die Ryzen-7000X3D-Prozessoren hier etwas spezieller, weil es für die Leistung am Ende doch sehr viel ausmacht, wie der Aufbau erfolgt.
Dies hängt mit der Tatsache zusammen, dass es nicht wie beim Ryzen 7 5800X3D einfach nur einen Prozessor mit einem CCD und dem zusätzlichen L3-Cache gibt, sondern gleich drei Modelle erschienen sind bzw. erscheinen werden und diese unterschiedlich aufgebaut sind.
Die bereits erhältlichen Modelle Ryzen 9 7950X3D und Ryzen 9 7900X3D bieten 8+8 bzw. 6+6 Kerne. Nur jeweils die Hälfte der Kerne hat den zusätzlichen L3-Cache direkt auf dem jeweiligen CCD sitzen. Das Scheduling ist also extrem wichtigen, denn während ein CCD zwar über den Cache verfügt, erreicht das andere einen höheren Takt. Je nach Anwendung kann der höhere Takt wichtiger als der zusätzliche Cache sein.
Aber eines können wir unseren Benchmarks schon einmal vorweg nehmen: Alle Spiele wurden auf dem CCD0 mit zusätzlichem Cache ausgeführt. Bei Anwendungen, vor allen Single-Threaded-Tasks, kann dies anders aussehen. Hier haben wir in den Benchmarks häufig gesehen, dass ein Kern des CCD1 verwendet wurde.
Laut AMD reicht ein aktuelles BIOS sowie die Installation des AMD Chipsatz-Treibers ab der Version 5.02.19.2221 aus, um das Scheduling arbeiten zu lassen. Unter Windows 11 wird zudem empfohlen, die Xbox Game Bar zu aktualisieren, dann darüber findet eine Erkennung statt, ob ein Spiel ausgeführt wird oder nicht. Zudem sollte der Spiele-Modus in Windows aktiviert sein, um eventuelle Hintergrundprozesse auszuschließen bzw. entsprechend zurückzustellen.
Nach der Installation des Chipsatz-Treibers befinden sich im Geräte-Manager mit dem "AMD PPM Provisioning File" sowie dem "AMD 3D V-Cache Performance Optimizer" zwei neue Geräte auf dem System. Ein "AMD 3D V-Cache Performance Optimizer Service" sowie die "amd3dvcacheUser.exe" laufen ständig im Hintergrund und überwachen die laufenden Anwendungen.
Wird ein Spiel ausgeführt, sollten die Threads allesamt auf dem CCD0 ausgeführt werden. Im Falle des Ryzen 9 7950X3D werden die Kerne 8 bis 15 (Threads 16 bis 31) geparkt und sind inaktiv. Dies soll helfen, die Hit Rate auf den L3-Cache zu erhöhen.
Wir hatten im Rahmen unserer Tests keinerlei Probleme mit dem Scheduling und können diesbezüglich also einen positiven Eindruck festhalten. Dennoch wollen wir an dieser Stelle ein paar Tests durchführen. Dazu haben wir die maximalen Taktraten festgehalten, die wir für den verschiedenen Prozessoren und die CCDs feststellen konnten.
CCD0 | CCD1 | |
Ryzen 9 7950X3D | 5,25 GHz | 5,7 GHz |
Ryzen 9 7950X | 5,7 GHz | 5,7 GHz |
Ryzen 9 7900X3D | - | - |
Ryzen 9 7900X | 5,6 GHz | 5,6 GHz |
Ryzen 7 7800X3D | - | - |
Ryzen 7 7700X | - | 5,4 GHz |
Für die Modelle Ryzen 9 7950X, Ryzen 9 7900X und Ryzen 7 7700X können wir auf den CCDs einen maximalen Takt von 5,7, 5,6 und 5,4 GHz festhalten. Bisher halten wir nur den Ryzen 9 7950X3D in Händen und sehen hier auf dem CCD0 einen maximalen Takt von 5,25 GHz, während der CCD1 ebenfalls 5,7 GHz erreichen kann. Die 5,25 GHz liegen auf dem CCD0 beispielsweise in Spielen an. In Single-Threaded-Tests kommt der CCD1 dann auf die besagten 5,7 GHz.
Wie die Kern-Zuteilung in Spielen funktioniert, zeigt obiger Screenshot. Gut zu erkennen ist, dass die Kerne eins bis acht die Last verarbeiten und mit 5.000+ MHz takten, während die Kerne neun bis sechzehn geparkt wurden und keinerlei Berechnungen übernehmen. In all den von uns getesteten Spielen sah dies wie oben abgebildet aus.
Unter Volllast sind die Taktraten natürlich deutlich geringer. Ein Rendering auf allen 16 Kernen sorgt dafür, dass der CCD1 bei 4.850 bis 4.875 MHz arbeitet, während der CCD0 auf etwa 4.725 MHz. Diese Abweichungen sehen wir in dieser Form aber auch für den Ryzen 9 7950X.
Latenzen und Speicherbandbreite
Der zusätzliche L3-Cache auf einem CCD soll seine Stärken vor allem in Spielen entfalten. Über Messungen der Latenzen und Bandbreiten kann man den Effekte des zusätzlichen Speichers ganz gut darstellen. Dazu haben wir die Software von clamchowder verwendet, die es uns ermöglicht die entsprechenden Messungen vorzunehmen.
Durch die Vergrößerung der Kapazität des L3-Caches erhöhen sich die Latenzen bei Zugriffen auf diesen im geringen Maße. Die Spanne reicht von weniger als eine Nanosekunde bis zu wenigen Nanosekunden. Den größeren Cache zu haben wiegt den Nachteil der höheren Zugriffszeiten darauf aber auf.
Ab einer Größe von etwa eine Megabyte werden die Unterschiede dann größer, da ja auch mehr Daten geschrieben und gelesen werden müssen. Laufen die 32 MB des CCD1 aber voll, muss hier auf den Arbeitsspeicher ausgelagert werden, werden auf dem CCD0 weiterhin der größere L3-Cache verwendet werden kann. Dies ist natürlich auch nur bis zu einer Größe von 96 MB der Fall, ab hier muss dann auch der CCD0 auf den Arbeitsspeicher auslagern.
Hinsichtlich der Cache- und Speicherbandbreite verhalten sich der Ryzen 9 7950X ohne 3D V-Cache und Ryzen 9 7950X3D mit dem zusätzlichen Speicher in etwa ähnlich. Die einzelnen Cache-Stufen in der Hierarchie (L1- zu L2-Cache, L2- zu L3-Cache und L3- zu Arbeitsspeicher sind auch identisch über den Infinity Fabric angebunden, insofern verwundert uns die ähnliche Leistung auch nicht.
Schlussendlich noch ein Blick auf die Kern-zu-Kern-Latenzen, die aber ebenfalls ein erwartbares Ergebnis vorzeigen, denn am Aufbau der beiden CCDs und deren Verbindungen untereinander tut sich nichts. Auf dem CCD0 des Ryzen 9 7950X3D liegt einfach nur ein SRAM auf, der aber keinerlei Einfluss auf die Kern-Latenzen hat.