NEWS

Prozessoren

Game und Creator Mode für 2. Generation Ryzen Threadripper in der Theorie

Portrait des Authors


Game und Creator Mode für 2. Generation Ryzen Threadripper in der Theorie
3

Werbung

In den kommenden Wochen steht der Start der zweiten Generation der Ryzen-Threadripper-Prozessoren bevor. Zukünftig wird es hier nicht mehr nur maximal 16 Kerne, sondern auch 24 und sogar 32 Kerne geben. Die erste Generation der Ryzen-Threadripper-Prozessoren verwendet bereits vier Zeppelin-Dies, von denen aber nur zwei aktiv sind. Allerdings sind alle vier Dies zumindest belichtet, zwei aber eben nicht angebunden. Rein technisch aber war bereits bei der ersten Generation ein Modell mit 24 oder 32 Kernen möglich.

Mit der zweiten Generation der Ryzen-Threadripper-Prozessoren stellt sich diese Frage nicht mehr. Sowohl das 24-, als auch das 32-Kern-Modell wird vier aktive Zeppelin-Dies haben – viermal sechs, bzw. viermal acht Kerne. Nun stellt sich aber erneut die Frage nach der Anbindung der einzelnen Kerne und welche Speichercontroller aktiv sind oder nicht.

Motivation für diesen Artikel ist die offenbar größtenteils fehlende Erkenntnis darüber, wie die Ryzen-Threadripper-Prozessoren sich hinsichtlich der Latenzen und Speicherbandbreite verhalten. Vielen ist noch nicht einmal bewusst, dass es hier zwei Modi gibt, in denen Prozessoren betrieben werden können. Mit der zweiten Generation und den Modellen mit 24 und 32 Kernen werden diese Punkte noch einmal wichtiger. Daher wollen wir das Thema noch einmal in den Vordergrund rücken.

Bevor wir uns nun anschauen wollen, wie die Situation bei der zweiten Generation der Ryzen-Threadripper-Prozessoren mit 24 und 32 Kernen aussehen könnte, werfen wir einen Blick auf die aktuelle Konfiguration.

Die beiden Zeppelin-Dies sind bei Ryzen Threadripper per Infinity Fabric miteinander verbunden. Dieser bietet hier eine Bandbreite von 102 GB/s in beide Richtungen. Die Latenz zum Speicher am Speichercontroller des gleichen Dies gibt AMD mit 78 ns an, der Speicher am zweiten Die kann über den ersten Die mit einer Verzögerung von 133 ns angesprochen werden.

In diesem Zusammenhang kommen dann auch die Begriffe NUMA und UMA ins Spiel. Der Non-Uniform Memory Access (NUMA) beschreibt eine Speicherarchitektur, bei der jeder Prozessor einen eigenen, lokalen Speicher hat, aber anderen Prozessoren über einen gemeinsamen Adressraum direkten Zugriff darauf gewährt. Uniform Memory Access (UMA) wiederum beschreibt eine Speicherarchitektur, bei der nur ein Speicher vorhanden ist, auf den von allen Prozessoren aus einheitlich zugegriffen werden kann. Im Falle eines Ryzen-Threadripper-Prozessors bedeutet dies, dass im UMA-Modus beide Dies auf alle Speicherkanäle zugreifen können, die Speicherbandbreite demnach optimal ist, die Latenzen aber einen gewissen Mittelwert bilden – also je nach Zugriff mal besser und mal schlechter sind. Im NUMA-Modus hingegen bleiben die Daten im Speicher, der über den jeweiligen Speichercontroller des Dies angebunden ist. Daraus ergeben sich die niedrigsten Latenzen, aber die Bandbreite ist nur halb so hoch.

Theoretisch am besten wäre es, der Software den NUMA-Status des Prozessors aufzuzeigen. Windows 10 erkennt dies beispielsweise problemlos und sieht die beiden Dies als getrennte Entitäten mit jeweils eigener Speicherverwaltung an. Allerdings ist bisher kaum eine Endanwendersoftware darauf angepasst und dementsprechend kann mal NUMA und mal UMA schneller sein. Einzelne Benchmarks können dabei den Eindruck erwecken, das Eine oder das Andere seien schneller, man muss ich aber immer genau anschauen, welche Anwendung von NUMA oder UMA profitiert. Standardmäßig läuft ein Ryzen-Threadripper-Prozessor immer im UMA-Modus.

Creator Mode vs. Game Mode

AMD hat aufgrund der verschiedenen Modi und auch um eine gewisse Kompatibilität aufgrund der hohen Anzahl an Kernen zwei Modi einführt: Den Creator Mode und den Game Mode. Im Game Mode werden die Kerne in einem der beiden Zeppelin-Dies deaktiviert, während die PCI-Express-Lanes und die Speichercontroller aktiv bleiben. Im Falle des Ryzen Threadripper 1950X bleiben von 16 noch 8 Kerne übrig, der Speicher wird aber weiterhin über ein Quad-Channel-Interface angebunden und auch stehen noch 64 PCI-Express-Lanes zur Verfügung.

Im Creator Mode sind alle Kerne aktiv und außerdem hat der Nutzer die Wahl zwischen NUMA und UMA. Wir haben die Latenzen und Speicherbandbreiten noch einmal gegenübergestellt, damit man die Werte noch einmal besser vor Augen hat.

Schaut man sich nun die Speicherbandbreite an, werden die Unterschiede bereits deutlich. Während im UMA-Modus 92, bzw. 93 GB/s an Speicherbandbreite erreicht werden, sind es im NUMA-Modus gerade für das Lesen von Daten auch mal nur etwa 47 GB/s.

Bei den Latenzen unterscheiden wir noch einmal den Einsatz von DDR4-2400 und DDR4-3200. Im Game-Mode sind die Latenzen deutlich geringer, egal wie schnell der Speicher nun letztendlich auch taktet.

Worauf wir hinaus wollen: Nur ein Cinebench-Ergebnis zu vergleichen reicht nicht aus. Man muss sich gerade bei den Ryzen-Threadripper-Prozessoren genauer anschauen, wie diese letztendlich verwendet werden sollen. Für Spieler sind 24 oder 32 Kerne sicherlich ein Overkill. AMD selbst sieht die Ryzen-Threadripper-Prozessoren der zweiten Generation mit 24 und 32 Kernen als reine Workstation-Hardware. Doch selbst nur auf den Creator Modus bezogen gilt es zwischen UMA und NUMA zu unterscheiden – beides hat seine Vor- und Nachteile und dies gilt dementsprechend auch für die eingesetzte Software.

Anbindung für die 2. Generation der Ryzen-Threadripper-Prozessoren

Die eben besprochenen Punkte werden mit der zweiten Generation der Ryzen-Threadripper-Prozessoren noch wichtiger. Da zumindest bei den Modellen mit 24 und 32 Kernen alle vier Zeppelin-Dies aktiv sind, muss AMD die Aufteilung der Speichercontroller und PCI-Express-Lanes entsprechend so vornehmen, dass wir wieder bei einem Quad-Channel-Speicherinterface und 64 PCI-Express-Lanes landen.

Wir haben die beiden möglichen Konfigurationen einmal in einem Blockdiagramm aufgezeichnet:

Links zu sehen ist eine ähnliche Konfiguration wie aktuell schon vorhanden. Nur zwei der vier Zeppelin-Dies verfügen über jeweils zwei Speichercontroller sowie jeweils 32 PCI-Express-Lanes. die zwei weiteren Zeppelin-Dies liefern sozusagen nur die Kerne, besitzen aber keine Anbindung nach Außen hin. In dieser Konfiguration würde sich für die Modelle mit 24 und 32 Kernen nichts weiter ändern.

Schon anders sieht dies für die zweite mögliche Konfiguration aus. Hier liefert jeder Zeppelin-Die jeweils einen DDR4-Speichercontroller und 16 PCI-Express-Lanes. Ein solcher Ryzen-Threadripper-Prozessor bestünde aus vier NUMA-Nodes, die jeweils über einen Channel den Arbeitsspeicher anbinden. Im NUMA-Modus würde dies bedeuten, dass die Latenzen wieder gering sind, die Bandbreite aber noch einmal halbiert wird. Ein eventueller Game Mode mit nur einem aktiven Die würde im Umkehrschluss bedeuten, dass drei der vier Speicherkanäle über recht hohe Latenzen verfügen, die Speicherbandbreite dafür aber wieder stimmt.

Bisher hat sich AMD noch nicht genauer zur Anbindung der einzelnen Dies geäußert. Bis man dies tut oder es entsprechende Leaks gibt, wird dies wohl auch im Dunkeln bleiben. Am wahrscheinlichsten sehen wir die erste Konfiguration, dies hat im Creator Mode aber auch die entsprechenden Auswirkungen – ebenso wie der Game Mode für die zweite Konfiguration. Allerdings dürfte der Game Mode für die Ryzen-Threadripper-Prozessoren mit 24 oder 32 Kernen eine untergeordnete Rolle spielen, denn AMD selbst sieht diese Modelle klar im Workstation-Segment.