NEWS

Renoir für AM4/Desktop

Berichte zu hohem Speicher/IF-Takt (Update)

Portrait des Authors


Berichte zu hohem Speicher/IF-Takt (Update)
39

Werbung

In den vergangenen Tagen tauchten wieder mehr und mehr Hinweise zu neuen APUs für den Sockel AM4 auf. Bisher hat AMD die Renoir getauften Chips (Zen 2 CPU-Kerne und eine optimierte Vega-Grafikeinheit) nur für Notebooks vorgestellt. Die vorherigen Generationen haben es auch immer auf den Desktop geschafft – doch dieses mal gibt es Zweifel an dieser Strategie.

Dennoch tauchen zumeist aus Asien immer weitere Gerüchte und handfeste Details auf – inklusive vermeintlicher Tests. Zuletzt bei TecLab ein Ryzen 7 4700GE (100-000000149-40) mit acht Kernen und einer Vega-GPU mit sieben Compute Units. Analog zum Ryzen 7 4700U dürfte das Simultaneous Multithreading (SMT) nicht aktiv sein.

Bisher gab es aber nur Bilder eines Renoir mit Sockel AM4 sowie einige wenige Informationen, die überhaupt die Existenz dieser Modelle belegen sollen. Bei TecLab gibt es nun einige Zahlen des Ryzen 7 4700GE im Zusammenspiel mit DDR4-4333 (14-14-13-24). Damit wird der Prozessor deutlich oberhalb dessen betrieben, was eigentlich als DDR4-Speicher zum Einsatz kommt. Offiziell unterstützen die Zen-2-Prozessoren DDR4-3200, im Falle der mobilen Varianten auch LPDDR4-4266. Die Vorteile des schnelleren Speichers im Zusammenspiel mit den Ryzen-Prozessoren haben wir bereits ausführlich beleuchtet.

Für Aufsehen sorgte der AIDA64 Speicher- und Latenztest, der hier durchgeführt wurde. Dieser zeigt eine Latenz von gerade einmal 49,1 bzw. 47,6 ns. Die Ryzen-Prozessoren kommen auf 70 bis 80 ns, wie unsere Tests der aktuellem Ryzen-Modelle zeigen. Den Ryzen 9 4900HS (Test) im ASUS ROG Zephyrus G14 (Test) haben wir mit der jeweiligen Speicher-Konfiguration, in diesem Fall DDR4-3200 getestet. Dieser kommt auf auf eine Latenz von 81,6 ns.

Nun berichte einige Publikationen, dass die extrem niedrigen Latenzen dem monolithischen Design der Renoir-Prozessoren geschuldet sind. Aber wie unser Test des Ryzen 9 4900HS zeigen, kommt dieser mit DDR4-3200 auch auf gerade einmal 80 ns und wird nicht durch das monolithischen Design bevorzugt. Stattdessen dürfte der hohe Speichertakt von DDR4-4333 bei Timings von 14-14-13-24 eine wesentliche Rolle spielen.

Zugleich spielt der Takt des Infinity Fabrics (FCLK) eine wichtige Rolle. Dieser soll hier bei 2.166 MHz gelegen haben – also im Verhältnis 1:1 zwischen Speicher- und Fabric-Takt. Für die aktuellen Ryzen-Prozessoren sieht AMD einen synchronen Betrieb zwischen Speicher- und Fabric-Takt bis 1.800 MHz vor. Für alles darüber wird ein Teiler von 1:2 angewendet.

Für die Renoir-APUs gibt es keine direkte Kopplung zwischen dem Speicher- und Fabric-Takt. Der Infinity Fabric soll dynamischer takten können, als dies bei den Desktop-Modellen der Fall ist. Den niedrigeren Takt wählt AMD vermutlich vor allem aus Gründen der Leistungsaufnahme. Zur integrierten Vega-GPU werden allerdings auch zwei Data-Links verwendet, um die Bandbreite trotz des relativ niedrigen Taktes hoch zu halten. Die kleinere Renoir-Modelle arbeiten mit einem Fabric-Takt zwischen 800 und 1.000 MHz.

Welchen Takt des Infinity Fabric die Prozessoren unter Volllast anlegen, wenn LPDDR4-4266 zum Einsatz kommen, konnten wir bisher noch nicht in Erfahrung bringen. Das Zusammenspiel aus Infinity- und Speicher-Takt ist bei den Renoir-Prozessoren also deutlich komplexer, als bei den Desktop-Modellen.

Renoir auf dem Sockel AM4 – Eine Frage der Positionierung

Die Benchmarks der Ryzen-Mobile-4000-Prozessoren alias Renoir haben gezeigt, dass AMD im Notebook-Segment einen riesigen Sprung macht – vor allem in der CPU-Leistung. Dies zeigte sich zuletzt durch das Erreichen des 25X20-Effizienzziels.

Acht Zen-2-Kerne in einen solchen Prozessor machen trotz des geringeren Taktes den Standard-Ryzen-Modellen erhebliche Konkurrenz. AMD wird allenfalls über den Preis eine gewisse Steuerung in der Hand haben, denn ansonsten werden gerade die kleinen Ryzen-Modelle nahezu obsolet. Bisher hat sich AMD noch nicht offiziell zu möglichen Renoir-CPUs auf dem Sockel AM4 geäußert. Der Einsatz auf den günstigeren B550-Mainboards bietet sich hier sicherlich an.

Update: MCLK, UCLK und FCLK bei Renoir-CPUs

Wir haben uns noch etwas tiefergehend mit dem Thema Speicher- und Fabric-Takt der Renoir-Prozessoren beschäftig und einen Blick in die Dokumentation von AMD geworfen. Bisher wurde das Thema noch nicht von allen Seiten ausreichend beleuchtet – so zumindest unser Eindruck.

Bevor wir loslegen, aber noch eine kurze Begriffserklärung:

  • MCLK: Takt des Speichers
  • UCLK: Takt des Speichercontrollers
  • FCLK: Takt des Infinity Fabric

Für die Ryzen-Prozessoren gibt es zwei Modi, in denen ein Zusammenhang dieser Takt-Domänen festzuhalten ist. Bis zu einem Takt von DDR4-3600 arbeiten die internen Teiler in einem Verhältnis von 1:1:1 (MCLK = UCLK = FCLK). Darüber hinaus verbleibt der Takt des Infinity Fabric (FCLK) bei 1.800 MHz und der Takt es Speichercontrollers (UCLK) wird gegenüber dem Speichertakt (MCLK) halbiert. Für DDR4-4000 bedeutet dies ein MCLK von 2.000 MHz, ein UCLK von 1.000 MHz und ein FCLK von 1.800 MHz. Dieser asynchrone Betrieb sorgt für zusätzliche Latenzen bei Speicherzugriffen, die durch straffere Timings und/oder einen noch höheren Takt kompensiert werden können.

Für die Renoir-Prozessoren gibt es nun folgendes festzuhalten:

Im Zusammenspiel mit DDR4-Speicher gibt es einen deutlich flexibleren FCLK, der nicht mehr direkt an MCLK oder UCLK gekoppelt ist. Es gibt weiterhin einen 1:1- und 1:2-Mode zwischen UCLK und MCLK. Der FCLK ist immer höher als der UCLK. Dies gilt auch für den Einsatz mit LPDDR4-Speicher.

Ein festes Teilerverhältnis von 1:1:1 gibt es bei Renoir also nicht. Für eine Ryzen-Mobile mit 15 W und LPDDR4 gilt folgendes Beispiel:

  • Unter CPU-Last wird ein Teilerverhältnis von 1:1:1 gewählt, da unter Last besonders niedrige Latenzen wünschenswert sind. MCLK, UCLK und FCLK arbeiten mit 1.333 MHz. Im Grunde wird der Speicher dabei niedriger getaktet, als er eigentlich könnte. AMDs Ziel ist es hier aber die CPU-Leistung so hoch wie möglich zu halten und die Speicherbandbreite ist nicht für jede Anwendung wichtig.
  • Unter GPU-Last spielt die Speicherbandbreite jedoch eine entscheidende Rolle und entsprechend wird der MCLK auf 2.133 MHz gesetzt, so dass der Speicher voll angesprochen wird. UCLK liegt dann bei 1.067 MHz und der FCLK weiterhin bei 1.333 MHz, um die Speicherbandbreite auch an die interne GPU weitergehen zu können.
  • Im Idle-Betrieb arbeiten FCLK und UCLK mit 400 MHz, der MCLK mit 800 MHz. Hier ist alles auf eine möglichst geringe Leistungsaufnahme ausgelegt.

Für einen Prozessor mit einer TDP von 45 W gibt es andere Taktvorgaben:

  • CPU-Last: MCLK, UCLK, FCLK arbeiten mit 1.600 MHz (takten also etwas höher als bei 15 W)
  • GPU-Last: MCLK bei 2.133 MHz und UCLK wieder bei 1.067 MHz und der FCLK kommt auf 1.600 MHz

Je nach Spiel ist es auch möglich, dass nicht das GPU-Last-Szenario zur Anwendung kommt, sondern ein Teilerverhältnis von 1:1:1 gewählt wird. Dies ist aber von der jeweiligen Anwendung und dem Power Management des Prozessors abhängig.

MCLK, UCLK und FCLK bei Renoir
  MCLK UCLK FCLK
Idle 800 MHz 400 MHz 400 MHz
15 W (LPDDR4-4266)      
CPU-Last 1.333 MHz 1.333 MHz 1.333 MHz
CPU-Last 2.133 MHz 1.067 MHz 1.333 MHz
45 W (LPDDR4-4266)      
CPU-Last 1.600 MHz 1.600 MHz 1.600 MHz
GPU-Last 2.133 MHz 1.067 MHz 1.600 MHz
15 W (DDR4-3200)      
CPU-Last 1.333 MHz 1.333 MHz 1.333 MHz
GPU-Last 1.600 MHz 1.067 MHz 1.333 MHz
45 W (DDR4-3200)      
CPU-Last 1.600 MHz 1.600 MHz 1.600 MHz
GPU-Last 1.600 MHz 1.067 MHz 1.600 MHz

Renoir auf AM4 verhält sich anders als Matisse

Was wir also festhalten können ist, dass falls wie in Kürze Renoir-Prozessoren für den Sockel AM4 sehen werden, wir hier vermutlich auch ein anderes Verhalten in den verschiedenen Takt-Domänen werden festhalten können. Die Eingriffsmöglichkeiten bei den Notebooks sind hier meist eingeschränkt, bei den Desktop-Mainboards aber können über das BIOS weitaus mehr Einstellungen vorgenommen werden.

Mit welchen Mitteln AMD hier arbeiten wird, wird sich noch zeigen müssen. Niedrigere Latenzen durch einen höheren Takt des Infinity Fabric werden außerhalb des 1:1:1-Modi aber nicht möglich sein. Das monolithische Design wird aber sicherlich eine Rolle spielen.