NEWS

Ryzen-OC

Falsche Telemetriedaten sollen zu höherer Leistung führen (Update)

Portrait des Authors


Falsche Telemetriedaten sollen zu höherer Leistung führen (Update)
34

Werbung

Zusammen mit der neusten Version des Tools HWiNFO führen die dortigen Entwickler eine neue Metrik namens "Power Reporting Deviation" ein. Diese sorgt gleich für einige Aufmerksamkeit, denn sie soll darstellen, wie die Mainboardhersteller ein Overclocking der Ryzen-Prozessoren vornehmen, ohne dass dies dem Nutzer bewusst ist. Vielmehr noch: Im eigentliche Sinne werden die Prozessoren außerhalb der von AMD festgelegten Spezifikationen betrieben, was zum Beispiel zu früheren Ausfällen führen kann.

Aber was genau sagt der Wert "Power Reporting Deviation" denn nun aus?

Prozessor und Mainboard kommunizieren über ein Interface und bestimmen, wie viel Strom bei welcher Spannung an den Prozessor geliefert werden soll. Daraus ergibt sich eine Leistungsaufnahme, die vom Prozessor verarbeitet werden kann. Ein Power-Management-Co-Prozessor justiert die Parameter so, dass der Prozessor seine ideale Leistung abrufen kann – um zum Beispiel mit dem höchstmöglichen Boost-Takt die bestmögliche Leistung abzurufen. Dabei hält sich der Co-Prozessor an von AMD gemachte Vorgaben für die Platform und Infrastruktur. Die Entwickler von HWiNFO nennen in ihrem Support-Forum ein paar Details dazu.

"Ryzen CPUs for AM4 platform rely on external, motherboard sourced telemetry to determine their power consumption. The voltage, current and power telemetry is provided to the processor by the motherboard VRM controller through the AMD SVI2 interface. This information is consumed by the processors power management co-processor, that is responsible for adjusting the operating parameters of the CPU and ensuring, that neither the CPU SKU, platform or infrastructure specific limits are being violated."

Der VRM-Controller liefert dabei über das SVI2-Interface einen Integer-Wert zwischen 0 und 255 an den Co-Prozessor. Dabei handelt es sich um einen Referenzwert, der wiederum in der AGESA mit einem festen Wert für die Stromversorgung verknüpft ist. Jedes Mainboard kann hier einen anderen Wert haben. Zu erwarten ist, dass zwei Mainboards des gleichen Herstellers mit identischer Spannungsversorgung den gleichen Wert liefern. AMD muss sich für diesen Referenzwert auf die Mainboardhersteller verlassen, dass hier ein korrekter Wert geliefert wird. Stimmt dieser Referenzwert nicht überein, kann das Mainboard mehr oder weniger Leistung an den Prozessor liefern, als dies eigentlich vorgesehen ist.

"In case the declared value is greater than the actual value, the power consumption seen by the CPU is greater than it actually is. Likewise, if the declared value would be an understatement... the CPU would think it consumes less power than it actually does."

Es ist eher unwahrscheinlich, dass ein Mainboardhersteller hier einen Wert liefern möchte, der den Prozessor sozusagen unterversorgt. Stattdessen wird jeder Hersteller versuchen, möglichst das Optimum auszuschöpfen, um sein eigenes Produkt bestmöglich dastehen zu lassen. Ein Ryzen 7 3700X hat eine nominelle TDP von 65 W und ein Default Power Limit (PPT) von 88 W. Halten sich die Mainboardhersteller an die von AMD gemachten Vorgaben, sollte der Prozessor auch innerhalb dieser arbeiten. Wird der Referenzwert nun jedoch so deklariert, dass der Co-Prozessor davon ausgeht, nur 60 % der möglichen Leistung geliefert zu bekommen, entsteht ein zusätzlicher Spielraum und anstatt eines PPT von 88 W liegt dieses nun bei 147 W (88 W / 0,6). Der Prozessor wird also oberhalb der von AMD freigegebenen Spezifikationen betrieben. Diese Form der Manipulation funktioniert nur bei den Ryzen-Prozessoren der 3000-Serie auf Basis der Zen-2-Architektur.

Im Gegensatz zum manuellen Overclcocking oder dem Precision Boost Overdrive (PBO) greifen bei einer Änderung des Referenzwerts in der Telemetrie die Schutzmechanismen vermeintlich erst später, da der Prozessor davon ausgeht, innerhalb der Vorgaben von AMD betrieben zu werden.

Einordnung der Power Reporting Deviation

HWiNFO liefert nun eine Einordnung eines möglichen falschen Wertes in Form der Power Reporting Deviation. Bei 100 % ist der Referenzwert korrekt vom Mainboard gemeldet worden. Ein Wert über 100 % bedeutet, dass der Mainboardhersteller hier einen zu restriktiven Referenzwert liefert und somit Potenzial liegen lässt, bzw. die Limits nicht vollständig ausschöpft. Es kann hier kleinere Schwankungen von ±5 % geben, die innerhalb der zu erwartenden Toleranz liegen. Alle Werte von 95 % und weniger bedeuten, dass die Mainboardhersteller hier einen falschen Wert liefern, der dafür sorgt, dass der Prozessor im Grunde außerhalb der Spezifikationen betrieben wird.

Die Entwickler von HWiNFO haben dies mit einem MSI X570 Godlike dargestellt. Das Beta-BIOS 1.93 liefert einen Referenzwert, der einen Referenzstrom von 280 A darstellt. Andere Mainboards liefern beim gleichen Prozessor bis zu 300 A. Der Referenzwert von MSI suggeriert also einen Wert von 280 A, es werden jedoch tatsächlich 300 A geliefert. MSI ermöglicht es dem Prozessor also, einen etwa 7 % höheren Strom abzurufen, was ihm zugleich ermöglicht, höher zu takten und/oder diesen Takt länger zu halten.

Ein paar Tests und Messungen auf dem MSI X570 Godlike zeigen für eine Power Reporting Deviation von 100 % (300 A), 75 % (225 A) und 50 % (150 A) im Falle eines falschen Referenzwerts einen geringfügig höheren Takt bei einer allerdings reduzierten Leistungsaufnahme.

Gegenüberstellung von Temperatur, Takt und Leistungsaufnahme
  Takt gemeldete
Leistungsaufnahme
Temperatur Spannung (avg/max)
100 % (300 A) 4.027,4 MHz 140,964 W 73 °C 1,321 / 1,413 V
75 % (225 A) 4.103,5 MHz 125,241 W 80 °C 1,381 / 1,425 V
50 % (150 A) 4.106,6 MHz 91,553 W 79 °C 1,381 / 1,444 V

Für den hier verwendeten Ryzen 9 3900X liegt das Default Power Limit (PPT) bei 142 W – wird also in keinem Fall überschritten. Der Takt steigt aber leicht an, wenn der Referenzwert kleiner angegeben wird, als dies eigentlich notwendig wäre. Schutzmechanismen wie der Silicon Fitness (FIT) greifen hier bereits.

Kein Einfluss auf die Lebensdauer des Prozessors

Aus der Auswertung des Wertes für die Power Reporting Deviation haben einige Tech-Magazine bereits eine wissentliche Reduzierung der Lebensdauer der Ryzen-Prozessoren gemacht. Dem ist aber nicht so. Der Effekt einer reduzierten Lebensdauer durch eine höhere Spannung ist weitaus größer, als der Effekt durch einen höheren Strom, der geliefert wird.

Aber selbst ein Overclocking des Prozessors in einem weitaus höheren Rahmen als das, was wir hier sehen, hat keinen negativen Einfluss auf die Lebensdauer der Hardware im normalen Zeitrahmen. Wir sprechen von einer niedrigen Prozentzahl über einen Zeitraum von zehn Jahren. Eine Degradierung des Prozessors kennen wir von solchen, die über eine längere Zeit und mehrfach weit über ihren Limits betrieben wurden. Aktuelle Prozesstechnologien scheinen diesen Effekte weitestgehend nichtig gemacht zu haben.

Solche Modifikationen können bei einem daraus resultierenden höheren Verbrauch aber schon einen Einfluss auf die Leistung des Systems haben – allerdings im negativen Sinne. Falls eine Kühlung derart ausgelegt ist, dass sie gerade so mit den Limits des Prozessors übereinstimmt, kann eine Erhöhung der Leistungsaufnahme natürlich zur Folge haben, dass die Temperaturen deutlich höher ausfallen und der Prozessor gewisse Limits überschreitet. Dies führt wiederum dazu, dass die Sicherheitsmechanismen eingreifen und die Spannung sowie den Takt reduzieren.

Bei den Intel-Prozessoren hat das Thema "Manipulation durch die Mainboardhersteller" erst kürzlich neuen Aufschwung erfahren. Intel hat vor allem das PL2 mit den Comet-Lake-S-Modellen massiv angehoben. Doch diese Vorgaben von Intel stellen keine Maximallimits dar und so gehen alle Mainboardhersteller sogar noch deutlich weiter. Nicht nur bei den K-Prozessoren werden das PL1, PL2 und Tau erhöht, auch bei den Non-K-Prozessoren und sogar auf bei Mainboards mit H470- und B460-Chipsatz finden solche Anpassungen statt. Intel hat inzwischen für alle Modelle die offiziellen Werte für das PL1, PL2 und Tau veröffentlicht und an diese halten sich die meisten Mainbaordhersteller auch. Funktionen wie das BFB (Base Frequency Boost) von ASRock oder das APE (ASUS Performance Enhancement) von ASUS sowie eine Erhöhung der Limits von MSI auf den LGA1200-Boards gehören nun einfach dazu und werden von Intel auch in dieser Form forciert.

Ob eine Änderung des Referenzwerts bei den AM4-Mainboards mit Wissen von AMD geschieht oder nicht, dies befindet sich gerade in der Klärung. Vermutlich nutzen die Mainboardhersteller einfach nur eine Lücke, die sich für sie aufgetan hat. Eine solche Modifikation in der Versorgung des Prozessors hat einen kleinen Einfluss auf die Leistung, wenngleich die CPU-Leistung innerhalb einer Mainboardserie nahezu keine Rolle mehr spielt. Natürlich will sich ein Mainboardhersteller in der Leistung möglichst gut darstellen, die entscheidenden Faktoren beim Mainboard sind jedoch sicherlich die Ausstattung - wenngleich hier ebenfalls die Spannungsversorgung mit hineinspielt.

Man muss und sollte solche Manipulationen also nicht gut heißen. Sie sind allerdings keine echte Gefahr für die Hardware, sondern eher eine für die zukünftige Vergleichbarkeit einer Plattform. Es müssen ohnehin schon zahlreiche Parameter übereinstimmen, so dass ein Prozessor A sich auf einem Mainboard B ebenso verhält, wie auf einem Mainboard C. Das BIOS, die AGESA-Version, Kühlung und vieles mehr spielen eine Rolle und machen Vergleiche immer schwieriger. Auch Schwankungen in den Prozessoren kommen hinzu, so dass selbst Leistungsmessungen nur noch innerhalb eines Testssystems Gültigkeit haben. Ein Core i9-10900K kann in den Standardeinstellungen bis zu 230 W verbrauchen, es können aber auch bis zu 280 W sein. So groß sind die Schwankungen inzwischen.

Wer sich den Wert für die Power Reporting Deviation einmal selbst anschauen möchte, kann dies mit HWiNFO in der Version 6.27-4185 Beta ab sofort selbst tun.

Update: AMD äußert sic

AMD hat sich inzwischen gegenüber TomsHardware zur Power Reporting Deviation geäußert:

"We are aware of the reports claiming that select motherboards may be under-reporting certain power telemetry data that could alter the performance and/or behavior of AMD Ryzen processors under certain conditions. We are looking into the accuracy of these reports. 

We want to be clear with our customers: AMD Ryzen processors contain a diverse array of internal safeguards that operate independently of external data sources. These safeguards enforce the safety and reliability of the processor during stock operation. Based on our initial assessment, we do not believe that altering external telemetry in the manner described by those public reports would have a material impact on the longevity or safety of a user's processor."

Man wolle sich die Berichte dazu genauer anschauen, versichert aber zugleich, dass interne Sicherheitsmechanismen des Prozessors sicherstellen, dass es zu keinerlei Beschädigung der Hardware kommt.

Inzwischen ergibt sich auch ein klareres Bild, wann es durch falsche Telemetriedaten des Mainboards zu einer Veränderung des Verhaltens der Ryzen-Prozessoren kommt. Dies ist vor allem bei frühen BIOS-Versionen der Hersteller der Fall. Spätere BIOS-Versionen stellen wieder einen normalen Referenzwert her. Offenbar ging es hier vor allem darum, dass erste Berichte zu den Mainboards besonders positiv ausfallen.