Microcode 0x12B: Intel identifiziert Degradierung in der Takterzeugung als Fehlerquelle

AMD Hardware kannst Du in großen Unternehmen mit der Lupe suchen.
Ist in unserer Firma genauso.

Käse, ich habe bis Ende 2021 für einen Server bzw. Systemhersteller gearbeitet.
2019 habe ich vereinzelt die ersten Racks mit AMD Hardware in Betrieb genommen, Ende 2021 sind ganze LKW Ladungen mit AMD Hardware gekommen.
Ich kenne in Frankfurt Rechenzentren wo ganze Räume nur mit AMD Systemen voll gestellt sind.

Schon, aber wsl. sind mehr Räume mit Intel gefüllt als mit AMD.
Aber schön, dass das diverser und bunter wird, find ich nice. :d

Ich glaube das hier unterschieden werden muss, zwischen Serverbereich und Endgeräte für Mitarbeiter!

Meine Beobachtungen, die natürlich nur subjektiv sind, ist dass es im Serverbereich bei großen Firmen seitens der IT teilweise auch ein Umdenken zu AMD stattgefunden hat. Aber wenn es darum geht, seine Mitarbeiter mit (Office) Desktops/Notebooks auszustatten, hat meiner Meinung nach immer noch Intel die Nase vorn.

Und das wir bei einigen ITlern daran liegen, dass sie einfach "nur" auf den Support zb. von Dell, HP oder Lenovo schauen, und bei anderen weils halt immer schon so war und funktioniert...

Man darf nicht vergessen, diese Probleme mit Raptor-Lake (Refresh) tritt ja "nur" dann auf, wenn mein ein "High-End-System" nützt das man völlig ausquetscht. Das ist für uns HWLuxx User und Nerd natürlich ärgerlich, aber wie oft hat man diesen Fall in Firmen... die meisten Mitarbeiter in großen Firmen nützen ihre Geräte mit Office, Mail usw. Selbst Firmen die Workstation zb. für ein paar CAD-Stationen brauchen, haben meist einen viel höheren Anteil an Office-Geräten... Und wenn wirklich eine der Workstation draufgehen sollte, dann greift wieder der Punkt mit dem Support bei langjährigen Partnern...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Naja, aber Lenovo bekomm ich mit AMD ja genau so.

Ich kenn das aber auch aus meiner Branche, es gibt so Produkte, die einfach "bekannt" sind... die Leute sind das halt gewohnt. Wenns besser und/oder billiger geht interessiert das nicht, solang das gewohnte auch noch im Rahmen ist.


Auf jeden Fall ist das Thema ein schöner Artikel- und Klickgenerator für Inhalts-Kreatoren aller Art. :d
 
Schon, aber wsl. sind mehr Räume mit Intel gefüllt als mit AMD.
ergibt sich ja schon aus den 75% Marktanteilen.
Es kommt halt sehr darauf an ob die Kunden nur bestehende Lösungen erweitern oder neue Instanzen ohne Abhängigkeiten aufbauen wollen.
Insofern wird da irgend ein Angebot von so einer komischen IT Bude bestellt ohne es zu verstehen, natürlich zu absurden Preisen für Hardware, über die man im Luxx lacht.
Es gibt Kunden die glauben etwas zu benötigen, obwohl sie es bereits haben und kaufen dann was neues, das schlechter ist als das was sie bereits haben.
 
Käse, ich habe bis Ende 2021 für einen Server bzw. Systemhersteller gearbeitet.
2019 habe ich vereinzelt die ersten Racks mit AMD Hardware in Betrieb genommen, Ende 2021 sind ganze LKW Ladungen mit AMD Hardware gekommen.
Ich kenne in Frankfurt Rechenzentren wo ganze Räume nur mit AMD Systemen voll gestellt sind.
Bei uns, nur Intel, nicht ein AMD System, da wird ja auch mit gearbeitet und nicht gezockt.:d
 
Bei uns sieht es ähnlich aus, wir haben grob 800 Intel (von Dell) und 60 AMD (Fujitsu und HP) Clients. Bevor Dell flächendeckend AMD anbietet friert die Hölle zu… :d

Interessanterweise sind unsere stationären Thinclients AMD Ryzen (Fujitsu Futro S7011).
 
Bei uns gibts in der Firma normalerweise auch nur Intel, obwohl Lenovo beides hat.

Aber die wichtigsten Aussagen des Artikels waren: Die erste Ursache sollen zu aggressive Einstellungen der Mainboard-Hersteller gewesen sein. Laut Intels eigenen Benchmarks hat der Microcode 1x12B keinerlei Auswirkungen auf die Leistung

Hab keinen betroffenen CPU (lt. Intel), aber ich denke mal das mein Mainboard auch ein Update bekommt
 
  • Danke
Reaktionen: Tzk
Hab keinen betroffenen CPU (lt. Intel), aber ich denke mal das mein Mainboard auch ein Update bekommt
Generell verstehe ich es sowieso nicht, wieso ein 13600K betroffen sein soll und ein 13500 nicht betroffen ist, wenn die Bios Einstellungen alle (so wie es früher war) ohne selber einzugreifen, offen sind.

Würde auf jeden Fall immer das neuste aufspielen.
 
@Dark_angel
Gab auch Berichte über 13900T die betroffen waren. Ich würde daher davon ausgehen, dass alle 13er und 14er CPUs betroffen sind, die auf dem großen Die basieren oder Artverwandt sind. Nur die 12th Gen Rebrands nicht…

Hatte der 13500 nicht einen anderen Die mit weniger E-Kernen?
 
Zuletzt bearbeitet:
Angeblich basiert der 13500 auf der Vorgängerplattform und ist nur umgelabelt. Obs stimmt, kA
 
MSI ist auch schon dran ...


Ist ja auch das gleiche :confused:

Das gleiche ist nicht immer dasselbe ... :p

 
Zuletzt bearbeitet:
Aber "dasselbe" ist manchmal das Gleiche ;) ark intel erklärts :hust:
 
  • Danke
Reaktionen: Tzk
@Dark_angel
Gab auch Berichte über 13900T die betroffen waren. Ich würde daher davon ausgehen, dass alle 13er und 14er CPUs betroffen sind, die auf dem großen Die basieren oder Artverwandt sind. Nur die 12th Gen Rebrands nicht…

Hatte der 13500 nicht einen anderen Die mit weniger E-Kernen?
Angeblich basiert der 13500 auf der Vorgängerplattform und ist nur umgelabelt. Obs stimmt, kA
Stimmt, der 13500 sollte im C0-Stepping sein, mein Fehler.:-)
 
Also keine Gefahr für meinen CPU? Hoffe doch, will ihn etliche Jahre benutzen
 
Könnte mir jemand bitte das Problem und die Ursache erläutern in einfacher Sprache für Leute, die sich nicht auskennen?
 
Spannungen über 1,30V und Temperaturen jenseits der 90°C waren schon vor etlichen Jahren zur Zeiten von 22 nm nicht gesund. In der OC Szene war das ja auch immer Thema, man sprach von den filigranen Strukturen. Deshalb habe ich es nie verstanden, warum Intel und auch AMD auf einmal Lastzustände um 100°C und Peak Spannungen bis 1,5V bei aktuellen noch kleineren Strukturen unter 10nm als "normal" abgetan haben.

Ich habe mehrere 13600K und 14600K verbaut und betreibe diese auch selber, aber immer manuell eingestellt auf unter 1,3V und max Temps von 85 - 90°C. Nur für HWbot gabs mal kurz mehr Power. Ich habe keine Stabilitätsprobleme.
 
Könnte mir jemand bitte das Problem und die Ursache erläutern in einfacher Sprache für Leute, die sich nicht auskennen?
Ich versuche es im Allgemeinen und versuche es kurz zu halten.

Durch verschiedene Fehler innerhalb der CPU selber, als auch über die Spannungsversorgung der Hauptplatinen (Mainboards) können erhöhte Spannungen die CPU "degradieren" - entspricht "verschlechtern" . Dadurch kann die CPU instabil werden. Später , und damit ist dieser Artikel gemeint, kommt "erschwerend" noch ein erhöhter Takt hinzu.

Entsprechende BIOS Updates mit dem sogenannten Microcode (Update für die CPU) werden diese Probleme ausmerzen.
 
Beim ASRock Z790 PG Nova Wifi ist schon heute ein neues Bios mit 0x12B Microcode rasugekommen. Verwunderlicherweise direkt als WQHL und nicht als Beta.

240927135006.jpg 240927135346.jpg 240927135200.jpg

Hab direkt mal eine Testrun der originalen Setup ohne XMP oder ähnliches gemacht. Was mich direkt daran stört ist IA AC/DC Loadline bei 1.1 belassen wurde. Dennoch alles Serien Setup ASRock Baseline Profil. Wie man schon sieht mit 400A obwohl das standard Setup laut den kursierenden veröffentlichungen eigentlich 307A sein sollte.

Das ganze sieht beim Cinebench R23 dann so aus (ohne Testprogramme im Hintergrund - W11 24H2 - vor drei Tagen neu aufgesetzt) :

Screenshot (7).png

Hier dann noch ein Run direkt danach mit HWinfo im Hintergrund um die Spannungen usw. zu ersehen.

Screenshot (8).png

Da ich das Bios erst ne halbe stunde habe kann ich noch nicht sagen ob sich in Bezug auf Undervolting Setup oder Ram Setup was verschlechtert hat. Fallls da interesse besteht kann ich das aber gerne Posten.
Auf jeden Fall war ASRock in diesem fall recht schnell mit der Aktualisierung , im Gegensatz zu vorher.

Edit : Ich machs einfach mal erster Test vom vorherigen Undervoltig Setup

Screenshot (11).png Screenshot (13).png

Standardtakt - PL1+2 - Ram , VF -165mV Allcore , 307A

Edit 2 : mit gleichem Setup aber ohne Baseline aktiviert, dafür Bios Default aktiviert , ist die Lesitung vie vor dem Update.

Durch das deaktivieren des Baseline Profils steigt dezent die Singlecoreleistung und Gesammtleistung. Zwar spürt man das im Alltag nicht aber man kann es ersehen. Dieses war vor dem Update ebenfalls so.

Screenshot (14).pngScreenshot (16).png

Trotz unveränderten Grundeinstellungen , mal Abgesehen von Baseline auf Bios Default ist die VCore und CoreVID niedriger. Das war vor dem Update nicht der Fall . Wenn man undervolten will bedeutet das für mich Bios Default an und Baseline aus.

Ich hoffe ich trete niemandem mit diesem ausführlichem Post auf die Füße... Falls doch , mich einfach auf Ignore setzen und Ihr sehr mich nicht mehr :ROFLMAO:
 
Zuletzt bearbeitet:
So. Ich denke ich hab ein Gutes setup aus Leistung und Effizienz gefunden.

Ich habe VF-135mV gesetzt , IA AC/DC Loadline 0,64 , PL1 125W / PL2 210W , 288A . Taktraten Standard. Damit mache ich beim CPUz Benchmark eine ganz Gute Figur und liege locker über dem dort angegebenen Referenz 14900Kf und das trotz reduziertem verbrauch.




Auch bei CineBench R23 sieht das Ergebnis Überzeugend aus :

Singlecore 2324 - Multicore 38609

Screenshot (17).png Screenshot (18).png

Der Ram Läuft derzeit mit 8000MT/s CL36 - die Anwendungsstabilität muß ich noch testen, aber es sieht gut aus.

cachemem.png

Ich denke aus meiner Sicht wird durch den neuen Microcode die Leistung nicht verschlechtert und wenn die CPU dadurch noch ne Weile hält bis mal wieder ne CPU kommt die einen zum Wechsel überzeugen kann, dann umso besser.
Gaming teste ich noch. Aber bei meinem Letzten ähnlichen Setup lag ich bei ~65-69W @ WQHD . Natürlich will ich auch sehen ob die Unrealengine stabil läuft. Ua bei Callisto Protocol und Elden Ring.

Wenn ich mit meinem Versuch hier bei der Entscheidung helfen kann was das Updaten auf diesen Microcode angeht, dannwürde ich mich sehr darüber freuen :-)
 
Mainboard:Strix Z790-E BIOS: 1303
Alternate hatte also Recht mit der Behauptung ich brauch für meinen i7-13700KF kein BIOS update.
Weil Intel schreibt jo -> Dies bedeutet aber auch, dass die Anfälligkeit zur Degradierung des "Clock Tree Circuit" eine Design-Fehler in Raptor Lake(-Refresh) ist.
Ich hab keinen Refresh sondern den stink normalen i7-13700KF (dieser ist kein Refresh cpu ..hat auch Alternate gesagt)
Läuft auch schon seit einem Jahr und zeigt keine Schwächen -> von Null auf 100 ..jungfreulich wie am ersten Tag:-)
 
Mainboard:Strix Z790-E BIOS: 1303
Alternate hatte also Recht mit der Behauptung ich brauch für meinen i7-13700KF kein BIOS update.
Weil Intel schreibt jo -> Dies bedeutet aber auch, dass die Anfälligkeit zur Degradierung des "Clock Tree Circuit" eine Design-Fehler in Raptor Lake(-Refresh) ist.
Ich hab keinen Refresh sondern den stink normalen i7-13700KF (dieser ist kein Refresh cpu ..hat auch Alternate gesagt)
Läuft auch schon seit einem Jahr und zeigt keine Schwächen -> von Null auf 100 ..jungfreulich wie am ersten Tag:-)

Jein . Alle CPUs ab dem 13400f, 14400f aufwärts sind betroffen. https://www.computerbase.de/2024-07...tentiell-betroffen-kein-rueckruf-durch-intel/

Mit dem neuen Microcode und Optimiert SOTTR :

GPU Limmit

Screenshot (20).png

CPU Limmit

Screenshot (21).png

Black Myth Wukong im CPU Limmit

Screenshot (24).png
 
Zuletzt bearbeitet:
Deshalb habe ich es nie verstanden, warum Intel und auch AMD auf einmal Lastzustände um 100°C und Peak Spannungen bis 1,5V bei aktuellen noch kleineren Strukturen unter 10nm als "normal" abgetan haben.
Ganz einfach, weil sie es können. Du kannst die modernen 3D FinFet Transistoren auch nicht mehr mit denen von vor paar Jahren vergleichen. Da hat sich auch einiges bei den Materialien getan.
Die 1,5V und 100°C werden auch bei den feinen Strukturen wahrscheinlich eher kein Problem sein, wenn man die CPU nicht X-Jahre dauerhaft so betreibt. Viel schlimmer sind die extremen Spannungsspitzen, die Intel ja auch mit dem letzten Microcode Update Primär gefixt hat. Teilweise hat man hier an die 2V gemessen.

Für Degradierung gibt es zwei Mechanismen. Elektromigration und der elektrische Durchschlag. Letzteres passiert genau dann wenn eine übermäßig hohe Spannung durch das Dielektrikum dringt. Dadurch werden die Isolatoren zwischen den Leitern der CPU abgetragen. Im Gegensatz zur Degradierung bei Elektromigration, bringt mehr Spannung oder niedrigere Frequenzen hier auch absolut keine bessere Stabilität mehr.

Bei der Elektromigration läuft das anders ab. Hier lösen sich übermäßig viele Ionen des Leiters als Resultat eines hohen Stroms und/oder Temperaturen und verringern allmählich den Querschnitt des Leiters. Das sorgt dafür das a) die effektive Strombelastbarkeit verringert wird und b) die Temperaturen steigen. D.h. Frequenzen senken oder Spannungen steigern funktioniert als Workaround bis zum endgültigen tot der CPU.

Degradierung durch Durchschlag ist also viel wahrscheinlicher das Hauptproblem der aktuellen Intel CPUs. Egal was man macht, sie sind nicht mehr stabil zu bekommen. Die Temperaturen steigen auch nicht auffälliger. Also Halbleiter sind eigentlich eher überraschend robust geworden.
 
Degradierung durch Durchschlag ist also viel wahrscheinlicher das Hauptproblem der aktuellen Intel CPUs.
Dauerte das bis zu der ersten Welle an Ausfällen nicht bisschen zu lange für diese Theorie? Wäre das Intels R&D nicht doch noch in den Testphasen aufgefallen?
 
Zuletzt bearbeitet:
Fürs Z790 Tomahawk DDR5 ist nun auch ein neues Betabios mit 0x128 MC draußen, was mich etwas verwirrt, dass zur Behebung des Schaltungsfehlers doch eigentlich von 0x129 MC die Rede war. :confused:
 
Eventuell ein Tippfehler von MSI. Kannst du ja herausfinden, indem du das BIOS flashst und dann schaust, welcher Microcode wirklich installiert ist.

Edit: Ok, auf der MSI-Webseite steht wirklich 0x12B. ;)
 
Beim ASRock Z790 PG Nova Wifi ist schon heute ein neues Bios mit 0x12B Microcode rasugekommen. Verwunderlicherweise direkt als WQHL und nicht als Beta.

Anhang anzeigen 1030741 Anhang anzeigen 1030742 Anhang anzeigen 1030743

Hab direkt mal eine Testrun der originalen Setup ohne XMP oder ähnliches gemacht. Was mich direkt daran stört ist IA AC/DC Loadline bei 1.1 belassen wurde. Dennoch alles Serien Setup ASRock Baseline Profil. Wie man schon sieht mit 400A obwohl das standard Setup laut den kursierenden veröffentlichungen eigentlich 307A sein sollte.

Das ganze sieht beim Cinebench R23 dann so aus (ohne Testprogramme im Hintergrund - W11 24H2 - vor drei Tagen neu aufgesetzt) :

Anhang anzeigen 1030744

Hier dann noch ein Run direkt danach mit HWinfo im Hintergrund um die Spannungen usw. zu ersehen.

Anhang anzeigen 1030745

Da ich das Bios erst ne halbe stunde habe kann ich noch nicht sagen ob sich in Bezug auf Undervolting Setup oder Ram Setup was verschlechtert hat. Fallls da interesse besteht kann ich das aber gerne Posten.
Auf jeden Fall war ASRock in diesem fall recht schnell mit der Aktualisierung , im Gegensatz zu vorher.

Edit : Ich machs einfach mal erster Test vom vorherigen Undervoltig Setup

Anhang anzeigen 1030755 Anhang anzeigen 1030757

Standardtakt - PL1+2 - Ram , VF -165mV Allcore , 307A

Edit 2 : mit gleichem Setup aber ohne Baseline aktiviert, dafür Bios Default aktiviert , ist die Lesitung vie vor dem Update.

Durch das deaktivieren des Baseline Profils steigt dezent die Singlecoreleistung und Gesammtleistung. Zwar spürt man das im Alltag nicht aber man kann es ersehen. Dieses war vor dem Update ebenfalls so.

Anhang anzeigen 1030759Anhang anzeigen 1030760

Trotz unveränderten Grundeinstellungen , mal Abgesehen von Baseline auf Bios Default ist die VCore und CoreVID niedriger. Das war vor dem Update nicht der Fall . Wenn man undervolten will bedeutet das für mich Bios Default an und Baseline aus.

Ich hoffe ich trete niemandem mit diesem ausführlichem Post auf die Füße... Falls doch , mich einfach auf Ignore setzen und Ihr sehr mich nicht mehr :ROFLMAO:
Danke für deine Eindrücke. Ich glaub ASRock würfelt nicht nur die AC/DC Loadline Einstellungen mittlerweile aus :fresse: , 0.40/1.10, 0.80/0.80, 1.10,/1.10 alles schon gesehen. Ich spiele den 0x12B im Verlauf des Tages dann mal auf und schaue wie es bei mir aussieht.

Mit dem HWMonitor könnt ihr jetzt zumindest die ICCMax auch nochmal im OS prüfen.

Fürs Z790 Tomahawk DDR5 ist nun auch ein neues Betabios mit 0x128 MC draußen, was mich etwas verwirrt, dass zur Behebung des Schaltungsfehlers doch eigentlich von 0x129 MC die Rede war.
:confused:

Weder neu noch eins mit 0x128 ? Auch direkt Microcode 0x12B gebracht.
 
Dauerte das bis zu der ersten Welle an Ausfällen nicht bisschen zu lange für diese Theorie? Wäre das Intels R&D nicht doch noch in den Testphasen aufgefallen?
Intel hat doch selbst den besten Beweis geliefert das sie nur äußerst mangelhaft testen. Würde das mal nicht überschätzen wie solche Tests aussehen. Dazu kommt, Intel hat ja fast gar keine andere Wahl gehabt als die Dinger an der kotzgrenze laufen zu lassen, weil sie technologisch hinterher hinken. Damit wurden natürlich auch gewisse Risiken in kauf genommen, da arbeiten ja nicht nur Idioten.
 
Es gab halt eigentlich schon Hinweise seitens einiger 13th Gen QS/ES Tester, also vor allem wegen der Idle/low load Thematik.

Aber irgendwie hat es keinen gekümmert bzw. es wurde nicht an die richtigen Leute bei Intel kommuniziert.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh