Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

So. Das Thema hat mir doch keine Ruhe gelassen, weil im Stresstest alles einwandfrei läuft. Kurzum: Alle Hardware-Komponenten laufen einwandfrei.

Ursache war meine Installation von HWInfo 6.42. Ich verweise hierbei auf folgendes: https://www.computerbase.de/2021-02/hwinfo-6-43-beta-radeon-rx-6000-whea-fehler/ (Wusste ich leider nicht),
Warum ich eine alte Version verwende? Seit Version 7.0 gibt es ein 12-Stunden-Limit für das Shares-Memory-Feature, welches ich für die Anbindung an das Stream Deck verwende.
Daher wollte ich neuste 6er Version verwenden. Die neuste gelistete ist aber die 6.42 (siehe: https://www.fosshub.com/HWiNFO-old.html) und nicht 6.43.

Woher kamen aber die Black Screens oder Reboots nach Neuinstallation? Scheiß Windows Update meint ja hier und da immer die Treiber zu ersetzen. Das hat dem System wohl nicht geschmeckt und ist dann abgeschmiert.

Ergo: Zukünftig nach jeder Neuinstallation die Treiberaktualisierung von Windows deaktivieren und erstmal keine Drittprogramme installieren.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn es öfters vorkommt:
Curve Optimizer All Cores Positive einstellen, sodass die Kerne mehr Spannung bekommen (also nicht undervolten, sondern overvolten).
 
Ich frage mich echt, welches Technische Problem oder eher gesagt was kaputt gegangen ist in der CPU das es erst jetzt nach über 2 Jahren auftritt bzw. passiert wie gesagt.
 
Ich bin bis heute davon überzeugt, dass es kein direkter "Defekt" sondern ein Problem der Qualitätskontrolle ist und die berühmte WHEA Problematik dann nur noch von der Silicon Lottery abhängt.
Wenn man Pech hat, erwischt man eine CPU mit niedriger Chipgüte und das verzeiht dir dann gewisse Einstellungen oder Szenarien nicht, wie z.B. fehlerhafte Telemetrie oder leichte Über-/Unterspannungen. Obwohl diese Umgebungsbedingungen bei anderen Nutzern dann gleich ist, erweckt es den Eindruck, als wäre deine CPU "kaputt", dabei liegt es vielmehr daran, dass die meisten eine CPU mit hoher Chipgüte bekommen haben und es dem Halbleiter zu verdanken ist, dass es ohne Probleme funktioniert bzw. gewisse Fehler verzieht.

Es gibt querbeet im Netz so viele Nutzer, die selbst nach der vierten ausgetauschten CPU unter dem Problem litten und teils bis heute noch leiden, unter absoluten Stock Settings wohlgemerkt.

Ich hatte übrigens das selbe Problem mit meinem 3700X auf einem X570 Unify. Unter Last lief alles bombenstabil, 24 Std. Memtest sowohl mit Stock als auch RAM OC Null Probleme, aber in sehr unregelmäßigen Abständen schmierte das System im idle ab (full stock settings). Manchmal 3 mal am Tag, manchmal erst nach 2 Wochen und das machte die "Fehlersuche" extrem nervig. Zweieinhalb Jahre lang ging das so. Was ich nicht alles schon ausprobiert hatte, das würde jetzt den Rahmen sprengen.

Plötzlich verschwand das Problem, während sich weder am Unterbau, noch an der BIOS Version, geschweige denn an den BIOS Einstellungen irgendetwas verändert wurde (ich hatte es irgendwann aufgegeben und wollte die CPU zur RMA schicken, hab es aber immer hinausgezögert).

Seitdem hatte ich extra darauf folgende BIOS Versionen und Chipsettreiber nicht mehr aktualisiert, weil ich nur noch froh war nicht mehr das Problem zu haben. Es könnte auch an irgendeinem Windows Update gelegen haben, keine Ahnung, aber ich habe genau NULL Erkenntnis darüber, warum das Problem verschwand und wie man sieht, kann es sich offensichtlich nicht um eine "defekte" CPU gehandelt haben, denn sie läuft bis heute nach wie vor mit NULL Problemen!
 
sondern ein Problem der Qualitätskontrolle ist und die berühmte WHEA Problematik dann nur noch von der Silicon Lottery abhängt.
So kann man es auch beschreiben in folge dessen es dann zum Defekt kommt.

Ich hab nichts verändert auch keine Treiber oder sonst was über 2 Jahre kein einziges Problem. Zig verschiedene Spiele Benchmarks und sonst was an App Anwendungen etc.. und dann wie geschrieben beim Surfen wie sonst auch in all den Jahren zack freeze auch Audio und Black screen mit Reboot. Wird es wohl eher sein: Electromigration
 
Transistor aging ist das nicht der Fortlaufende Prozess nach der Electromigration?
 
Seit ich meinen 5800X in den Eco Modus Versetzt habe ( - 200MHz) kommen auch keine WHEA Fehler oder Spontan Abstürze mehr.
 
Da taktet die CPU doch nicht mehr hoch oder.... ich hatte bis jetzt auch keinen weiteren.
 

Anhänge

  • sssdsdff.png
    sssdsdff.png
    133,8 KB · Aufrufe: 125
Zuletzt bearbeitet:
Stock idle reboot ist bei meinen 5950x nun auch wieder präsent. Alles gefummelt was man so fummeln kann. Es ist nicht nachvollziehbar woran es wirklich liegt. Wheas bekomme ich ab 1866 fclk, bei 1833 alles tutti und 24h primestable. RAM auch 20000 karhustable...und und und... die Kiste läuft eigentlich ganz gut, tagelang kein gemecker. Dann einfach im Idle ein Pieps und reboot.
Habe noch 4 Monate Herstellergarantie. Sollte ich mal einen RMA starten?
 
ist doch totaler OC? wieso bitte RMA wenn er bei 1866! Probleme macht?
 
Betreibe meine CPU mit 2 Volt. Überhitzt scheinbar schon beim Booten und schaltet daher ab. Sollte ich eine RMA starten?
 
RAM ist oc, OK. Aber im Stock macht er es auch. Gehen wir mal davon aus dass ich die totale Hardwarewissenstransdedenz in Person bin.
Beitrag automatisch zusammengeführt:

Hab es erst so verstanden das es immer passiert, auch Stock.

Wenn nicht dann ist Garantie sowieso futsch da OC.
Er macht es Stock.
 
Mein 5900x B2 geht mir aktuell gehörig auf den Sack.
Er lief über ein Jahr mit PBO und Curveoptimizer ohne Probleme. Eventuell noch länger... eigentlich direkt ab Erhalt als es das neue Stepping gab.
Seitdem gab es einige BIOS Updates, ich konnte die Settings auf "stabil" abklopfen mit dem Corecycler (Dauertest über ein paar Tage) und das war es.

Nun... seit einigen Wochen rotten mir aber die Cores dahin.
Einzelne Cores die absolut stabil auf -25 liefen, tun dies mittlerweile nicht mals mehr mit -5 und sind auf 0 angekommen.
ABER erst läuft es ein paar Wochen und danach machen sich WHEA Probleme inkl. Neustart auf einem oder mehreren Kernen bemerkbar.
Ich entschärfe den CO auf betroffenen Kernen, teste auf Fehlerfreiheit, habe einige Wochen Ruhe und auf einmal sind andere Kerne ebenfalls instabil, das der Corecycler an allen Kernen was zu meckern hat hatte ich jetzt auch.
Entschärfe ich das ganze wieder, so läuft es wieder einige Zeit ohne Probleme (inkl. einige dutzend Stunden Corecycler fehlerfrei) und plötzlich -so vor einigen Tagen beim Zocken- Blackscreen, Neustart, WHEA Event im Logger auf APIC ID 0815...
Mir war bewusst das PBO/PBO2 auf die Lebensdauer gehen können, aber solche Auffälligkeiten habe ich nicht erwartet.
Die Temperaturen der CPU waren nicht auffällig, dennoch habe ich die WLP ersetzt und diese auch mal in ein anderes Board -genau selbe Type- gesetzt.
Der Fehler wandert mit der CPU. Die andere CPU -ebenfalls ein 5900x- läuft mit seinen CO Settings fehlerfrei vor sich hin.
Jetzt habe ich erfahrungsgemäß wieder Ruhe für ein paar Wochen, bis mir dann wieder mitten im Betrieb der Kasten mit der betroffenen CPU ausseinander fällt.

Hoffentlich normalisiert sich das nochmal, wollte mir eigentlich keine neue CPU kaufen müssen.

Vorher war nichts auffällig, selbst mein RAM OC ist an der betroffenen CPU nicht mehr stabil zu bekommen, weswegen dieser nun auf "Stock XMP" läuft, 1800/3600 MHz, anstelle von 1900/3800 MHz.
Zumindest das nun absolut stabil, laut Karhu und Stressapptest.

Sehr zeitintensive Geschichte, für die ich keine Lust mehr habe aktuell -.-.
 
Silizium altert nun mal und zwar schneller je mehr es am Limit betrieben wird.
 
Jo... daher dachte ich, wäre ich besonders schlau indem ich TDC, PPT und EDC auf die von AMD vorgesehenen Werte stelle und dann erst mit dem CO arbeite.
War wohl nichts.
 
TDC, PPT und EDC auf die von AMD vorgesehenen Werte stelle und dann erst mit dem CO arbeite.
Das ist die übliche Vorgehensweise, aber halt auch nicht sonderlich klug bzgl. Lebensdauer, weil man je nach CO-Offset halt wirklich am absoluten Minimum (Undervolting) hängt.
Sowohl krasses Undervolting an der Kotzgrenze als auch Übertakten (höhere Spannung) tun dem Silizium auf Dauer nicht gut.
CO -25 beim 5900X sind halt auch schon ein Wort. Hat meiner damals auf keinem einzigen Core geschafft.
 
Jo... daher dachte ich, wäre ich besonders schlau indem ich TDC, PPT und EDC auf die von AMD vorgesehenen Werte stelle und dann erst mit dem CO arbeite.
War wohl nichts.
Oberhalb der Werte habe ich ihn auch nie gefahren. Diese AMDHighenderfahrung war mit der CPU mehr so meh. Werde mal RMA anwerfen....
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh