Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

Liegt es dann nicht eher an der 6800?
Würde ich spontan zustimmen, wie gesagt davor gab es gar keine Probleme und jetzt das. Ich dachte es kann nicht schaden das hier zu erwähnen, evtl. hat noch wer dieselben Probleme. Bin noch nicht wirklich dazu gekommen mehr zu Recherchieren.
Der Punkt mit USB, den du beschreibst, tritt bei mir auch seit gestern auf. Vorhin erst z. B. auch hier beim Tippen, man schreibt was aber es tut sich nichts :)
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Stell mal Probehalber die Karte auf PCIe 3.0 runter.
 
Und nach der Tagesschau reboot zum Windows Login Screen - nicht mal ne halbe Stunde - so ein mist.

dmesg auszug (PBO CO-15, cpu MC ca 4,4GHz und IF2000)
Code:
[  628.087277] mce: [Hardware Error]: Machine check events logged
[  628.087280] [Hardware Error]: Corrected error, no action required.
[  628.087284] [Hardware Error]: CPU:0 (19:21:0) MC27_STATUS[Over|CE|MiscV|-|-|-|SyndV|-|-|-]: 0xd82000000002080b
[  628.087289] [Hardware Error]: IPID: 0x0001002e00000500, Syndrome: 0x000000005a020005
[  628.087291] [Hardware Error]: Power, Interrupts, etc. Ext. Error Code: 2, Link Error.
[  628.087293] [Hardware Error]: cache level: L3/GEN, mem/io: IO, mem-tx: GEN, part-proc: SRC (no timeout)
mist²
 
Zuletzt bearbeitet:
SAM aktiviert?
 
Sagt mal Reboots und Whea Fehler sind doch 2 ganz verschiedene Dinge oder?
 
Mich hat es auch erwischt. Wird neue Hardware jetzt zum Lottospiel oder wie?
Mein kleiner 5600x lief ca. 1 Monat ohne BS, freez etc. seit gestern ist eine 6800 dazugekommen und WHEA Logger ID 18 lässt grüßen. PC friert für 10-15 Sek. ein und startet einfach neu. Vorhin Bios update gemacht, leider keine Änderung. Bis jetzt kam das 6 Mal vor, immer im idle.
MSi MoBo?
 
@Holzmann
Wheas können die verschiedensten Ursachen haben und zb auch beim Ram Oc auftreten, dort ist die Ursache für den Whea dann aber nicht Cache Hirarchy Exception und es gibt auch seltenst einen Reboot und vor allem hören die Wheas sofort auf wenn man das zu strenge OC wieder raus nimmt.

Hier gehts aber darum das die Wheas aufgrund der Cache Hirarchy Exception kommen und das vor allem auch bei kompletten Stock Settings und ohne jegliches OC,und das ist eben ein Problem mit der Cpu und die Folge daraus ist fast immer auch ein Reboot.
Vor allem im Idle und bei Teillast kann man kaum was dagegen tun, als eine fixe Vcore einstellen und selbst das hilft bei vielen Cpus mit dem Fehler nicht (bei meiner ersten konnte man einstellen was man wollte die Wheas wegen der Cache Hirarchy Exception kammen immer wieder ganz plötzlich inklusive Reboot)
 
smart access memory
 
Dann mach es mal aus.
Werde ich definitiv ausprobieren!
Stell mal Probehalber die Karte auf PCIe 3.0 runter.
Falls SAM off nicht hilft wäre das der nächste Schritt.
Bei mir traten die Freezes und folgendem Reboot auch nach dem letzten BIOS Update auf. Hab n Unify x570
Ich denke bzw. hoffe das es lediglich ein Treiber/Bios Thema ist. Der Fehler kam mit Bios 1.4 schon auf, vorhin habe ich 1.53 geladen. Vielleicht hilft auch der ganz neue 1.5 v. 18.01 (hatte ich gar nicht auf dem Schirm).

Danke Leute schonmal für die schnelle Hilfe!
 
Ja wundert mich auch das Linux (in dem Fall Arch Linux mit 5.10 Kernel) keine gescheiten Log Einträge mehr protokoliert und Windows das mit dem WHEA-Logger noch hinbekommt bevor der Reset kommt.

Hattest du unter Arch random crashes/reboots?

Bei mir ist alles superstabil.
 
Seit dem auf meinem Gigabyte x570 Master die alte Vega64 gegen eine RX 6900XT getauscht wurde, hatte ich auch WHEA 18 Fehler (Cache Hirarchy Exception) bei Einstellungen, die vorher wochenlang stabil liefen. Entweder der FCLK musste deutlich runter von den eingestellten 1866 MHz oder die LLC der CPU mehrere Stufen rauf. Am Ende bin ich über diesen Beitrag bei overclock.net gestolpert und konnte damit das System wieder stabil bekommen.
  • CPU VDDP = -20 mV (real 875 mV) statt AUTO
  • cLDO_VDDP = 875 mV statt 900mV
  • VDDG CCD = 925 mV
  • VDDG IOD = 1025 mV
  • vSOC = 1.100 V (real 1.092V)
Mein Versuch, die VDDG CCD Spannung schrittweise bis auf 1025 mV zu erhöhen, hat die Situation sogar deutlich verschlimmer und die Kiste ist alle 20-30 Minuten abgeschmiert, statt nur alle paar Stunden
 
Nur mal aus Neugier, jemand schrieb hier ja vor einigen Tagen schon einmal das er vor jeden reboot auch Meldungen Kernel Processor Power in der Ereignisanzeige findet. Mir ist das auch schon mal aufgefallen. Hielt es aber eigentlich immer für normale Meldungen die vom Booten oder so kommen. Immerhin wurden diese ja nicht als Error oder so gekennzeichnet. Sie stehen nur als Information drin.

Aber ich hab mir die alten Logs nun auch nochmal danach abgesucht. Weil überwiegend scheinen ja Spannungseinstellungen zu helfen. Und tada, bei mir tauchen diese Meldungen mit Kernel Processor Power auch immer nur kurz vor einem Exitus auf.

Vom Prozessor "0" in der Gruppe "0" werden die folgenden Energieverwaltungsfunktionen verfügbar gemacht:

Art des Leerlaufzustands: ACPI-Leerlaufzustände (C) (2 Zustand/Zustände)

Art des Leistungszustands: ACPI-Steuerung für gemeinsame Prozessorleistung
Nominale Frequenz (MHz): 3793
Höchste Leistung in Prozent: 160
Geringste Leistung in Prozent: 58
Geringste Drosselung in Prozent: 14

Wobei die Angaben bei Höchste Leistung bei jeden Kern etwas variieren. Scheint doch aber fast so, als würde die CPU, warum auch immer, plötzlich irgendwelche Funktionen Melden, die sie offenbar nicht einhalten kann. Ich hab die Einträge zumindest immer nur kurz vor einem Absturz drin stehen. Sonst tauchen die dort nicht auf.
 
Habe solche Einträge auch, jedoch läuft mein System komplett stabil, selbst mit Ram OC und CO -10 etc.
Keine Abstürze/Reboots...
 
Zuletzt bearbeitet:
Seit dem auf meinem Gigabyte x570 Master die alte Vega64 gegen eine RX 6900XT getauscht wurde, hatte ich auch WHEA 18 Fehler (Cache Hirarchy Exception) bei Einstellungen, die vorher wochenlang stabil liefen. Entweder der FCLK musste deutlich runter von den eingestellten 1866 MHz oder die LLC der CPU mehrere Stufen rauf. Am Ende bin ich über diesen Beitrag bei overclock.net gestolpert und konnte damit das System wieder stabil bekommen.
  • CPU VDDP = -20 mV (real 875 mV) statt AUTO
  • cLDO_VDDP = 875 mV statt 900mV
  • VDDG CCD = 925 mV
  • VDDG IOD = 1025 mV
  • vSOC = 1.100 V (real 1.092V)
Mein Versuch, die VDDG CCD Spannung schrittweise bis auf 1025 mV zu erhöhen, hat die Situation sogar deutlich verschlimmer und die Kiste ist alle 20-30 Minuten abgeschmiert, statt nur alle paar Stunden

Kann mir jemand eine Tipp geben, wo ich bei einem Gigabyte Bios die cLDO_VDDP finde?
 
Liegt es dann nicht eher an der 6800?
Ich habe diese Probleme auch vermehrt seitdem ich die 6800 drinnen habe. Ich kann nicht recht glauben dass es alleine an der Grafikkarte liegt...

Heute kommt mein 3600, bin gespannt ob es bei dem auch Probleme gibt!
 
Mein Sys läuft nun seit 9d 3h nonstop. Aber ich setzte manuell den Energiesparplan "Energiesparmodus" (~35W) wenn ich nicht am Rechner bin (über Nacht). Ob es das ausmacht? Könnte ja mal jemand anders versuchen.

Curve Optimizer: Aktiv
PCIe: Gen3
RAM OC: DCOP geladen
ResizeBar: Aktiv
 
Zuletzt bearbeitet:
ResizeBar (SAM) aktivieren macht natürlich Sinn bei einer Nvidia.
Und was soll man mit "Curve Optimizer: Aktiv" anfangen?
Positiv, Negativ, All-Core, Single-Core, welche Werte?
PCIe auf Gen3 zu forcen ergibt auch keinen Sinn.

Einzig, dass du DOCP/XMP geladen hast, ist vernünftig.
 
Mein Sys läuft nun seit 9d 3h nonstop. Aber ich setzte manuell den Energiesparplan "Energiesparmodus" (~35W) wenn ich nicht am Rechner bin (über Nacht). Ob es das ausmacht? Könnte ja mal jemand anders versuchen.

Curve Optimizer: Aktiv
PCIe: Gen3
RAM OC: DCOP geladen
ResizeBar: Aktiv
hmm ich hab den rz Ryzen Balaeced v4. Seit ~3 Tagen non Stop aktiv. Normalbetrieb ~35 °C alles @Stock ohne PBO.
 
Dito. Der v4 PowerPlan ist top.
Im Idle keine sinnlosen Spikes und auch bei Youtube und Twitch etc. immer schön im Idle.
 
Seit dem auf meinem Gigabyte x570 Master die alte Vega64 gegen eine RX 6900XT getauscht wurde, hatte ich auch WHEA 18 Fehler (Cache Hirarchy Exception) bei Einstellungen, die vorher wochenlang stabil liefen. Entweder der FCLK musste deutlich runter von den eingestellten 1866 MHz oder die LLC der CPU mehrere Stufen rauf. Am Ende bin ich über diesen Beitrag bei overclock.net gestolpert und konnte damit das System wieder stabil bekommen.
  • CPU VDDP = -20 mV (real 875 mV) statt AUTO
  • cLDO_VDDP = 875 mV statt 900mV
  • VDDG CCD = 925 mV
  • VDDG IOD = 1025 mV
  • vSOC = 1.100 V (real 1.092V)
Mein Versuch, die VDDG CCD Spannung schrittweise bis auf 1025 mV zu erhöhen, hat die Situation sogar deutlich verschlimmer und die Kiste ist alle 20-30 Minuten abgeschmiert, statt nur alle paar Stunden

Bei mir war es ebenfalls der Umstieg von 1080ti auf 3080 , dass ich dann das BIOS wechseln wegen meiner Riser Karte musste, um auf PCIe 3.0 zurück zu gehen. Leider ist das BIOS deutlich instabiler. Weniger Undervolting möglich und ganz plötzliche Crashes. Irgendwie hab ich das Gefühl, es hat was mit dem Agesa und PCIe zu tun.
 
Zuletzt bearbeitet:
Und was soll man mit "Curve Optimizer: Aktiv" anfangen?
Dass bei mir der Curve Optimizer aktiv ist und nicht deaktiviert ist - was sont? Die Werte sind irrelevant - da von CPU zu CPU verschieden.
 
Einfach nur CO "aktivieren" macht aber gar nichts, wenn man nicht zusätzlich etwas einstellt.....
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh