Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Musste bei meinen Mainboard ein BIOS Downgrade machen. Dann ging es wieder ohne WEHA.

Genauer gesagt von AGESA ComboV2 1.2.0.4 A ( Beta Bios) AGESA ComboV2 1.2.0.3 B .
Hatt das Mainboard gewechselt und plötzlich WEHAs.

Jetzt kann ich sogar echte t1 laufen lassen ohne GDM.
 
Zuletzt bearbeitet:
Sollte es auch ohne XMP zu Whea Fehlern kommen, ist es wahrscheinleich ein RMA Fall. Man könnte aber über die Ereignisanzeige herausfinden, welcher Kern den Whea ausgelöst hat und diesen dann über den Curvoptimizer etwas hochziehen. Wäre aber nur ein Pflaster.
Bin aus dem Alter raus, bei dem ich irgendwas optimieren will und schon gar nicht optimieren muss, nur damit das System überhaupt stabil läuft.

Was ich noch vergessen habe......
Mir ist erst später aufgefallen, dass meine RAM nicht offiziell von MSI unterstützt werden.

Ich habe die BL2K16G36C16U4W und die tauchen leider nicht in der Liste auf

Vielleicht liegt es am Riegel?

Wie hast du verifiziert, dass es ein Whea Fehler ist?
Ich hatte gestern bei D2R plötzlich den BSOD mit WHEA_UNCORRECTALBE_ERROR.
Danach startet der Rechner neu und die BIOS Meldung kam.
Ich werde mal nach Arbeit ins Eventlog schauen.

Du könntest noch gucken, ob du die Aktuelle Bios Version draufhast. Wenn nicht, dann mal aufspielen und so probieren. Wenn das auch nicht hilft, mal ohne XMP Profile probieren. DDR4-3600 wäre ja auch schon OC. Und wenn es dann immer noch nicht geht, würde ich wohl einfach die CPU bei AMD tauschen lassen.
Ich habe jetzt nicht das allerneuste BIOS aber seitdem der Rechner früher ein paar mal mit der BIOS Meldung neustartete, hab ich ein Update gemacht.
Ich werde heute oder morgen aber auf die neuste Version updaten.
Beitrag automatisch zusammengeführt:

90°C mit einem NH-D15 find ich zu viel 😬

Joa, das nervt mich auch noch nebenbei.

Ich hatte mir zuletzt ein Meshify 2 Compact gekauft.
Hier kann ich leider nur einen Lüfter vom NH-D15 nutzen, da einer durch die RAM Riegel zu hoch sitzt und ich dann die Seitenwand nicht mehr schließen kann.
Das sollte aber kein Problem sein, da er nach meinen Recherchen dann gleich wie der NH-D15S arbeitet (Selbst mit 2 Lüftern war die Temp nicht viel besser).

Das oben genannte Problem trat auch mit 2 verbauten CPU Lüftern auf.

Ich müsste auch noch die Lüfterkurve optimieren. Die drehen bei vielen Spielen immer hoch und runter.
Hach, mit Intel lief alles geschmeidig und leise.
 
Zuletzt bearbeitet:
Ich hab bei meinem 5900X mit einem Asus X570 Dark Hero (zuvor MSI X570 Unify) keine Chance mit FCLK 1900. Ram ist ein RipjawsV 3600 CL14 (2x16GB) B-Die. Mit Karhu und Prime95 bekomme ich, wenn auch wenig, WHEAs. Beim Zocken dann zum Teil auch. Mit FCLK 1866 und Ram 3733 bekomme ich mit Karhu und Prime95 keine WHEAs. Jedoch beim Zocken hatte ich die letzten Male einen WHEA über eine Zeitdauer von 1-3 Stunden. Ich kann mir nicht vorstellen, dass es am Board oder Ram liegt, XMP läuft. Zumal es sich beim MSI vorher identisch verhalten hat wie jetzt mit dem Asus. Sind immer WHEA 19, also Hinweis auf Ram, VDDG ist aber schon genügend hoch getestet worden. Höher als 1.06V muss ich mir auch nicht antun für FCLK1900 und Ram 3800. Bei den Tests mit 3800 hatte ich mich bei den VDDGs im Rahme von 0.95 bis 1.05 bewegt. Interessant ist, dass ich in den tiefen Regionen klar relativ schnell WHEAs bekomme. Im Bereich 1.00 und 1.05 ist aber überhaupt kein Muster erkennbar. Mal läufts mit tieferen 1.00V länger ohne WHEA, mal bei 1.05V und umgekehrt. Also überhaupt nicht nachvollziehbar. SoC bin ich auch bis 1.15V, mehr muss da für meinen Geschmack bei FCLK1900 auch nicht sein.
Grundsätzlich gehe ich aber davon aus, dass viele bei FCLK 1900+ WHEAs haben, es sich aber nicht bewusst sind. Trotz der WHEAs hatte ich nie einen Absturz bei den mit 1866 ausgeloteten Settings (selbst nicht bei den mit 1900 ausgeloteten Settings wo ich mit Karhu nur noch ganz wenig WHEAs hatte über Stunden hinweg). Ausser bei der BF2042 Beta, dürfte aber ein anderes Problem gewesen sein.

Betreffend CPU Temp wäre noch wichtig von welcher Temperatur geredet wird. Mein MSI hat, so wie ich es in Erinnerung habe nur eine ausgespuckt. Das Dark Hero liefert CPU, CPU Package und CPU Diode, wobei Package und Diode ziemlich identisch sind. CPU aber unter Last gut 10°C kühler, im Idle ca. 3-5°C. Witzig ist aber, dass die die Fan-Settings im Bios auf die CPU geht, also die einiges kühlere Temperatur gegenüber CPU Diode. Irgendwie ein Witz.
 
Zuletzt bearbeitet:
Bin aus dem Alter raus, bei dem ich irgendwas optimieren will und schon gar nicht optimieren muss, nur damit das System überhaupt stabil läuft.
nachvollziehbar
Was ich noch vergessen habe......
Mir ist erst später aufgefallen, dass meine RAM nicht offiziell von MSI unterstützt werden.
ist wahrscheinlich irrelevant, da diese Liste immer eine (alte) Momentaufnahme ist und einfach nicht alle Kits getestet werden.
Ich werde mal nach Arbeit ins Eventlog schauen.
im Windows Suchfeld „Ereignisanzeige“ eingeben und dann bei Fehler und Warnungen nach Whea ID18 und ID19 Ausschau halten.
Ich werde heute oder morgen aber auf die neuste Version updaten.
wenn dann unter Stock (PBO disabled, kein RAM OC) immer noch Wheas kommen würd ich dann auch nicht mehr lange rumprobieren und die CPU Reklamieren
Ich müsste auch noch die Lüfterkurve optimieren. Die drehen bei vielen Spielen immer hoch und runter.
ja, lässt sich so gut regeln, dann gibts kein geheule mehr. Mit den passenden FFTs bei Prime bekommst du jede CPU mit fetter Kühlung an die Temperaturgrenze. Wichtiger ist, wie es im Alltagsbetrieb aussieht. Einfach mit Hwinfo64 monitoren.

Ich bekomme meinen 5800X mit dem NH-D15 in Prime auch bis an die 90 Grad. Bei längeren Zockereinheiten, wo die GPU das System ordentlich mit aufheizt sind es dann im Schnitt um 65 Grad mit Spitzen auf 80 Grad.
 
90°C mit einem NH-D15 find ich zu viel 😬
Zen 3 ist so ausgelegt, dass er Strom gibt bis er ins Temperaturlimit läuft. 90°C sind da total normal.
Außerdem weiß man ja nicht wie der Airflow im Gehäuse ist bzw. mit welcher Drehzahl die Lüfter des CPU-Kühlers laufen.
 
wenn dann unter Stock (PBO disabled, kein RAM OC) immer noch Wheas kommen würd ich dann auch nicht mehr lange rumprobieren und die CPU Reklamieren
Das werde ich so machen... Problem ist halt, dass ich das Problem nicht triggern kann.


Ich würde die CPU dann direkt bei AMD reklamieren wollen.
Wie läuft das da ab?
Schicke ich meine jetzige ein und warte gefühlte 4 Wochen oder bekomme ich vorab eine neue?
Oder lieber direkt über den Händler (hatte meine im Dezember 2020 bei Alza gekauft)

Wollen die irgendwelche logs haben oder reicht denen die Info WHEA?
 
Hab vorhin ein bios update auf die neuste Version gemacht (7C91vA84(Beta version)).
Danach noch XMP Profil 1 geladen und PBO deaktiviert.

Anschließend noch den aktuellsten Chipsatz Treiber direkt von der AMD Seite bezogen und installiert.

Ergebnis:
45min D2R und BSOD (WHEA) inkl CPU overheating alert danach. Beim Hochfahren direkt wieder BSOD. beim 2ten versuch kam er dann wieder.

Es hat sich also eher verschlimmert.

Habe gerade eben bei alza nen Ticket aufgemacht. Die wollen die CPU mit Problembeschreibung eingeschickt haben (automatisierte Mail). Ich glaube da warte ich im Endeffekt länger als wenn ich den amd weg gehe.

Jemand Erfahrungen mit RMA bei alza?


Werde jetzt mal bios defaults laden und testen. Mal gucken was passiert.


Edit: gleiches Verhalten mit default Settings nach wieder ca. 45minuten

Ich hab 2 Monitore und spiele D2R im Window Mode. Ich springe mit dem Mauszeiger VOM
Spiel auf den 2ten Monitor (ins Browserfenster und klicke einen link an. Genau in dem Moment BSOD.
 
Zuletzt bearbeitet:
Wenn der WHEA Fehler auch mit default Ram Settings kommt, würde ich die CPU einfach bei AMD tauschen lassen. Wenngleich du vermutlich auch noch ein zweites Problem zu haben scheinst. Die Overheat Meldung der CPU sollte normal ja auch nicht auftauchen. Hatte hier eine Zeitlang den NH-D15 mit meinem Ryzen 3900x benutzt und kam da auf ~88 Grad max. Fehlermeldungen wegen der Temp bekam ich allerdings nie. Vielleicht auch eine Mainboard Eigenheit bei dir? Schon mal geguckt, ob du die kritische CPU Temp im Bios einstellen kannst?
 
Ich hab gestern mal weiter getestet.

XMP Profil 1 an
CPB aus
PBO aus

Die Temperatur der CPU war während des Spielens bei 63 grad und alles war auch schön leise. 1-2x stieg sie ganz kurz auf 83+ Und die Lüfter heulten auf.

So rennt die CPU zwar nur mit maximal 3,8 GHz aber es scheint damit stabil zu laufen. Werde heute oder morgen Abend nochmal ne Runde spielen und weiter berichten wie es damit läuft.
Vielleicht sollte ich doch zuerst mal WLP erneuern.


@*********
Hab noch nicht weiter im Bios nachgeschaut.
 
Zuletzt bearbeitet:
Warum cpb aus?
 
So rennt die CPU zwar nur mit maximal 3,8 GHz aber es scheint damit stabil zu laufen
das ist auch nicht verwunderlich. Whea Problematik ist fast immer bei Lastwechseln und SingleCore Boosts... Deswegen schmiert einem die Kiste auch nicht ab, wenn man CineBench im Dauerloop laufen lässt.
 
@schoeller

Lad dir doch mal bitte ZenTimings runter und mach einen Screenshot davon. Es ist zwar sehr oft die CPU, die faxen macht, aber eben nicht immer. Manchmal sind auch total bescheuerte SoC Spannungen eingestellt - auch unter stocksettings.
Ne Temperaturangabe der CPU im Idle wäre auch hilfreich.
 
@schoeller

Lad dir doch mal bitte ZenTimings runter und mach einen Screenshot davon. Es ist zwar sehr oft die CPU, die faxen macht, aber eben nicht immer. Manchmal sind auch total bescheuerte SoC Spannungen eingestellt - auch unter stocksettings.
Ne Temperaturangabe der CPU im Idle wäre auch hilfreich.
Liefere ich nach. Kann aber trotzdem nicht sein, dass Stocksettings Probleme machen. Ich habe damals bei der Installation des Systems nur das XMP Profil aktiviert, mehr nicht.
Willst du die Tempangabe mit Default Settings? also CPB und PBO auf Auto oder so wie es jetzt stabil läuft?

Hatte gestern noch einmal eine Runde D2R mit CPB und PBO off gespielt und lies es dann auch mal im Hintergrund laufen, während ich im Browser was gesucht habe.
Gab keinerlei Probleme.

Habe auch in anderen Foren Leute gefunden, die nur mit CPB off ein stabiles System bekommen.
 
Kann aber trotzdem nicht sein, dass Stocksettings Probleme machen.
Es "darf" nicht sein, aber leider ist das nicht immer der Fall und da muss auch nicht die CPU dran schuld sein. Manche Boards legen ab Werk einfach zu hohe/zu niedrige Spannungen an, die dann zu Problemen führen. Auch ist nach jedem Bios Update und anschließendem CMOS Reset alles auf stock, kann in vielen Setups aber auch Probleme machen.

Ich habe damals bei der Installation des Systems nur das XMP Profil aktiviert, mehr nicht.
XMP = Overclock ungleich Stocksettings. Mit Aktivieren von XMP werden nicht nur die Parameter der RAM Riegel verändert, sondern auch Spannungen im IO-Die der CPU. Den Betrag dieser Werte legt der Boardhersteller fest, sodass z.b. XMP1 bei Asus Board xy nicht das gleiche ist wie XMP2 bei Gigabyte Board xy, trotz den gleichen Riegeln und gleicher CPU.

Hatte gestern noch einmal eine Runde D2R mit CPB und PBO off gespielt und lies es dann auch mal im Hintergrund laufen, während ich im Browser was gesucht habe.
Gab keinerlei Probleme.

Habe auch in anderen Foren Leute gefunden, die nur mit CPB off ein stabiles System bekommen.

Mit CPB Off betreibst du die CPU durchgehend mit gezogener Handbremse. wie @gimme7 schon erwähnt hat, sperrst du damit den Boosttakt, sodass die CPU fest in ihrem Basistakt verharrt. Das führt natürlich auch zu geringeren Temperaturen und Temperaturschwankungen.

Wir wissen momentan ja nicht genau, welches Szenario bei dir zutreffend ist, was die spontanen Reboots angehen. Die klassischen Fälle sind die Reboots bei absoluten stocksettings sein Vater oder die Reboots wegen RAM OC und falschen Spannungen.
Bei dir kommt allerdings noch die CPU Temperaturgeschichte mit ins Spiel und wir wollen einfach wissen, ob dein System vielleicht aufgrund von Temperaturproblemen neustartet. Dass dabei ein WHEA Error kommt ist auch völlig normal, weil es ein "Hardware Event" ist, dass Windows nicht selbst verursacht/veranlasst hat, sondern die Firmware des Boards.

Daher wäre zunächst interessant:
- wie sind die CPU Temperaturen im idle ? (mal 15 Min. das System einfach im Desktop lassen)
- wie sind die CPU Temperaturen unter Last ? (z.B. in dem Spiel, bei dem es abstürzt)
- GPU und Chipset Temperatur wären auch interessant

CPB bitte an, PBO auf off und XMP auf aktiviert stellen, damit wir deinen ursprünglichen Zustand erreichen.
Genau in dem Zustand bitte auch den Screenshot von ZenTimings.

Gruß
 
Zuletzt bearbeitet:
Mit CPB off wird der Prozessor zwar ne lahme Ente, aber auch mit dieser Einstellung kommt es zu WHEA Error.
Daher möchte AMD auch, dass man all die schönen Einstellungen deaktiviert für den Test.
Das schöne ist, tauchen die Fehler dann auf bekommt man auch ne neue CPU bei denen.
 
@talha777
Ich werde heute oder morgen noch einmal die WLP erneuern und dann die Daten liefern.

@W124
Also bekommt man nur eine neue CPU, wenn der Fehler mit CPB off auftritt?
 
ER=326856]@W124[/USER]
Also bekommt man nur eine neue CPU, wenn der Fehler mit CPB off auftritt?
Ich kann nicht sagen wie strikt AMD die eigenen Anforderungen einfordert.
Ich hab es halt brav so gemacht wie es gefordert wurde und hab nen neuen 5950x bekommen.
Zum Ausloten deren Spielraum war mir der Geldeinsatz zu hoch.

Es hat mich aber auch ziemlich angekotzt den Prozessor derart kastriert laufen zu lassen, der Unterschied ist schon echt gewaltig, auch ohne Benchmarks.
 
@W124
Na wenn ich denen einfach sage, dass es ohne CPB ebenfalls zum BSOD kommt?
Wie wollen se das denn nachweisen oder wollen die irgendwelche logs haben, bevor der RMA durchgeht?

Werde heute die CPU neu mit WLP ausstatten und dann berichte ich.
 
Ich bekam von AMD ne E-Mail, dass sie meine CPU erhalten und auch getestet haben. Darauf hin haben sie mir eine neue geschickt.
Was jetzt bei diesen Tests gemacht wird kann ich aber natürlich nicht sagen.
 
Das die das bis jetzt 1 Jahr nach Release nicht im Griff haben, bzw mal eine Stellung dazu abgeben haben was die Ursache ist, ist schon unfassbar. Für mich heißt das nur ein Riesen Bogen um alle AMD Produkte in Zukunft zu machen, das ist ja auch nicht das einzige Problem was Zen 3 hat.
 
Ich denke so pauschal kann man das ja nicht sagen, wenn man sich die Umfrage hier im Forum anschaut

 
Ich hab selber seit letzten Jahr ein 5900x und keine Probleme mit dem was WHEA angeht, allerdings ist mir das einfach zu heiß in Zukunft kein AMD mehr.

Wenn man mal Googelt das Internet ist voll davon, vor allem Reddit.
Beitrag automatisch zusammengeführt:

Ich denke so pauschal kann man das ja nicht sagen, wenn man sich die Umfrage hier im Forum anschaut
Trotzdem, gibt's keine Stellungnahme von AMD und die Probleme gibts nach wie vor. (n)
 
Für mich heißt das nur ein Riesen Bogen um alle AMD Produkte in Zukunft zu machen, das ist ja auch nicht das einzige Problem was Zen 3 hat.

Ach komm, so schlimm ist das auch nicht, AMD tauscht ja betroffenen CPUs.

AMD unterstützt Ram nur bis 3200mhz offiziell und Weha frei.

-No overclocking No Problems
 
Ach komm, so schlimm ist das auch nicht, AMD tauscht ja betroffenen CPUs.

AMD unterstützt Ram nur bis 3200mhz offiziell und Weha frei.

-No overclocking No Problems

Also ich habe meinen RAM ohne XMP Profil @2666 betrieben und habe trotzdem den Whea BSOD bekommen.

Aktuell fahre ich mit XMP Profil "ON" und CBP "OFF" stabil. Kann aber nicht der Sinn sein CBP ausschalten zu müssen.
 
Ich habe den Fehler zum Glück noch nicht gehabt mit meinem 5900x. Habe ein Asus Tuf x570 Plus und 4X8GB RAM. CPU habe ich per Curve auf Negative 30 gestellt. Bis jetzt noch keinen einzigen reboot gehabt.
 
Alle Cores beim Curve Optimizer auf -30 und er läuft absolut stabil? Dann hast du einen der besten 5900X, die es gibt.
Ich wette beim CoreCycler-"Benchmark" wird er aussteigen ;-)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh