Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

Also auf Amazon hat der Prozessor 1500+, 5 Sterne Bewertung. Falls da wirklich ein Hardware-Bug eingebaut ist vermute ich den eher in den früheren Produktionswochen :unsure:
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Einer der Gründe warum ich einem Kumpel einen Rechner zusammengestellt habe ohne PCIE4.0 / 500er Chipsatz und neuer CPU, mal von der Verfügbarkeit abgesehen wollte ich ihm diese Tortur ersparen.
Auch wenn es kein Problem ist die CPU zu tauschen oder zu wechseln und alles über Garantie abgedeckt ist, aber der Rattenschwanz dahinter wenn man kein Ersatz System hat ist einfach nur lästig.
 
Falls da wirklich ein Hardware-Bug eingebaut ist vermute ich den eher in den früheren Produktionswochen :unsure:
5800X am Release Tag gekauft. Produktion KW41. Also einer der ersten. Null Probleme. Ram Stabil mit 1900 FCLK. Also anhand der Produktionswoche würde ich da jetzt nicht voreilige Schlüsse ziehen.
Vielleicht sind es auch häufiger die CPUs die Probleme machen, die vom Rand des Wafers kommen. Tausend Möglichkeiten...
 
Ja, ist letztendlich auch so, aber ich kann das schon nachvollziehen. Mein 5800X ist auch schon getauscht, der neue aus der selben Fertigungswoche läuft ohne Probleme wie er soll, lässt ordentliches RAM OC oder IF OC zu und spuckt keine WHEAs aus, trotz SAM und was noch so alles auf Fehler schließen lässt. Eine ganz normale CPU eben.
Ich hatte aber beim Erhalt auch so meine Bedenken, weil selbe und recht frühe Fertigungswoche (KW48), man spinnt sich halt was zusammen, wenn man verzweifelt :-)
 
Ich hatte nun drei echt gute Tage bei mir ohne Probleme aber gestern Abend und heute morgen hat er mir jeweils nachm Kaltstart ein paar reingewürgt und auch nachdem ich länger gespielt hatte und das Spiel beendet habe.

Ich denke einfach, dass ich nicht mehr um die RMA drumrum komm, vor allem da quasi alles andere schon ausgeschlossen wurden :censored:
 
Nachdem ich heute mal wieder ein Bios Update gemacht habe nach Wochen setze ich mich wieder mit der WHEA Problematik auseinander. Hab meinen 5900x und ein GB x570 master Anfang Dezember erworben und bin auch von den WHEA betroffen. War bislang war ich eher im Tweaktown beta bios chat unterwegs und hab eher zufällig heute den Tread hier entdeckt. Bin ehrlich gesagt doch erstaunt das hier eher der Tonus herscht das es ein CPU defekt ist. Verwundert mich insofern als das alles was ich bisher gefunden habe eher Richtung MB und Bios zeigt.
Bei mir macht die Bios Version einen großen Unterschied, ich bekomme allerdings auch nur WHEA beim Gaming, Idle oder Benchmarks kann ich unendlich lange betreiben da passiert nichts. Als ich dann mal tiefer reingeschaut habe ist es z.B. beim Master so, dass PBO in default auf auto steht. Sobald PBO off ist oder ich fixen vcore und man. OC betreibe habe ich auch keine WHEAs mehr, was für mich stark nach schlechter Vcore Regulation im Bios aussieht wenn die CPUs hoch und runter takten bzw. halt noch nicht ganz ausgereiftem PBO. Dies sieht für mich eher nach einer MB als nach einer CPU Problematik aus, zumindest in meinem Fall, da alle WHEA Betroffenen natürlich nicht das gleiche Problem haben müssen. Ich hoffe jetzt das die nächsten Bios Versionen das wirklich fixen können!
 
ich bekomme allerdings auch nur WHEA beim Gaming, Idle oder Benchmarks kann ich unendlich lange betreiben da passiert nichts.
Der Großteil der Leute bekommen hier ihre Reboots im Idle und die Tatsache, dass in vielen Fällen eine neue CPU/andere Batch geholfen hat spricht schon sehr für ein CPU Problem.
Vor allem da alle CPUs hier von AMD anstandslos und sehr zügig getauscht wurden - die werden das nicht machen wenn sie nicht müssten bzw die CPUs in Ordnung wären nehme ich mal an.
 
Die Wahrscheinlichkeit ist wohl gegeben das TSMCs 7nm Yields besser sind als Intels 10nm, die aber werden ähnliche Probleme haben auch wenn sie etwas geringer ausfallen mögen. Ich gehe davon aus die CPUs werden nicht alle vollständig auf Stabilität bei jedem Print getestet sondern nur Stichproben haltig und 9/10 CPUs in ein gewissen Korridor laufen ..Volt >...>..Volt und das über das Bios / AGESA vorgegeben ist, kann das wohl passieren wenn einige Chips gerade knapp am Rande der Spezifikationen noch laufen und alle anderen bereits im standardbetrieb abschmieren.

Das würde wohl erklären warum bei manchen noch mit manuellem eingriff das Ding stabilisiert werden kann, während bei anderen die Werte zu schlecht sind???
 
@Bobby53
Ja wie gesagt für mich sah es halt bisher mehr nach dem Board aus, inzwischen bin ich mir da doch nicht mehr so sicher. Hab heute auch den nen crash gehabt mit PBO of, aber ohne fixen vcore. Sprich es ist wirklich nur stable wenn ich nen fixen vcore einstelle. Ich bin jetzt auch am überlegen ob ich nicht eine RMA vornehme, eigentlich hab ich keine Lust bei so einer teuren CPU Jahrelang mit einer defekten leben zu müssen. Habt ihr alle direkt bei AMD die RMA vorgenommen oder über den Händler?
 
Ich über Händler weil Tray Version.
AMD macht keinen Austausch bei TrayVersionen.
 
Mein KW47 5800x ist heute angekommen. Ich werde berichten. Wo sehe ich überhaupt WHEA Fehler?
 
Windows Ereignis Anzeige.... Windows Protokolle ---> System. da stehen sie drin. Oder einfacher mit HWInfo. in Der Sensorübersicht stehen die ganz unten drin. Dort schaue ich immer nach, ist einfacher.
 
@-->Andy<--
wenn die Whea Fehler nicht von zuviel OC bzw falschen OC Einstellungen kommen, dann merkst du sei eigentlich recht deutlich das sie fast immer auch mit einem plötzlichen und unerwarteten Reboot einhergehen...

ich hoffe aber mal das du gar nichts davon merkst und einfach nicht betroffen bist :)
 
Jetzt reihe ich mich hier mal ein. Ich hatte den typischen WHEA-Fehler zum ersten Mal vor 9 Tagen mit einem neuen 5950x auf MSI Meg X570 Unify mit G.Skill FlareX 3200 CL14.
.
Nachdem ich nach dem ersten Crash diesen Thread und den bei Igor gefunden habe, fing ich schon an mir Sorgen zu machen. Also habe ich letzte Woche erstmal so einige Tests gemacht. Rechner lief zuerst 5 Tage durch, meist im Idle, in den Tagen zwischendurch dann auch CB 20 und Prime über Stunden laufen lassen und am Wochenende auch ein bisschen gezockt. Dabei war die ganze Zeit im Bios PBO auf Auto aktiviert. 9 Tage lang kein einziger Absturz. Hatte das ganze am Wochenende schon mehr oder weniger abgehakt und als Einzelfall eingeordnet.

Dann plötzlich heute Nachmittag beim einfachen Schreiben in Word schwarzer Bildschirm und Reboot mit WHEA-Fehler Cache Hierarchy Error.
Natürlich heute, nachdem gestern die Widerrufsfrist abgelaufen ist. Logisch...

Unter dem Eindruck der Meldungen im Netz frage ich mich jetzt natürlich auch, ob das auf ein Hardwareproblem deutet. Oder ob ich mir da nicht zu viel Sorgen mache, denn bei vielen scheinen diese Probleme und Abstürze ja wohl deutlich häufiger vorzukommen als meine zwei kleinen Aussetzer in mehr als einer Woche, sondern mehrmals täglich oder sogar ständig. Trotzdem werde ich das ungute Gefühl nicht los... ;.) Bei so einer teuren CPU will ich da auch kein Risiko eingehen.

Wüsste aber auch nicht, wie ich das reproduzieren könnte. Na ja, ich werde also weiter schauen, bin aber gerade komplett im Dunkeln, wie sich das reproduzieren lässt. CPU-Last (dauerhaft) war die letzte Woche kein Problem, auch Idle bis heute nicht. Ich stehe im Moment auf dem Schlauch.
 
Habe mal geschaut, ob solche unerklärlichen Abstürze bei den 5000er auch unter Linux auftreten, aber irgendwie bisher nichts gefunden. Installationsprobleme mit Distributionen lasse ich mal außen vor, da die wenigsten Live-Medien bisher mit einem aktuellen Kernel daherkommen.
unter Linux gab es bei mir egal mit welchem Setting keine Abstürze.
Ich halte die WHEA Fehler zu 99,9% für Benutzerfehler instabiles OC etc pp, deswegen gibt es auch kein offizilles Feedback von den Unternehmen bis jetzt!
Mit Stock BIOS Einstellungen und empfohlenem RAM tauchen solche WHEA Fehler über mehrere BIOS-Versionen bis zu AGESA Version 1.2.0.0 bei mir auf. Habe die letzten BIOS-Versionen die Tage auf einem ASUS ROG STRIX B550-F Gaming testweise durchprobiert - ohne Erfolg.
selbst für -10 Allcore braucht es schon eine sehr gute Cpu sonst packen die das nicht ...
habe meinen 5950x testweise mit -30 am laufen gehabt (dazu musste die CPU-Spannung angehoben werden). Der schlechteste Kern schaffte mit diesem Setting SC 4,79 GHz.
Diese CPU schafft den beworbenen maximalen Boost von 4,9 GHz (SC, Stock) auf nur 3 von 16 Kernen, die anderen liegen alle bis min 4,61 GHz darunter.
Bei CO -15 sind 4,4 GHz MC mit EDC 180A und 89°C möglich. IF2000 war mit dieser CPU von Anfang an nur mit anheben der SOC Spannung möglich.

Die Qualität der CPU ist meiner Meinung nach besser wenn die viele Kerne SC 4,9-5,05 GHz schaffen und FCLK 2000 ohne anheben von Spannungen möglich ist.

Die Reboot Fehler in Windows 10 habe ich bisher gar nicht realisiert, weil hauptsächlich Linux auf der Kiste läuft. Windows nutze ich nur zum zocken.
Es ist durch Zufall am WE aufgefallen während der PBO / RAM Optimierung. Durch die Ereignisanzeige habe ich festgestellt, dass diese Reboots auch vorher ohne PBO mit verschiedensten Einstellungen stattgefunden haben.

Lange Rede kurzer Sinn, deswegen habe ich heute den Händler meines Vertrauens angerufen und bekomme am Samstag einen neuen :)

Grüße
 
Zuletzt bearbeitet:
Ich reihe mich ebenfalls ein. Ebenfalls WHEA Fehler mit anschließendem Reboot als auch Reboots unter Linux. 5950x und ein GB x570 Aorus Master. Alles auf Default im Bios und die Reboots meist im Idle.
Board und RAM hatten mit einem 3700x keine Probleme.

Habe am Sonntag ein RMA direkt bei AMD gestellt. Bisher keine Reaktion. Ist das normal?
 
Dauert 2-3 Tage bis die sich melden.....
 
Das ist kein Zustand! Der PC stürzt immer wieder ab. Jetzt habe ich versucht den Karhu Ramtester laufen zu lassen aber da friert er besonders gerne ein. Zudem habe ich das Problem das der PC beim booten 5x peepst. Nix auf Dauer!
Ich habe jetzt auch einen Garantieantrag bei AMD gestellt. Ich bin gespannt!
 
Ich hab mal Spaßeshalber im Curve Optimizer All Core positive 5 eingestellt vor einigen Tagen.
Seitdem keine Errors oder Reboots mehr :fresse:
 
1,5 Tage mit verschieden Workloads: Battlefield 5, Arbeiten, Nachts im idle läuft bisher unauffällig, also ohne Reboots oder WHEAs.

Alles Stock mit XMP2.0 3200 CL16 auf einem X470 MSI Carbon Gaming also 1.1.0D AGES.

Was mir aufgefallen ist:
  • Am USB 2.0 Port setzt die Tastatur immer wieder aus und die Beleuchtung blinkt. Am USB 3.0 Port habe ich keine Auffälligkeiten.
  • Das Bios scheint verbuggt zu sein ein wechsel von ECO Mode zu Disable hebt den ECO Mode nicht auf
  • All Core Minus offset disabled anscheint die gesamte vCore Skalierung
  • Arbeitspeicher lässt sich kein Stück übertakten
 
Ich hab mal Spaßeshalber im Curve Optimizer All Core positive 5 eingestellt vor einigen Tagen.
Seitdem keine Errors oder Reboots mehr :fresse:
Genau das hatte bei meinem ersten 5800X auch die WHEAs beseitigt.
Die Erkenntnis war, dass nicht alle CPUs ordnungsgemäß laufen, vermutlich weil die sehr niedrigen IDLE Spannungen nicht passen und die CPU somit Fehler ausspuckt oder sogar abstürzt.
Also schon eine Art "Defekt".
 
Ich habe mir jetzt einen 3600 bestellt die am Samstag kommen soll. Ich werde die dann umbauen und schauen was jetzt mit dem 5900 passiert.
Mit der 3600 kann ich auch schauen ob da auch irgendwelche Probleme auftauchen...

Ich habe die Schnauze voll. Keinen Tag länger mit diesen Abstürzen!
 
Leider gibt es hier überhaupt keine Einträge bei den Reboots. Im Idle hat er aber ab und zu per Machine check events (mce) L3M Data ECC Error im L3 Cache protokolliert.
Habe mit IF2000 ohne PBO denke ich schon > 5d utime gehabt (99%idle). ECC habe ich nicht, schade dass es keine Fehlermeldung gibt :(
Code:
Memory:    RAM: total: 31.26 GiB used: 2.48 GiB (7.9%)
           Array-1: capacity: 128 GiB slots: 4 EC: None max module size: 32 GiB note: est.
           Device-1: DIMM_A1 size: 8 GiB speed: 4000 MT/s type: DDR4 manufacturer: G-Skill part-no: F4-4000C18-8GTZKW
           Device-2: DIMM_A2 size: 8 GiB speed: 4000 MT/s type: DDR4 manufacturer: G-Skill part-no: F4-4000C18-8GTZKW
           Device-3: DIMM_B1 size: 8 GiB speed: 4000 MT/s type: DDR4 manufacturer: G-Skill part-no: F4-4000C18-8GTZKW
           Device-4: DIMM_B2 size: 8 GiB speed: 4000 MT/s type: DDR4 manufacturer: G-Skill part-no: F4-4000C18-8GTZKW
CPU:       Info: 16-Core model: AMD Ryzen 9 5950X bits: 64 type: MT MCP arch: Zen 3 L1 cache: 1000 KiB L2 cache: 8192 KiB
           L3 cache: 62.5 MiB
           flags: avx avx2 lm nx pae sse sse2 sse3 sse4_1 sse4_2 sse4a ssse3 svm bogomips: 217665
           Speed: 3599 MHz min/max: 2200/3400 MHz boost: enabled Core speeds (MHz): 1: 2683 2: 2875 3: 2875 4: 2879 5: 2879
           6: 2877 7: 2876 8: 2878 9: 3028 10: 2672 11: 2870 12: 2861 13: 2877 14: 2861 15: 2873 16: 2852 17: 2871 18: 3660
           19: 2951 20: 3484 21: 3457 22: 2917 23: 2897 24: 2873 25: 3266 26: 2915 27: 2875 28: 2477 29: 2471 30: 2487
           31: 3600 32: 2878
Info:      Processes: 557 Uptime: 1d 6h 59m Init: systemd v: 247 Compilers: gcc: 10.2.0 Packages: pacman: 946 Shell: Bash
           v: 5.1.4 running in: xfce4-terminal inxi: 3.1.09
Hier mal die Ereignisanzeige die ich so sträflich vernachlässigt habe. Es sind viele Tests dabei - Allerdings keine 80 in 7T behaupte ich mal:)
Ereignisanzeige.png

Im besten Fall spinnen doch noch irgendwelche Windows-Treiber. Ich finde es seltsam, dass dieses Problem noch nicht in der Fachpresse thematisiert wurde.

Grüße
 
Zuletzt bearbeitet:
Ja wundert mich auch das Linux (in dem Fall Arch Linux mit 5.10 Kernel) keine gescheiten Log Einträge mehr protokoliert und Windows das mit dem WHEA-Logger noch hinbekommt bevor der Reset kommt.

Leider habe ich immer noch keine Rückmeldung meines RMA Request. Hat AMD soviel zu tun? Bitte hört auf eure Ryzen zu reklamieren! ;-)
 
Ok, ich habe eine neue CPU von einem lokalen Geschäft bekommen, weil OEM, gleiche Charge wie zuvor (bg 2044sus). Leider ist dieser Prozessor noch schlechter als zuvor (alle Einstellungen sind auf Lager). Bsod (whea uncorrectable error) und harter Neustart ohne bsod im Standby. Ich kann 100% mit dem Boot Tester reproduzieren, jedes Mal, wenn ich bsod und einen harten Neustart auf 12 Kernen bekomme. Ich kann den Boost Tester mit LLC1 (LLC2 bsod) und curve optimizer auf 12 Kernen +2 (+1 bsod) bestehen. Ich bestelle eine neue CPU in einem anderen Geschäft. Ich denke das ist eine fehlerhafte Charge = (
Ich kann nicht mit dem neuesten BIOS testen, da mein B550 Taichi nur BIOS 1.70 mit Agea 1.1.0.0 D-Patch hat.
Entschuldigung für die Sprache, verwendet Google Übersetzer
 
Zuletzt bearbeitet:
Mich hat es auch erwischt. Wird neue Hardware jetzt zum Lottospiel oder wie?
Mein kleiner 5600x lief ca. 1 Monat ohne BS, freez etc. seit gestern ist eine 6800 dazugekommen und WHEA Logger ID 18 lässt grüßen. PC friert für 10-15 Sek. ein und startet einfach neu. Vorhin Bios update gemacht, leider keine Änderung. Bis jetzt kam das 6 Mal vor, immer im idle.
 
Ich hab mal Spaßeshalber im Curve Optimizer All Core positive 5 eingestellt vor einigen Tagen.
Seitdem keine Errors oder Reboots mehr :fresse:
1611773784726.png


210127-CO-PBO-+5.png

Bringt nix bei mir. Mit PBO CO+5 7% weniger MC Leistung und 16 WHEA Warnungen innerhalb von 10 min :)
 
Zuletzt bearbeitet:
Mich hat es auch erwischt. Wird neue Hardware jetzt zum Lottospiel oder wie?
Mein kleiner 5600x lief ca. 1 Monat ohne BS, freez etc. seit gestern ist eine 6800 dazugekommen und WHEA Logger ID 18 lässt grüßen. PC friert für 10-15 Sek. ein und startet einfach neu. Vorhin Bios update gemacht, leider keine Änderung. Bis jetzt kam das 6 Mal vor, immer im idle.
Liegt es dann nicht eher an der 6800?
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh