Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

Windows 10 Pro und gemeldet wird ein cache Fehler durch die cpu (hat fdsonne in einem der Beiträge hier auch noch wesentlich detailierter auseinandergenommen die Fehlermeldung die ich erhalte

cmos reset min. 15 mal gemacht - sogar stromlos und 30 minuten Batterie raus - danach immer optimized defaults zusätzlich dann noch alle OC Automatiken von Amd abgeschaltet (Pbo, Fmax, Core Optimizer usw.

hat aber alles nichts gebracht und steht so auch über die Beiträge hier verteilt... Die Wahrscheinlichkeit das die Cpu einen weg hat liegt bei 99% (eigentlich 100%) und es geht aktuell eigentlich nur darum wies nun am besten weitergeht, das wird sich aber in den nächsten 1-2 Tagen klären, sonst muß ich wohl beim Händler mal den Nachfragedruck etwas erhöhen. Die erste Antwort vom Händler kam schnell und das sogar an einem Sonntag Abend (war aber eher nur die Standard Floskel mit wir brauchen ein Bild der Pins :d ), aber nun tut sich zumindest heute scheinbar schon mal nichts mehr...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Windows 10 Pro und gemeldet wird ein cache Fehler durch die cpu (hat fdsonne in einem der Beiträge hier auch noch wesentlich detailierter auseinandergenommen die Fehlermeldung die ich erhalte

cmos reset min. 15 mal gemacht - sogar stromlos und 30 minuten Batterie raus - danach immer optimized defaults zusätzlich dann noch alle OC Automatiken von Amd abgeschaltet (Pbo, Fmax, Core Optimizer usw.

hat aber alles nichts gebracht und steht so auch über die Beiträge hier verteilt... Die Wahrscheinlichkeit das die Cpu einen weg hat liegt bei 99% (eigentlich 100%) und es geht aktuell eigentlich nur darum wies nun am besten weitergeht, das wird sich aber in den nächsten 1-2 Tagen klären, sonst muß ich wohl beim Händler mal den Nachfragedruck etwas erhöhen. Die erste Antwort vom Händler kam schnell und das sogar an einem Sonntag Abend (war aber eher nur die Standard Floskel mit wir brauchen ein Bild der Pins :d ), aber nun tut sich zumindest heute scheinbar schon mal nichts mehr...
Das habe ich soweit mit bekommen, wusste nur nicht sicher welche Version du nutzt.
Mit der Pro Version sollten die Logs nicht Lügen, L2 Cache versaut dir alle Daten wenn er kein BSOD machen würde.
Die Global C-States wären auch mein Vorschlag geweßen, aber das hast du ja schon geprüft und C7 können alle Netzteile von dir?




Da lob ich mir Amazon, beim Abgeben und scannen vom Retoure Paket, wird das Geld zurück Überwiesen.
In der Momentanen Zeit einfach so mal 700€ extra ausgeben damit du eine CPU hast, finde ich auch nicht Toll. :)
 
Das habe ich soweit mit bekommen, wusste nur nicht sicher welche Version du nutzt.
Mit der Pro Version sollten die Logs nicht Lügen, L2 Cache versaut dir alle Daten wenn er kein BSOD machen würde.
Die Global C-States wären auch mein Vorschlag geweßen, aber das hast du ja schon geprüft und C7 können alle Netzteile von dir?
es gibt auch keinen bsod, er startet einfach neu und das immer nur im Idle, die C-States habe ich getestet und sowohl das Dark Power Pro 11 als auch das Straight Power 11 können mit C7 umgehen...

Da lob ich mir Amazon, beim Abgeben und scannen vom Retoure Paket, wird das Geld zurück Überwiesen.
In der Momentanen Zeit einfach so mal 700€ extra ausgeben damit du eine CPU hast, finde ich auch nicht Toll. :)
wem sagst du das ich, wäre ja sogar bereit ne neuen 5900x zu kaufen, aber da müßte es ja erstmal wieder einen bis maximal 650 Euro irgendwo lieferbar geben :fresse2:
 
2004 läuft bei mir hier Problemlos mit dem C8H und nem 5950X gepaart mit 4x16GB G.Skill Streifen mit B-Dies.
Bitte konkreter werden, sonst hilft das doch nicht wirklich!? Mir wäre auch kein pauschales 2004 läuft nicht mit Zen3 bekannt. Selbst ohne Neuinstallation. Mein OS stammt aus 2014 und ist ursprünglich ein 8.1 installiert auf der alten X99 Plattform von damals. Und wurde dann über mehrere Win10 Versionen hoch gepatcht bist zuletzt 2004.
Ich habe mich nicht speziell auf diesen Typ berufen, sondern generell gab es einige Bugs. Möglicherweise wäre das ja ein neuartiges Symptom.

Ich hab zu dem Problem auf der AMD Seite was gefunden:

Beitrag automatisch zusammengeführt:

Was hast du für ein Board?
Beitrag automatisch zusammengeführt:

Yo @CrispyCrunch I found the solution to my problem. Check it out on my thread, it was some cable extensions I was using, at the end PSU related.

But I wanted to tell you to check out your gpu installation, it might sound dumb but believe me, this might be your problem.

The shield thing they added to the GPU slot is very tricky, not sure your MSI board has it but check this **bleep** out. You might think GPU is properly inserted but many times is not. There is a double lock system on this design and you gotta make sure is actually locked on both ends.
I noticed it because my gtx 1060 worked well but my 2080 didn't. The 2080s has a thicker pcb and it's tricky, you insert the card and the right lock pops/clicks and you think is fine. But on the left there is a 1/20 of an inch left to push in and lock the other bracket. Check the picture and push as you would with a DDR4 stick.

The thick shield thing they added is pretty tricky, will make you think GPU is OK but is not, also check your PSU/Cables. Detailed info on my pos
1607974000016.png


Ich hab keine Ahnung, aber manchmal sind zu lasche kabelverbindungen oder Steckverbindungen crash Risikos.


Bitte nicht bashen, das mag sinlos sein das hier zu posten... aber ein anderer hat vergessen die Folie von seinem Kühlkörper zu entfernen .... und wir haben auch rum geraten...
 
Zuletzt bearbeitet:
Das Board ist ein Asus Crosshair 8 Dark Hero Pcie Steckplatz hab ich natürlich immer nur den ersten getestet, aber ganz am Anfang immer nur mit einer GT710 (die kaum Belastung für den Slot sein sollte) und auch da traten die Fehler schon auf.

aber ich schliesse erstmal gar nichts aus und halte mich keineswegs für unfehlbar :d

allerings kann mir nicht ganz vorstellen das ich nach gut 25 Jahren schrauben im Pc Bereich nicht in der Lage bin meine Grakas ordentlich im PCIE Slot einrasten zu lassen :shot:

zumal ich natürlich auch alle Kabel und Steckverbindungen nachdem die Idle - Reboots nicht aufhörten mal überprüft habe und da keinerlei Abnormalitäten hätte festellen können
 
@n3cron
PCIe Fehler werden mit nem anderen Fehlercode reportet... Ich hab irgendwie das Gefühl gegen die Wand zu reden!? :fresse:
WHEA, das ist die Abkürzung für Windows Hardware Error Architecture. Es bringt einfach nix nach WHEA zu suchen, weil ALLES an Fehlern, was irgendwo noch in der Lage ist, über diesen Mechanismus gereportet zu werden, dort als solche Meldungen auftaucht. Von PCIe Geräten, über Cache, RAM, Memory Controller usw.

Folgende Einträge werden dort beziffert:
  • Processor Generic
  • Processor Specific
  • IPF
  • Platform Memory
  • PCIe
  • Firmware Error Record Reference
  • PCI/PCI-X Bus
  • PCI Component/Device
  • DMAr Generic
  • Intel® VT for Directed I/O specific DMAr section
  • IOMMU specific DMAr section
Im Fall des TEs Fehlers findet sich ein Eintrag für CPU Generic und einer für CPU Specific. BEIDE sprechen von/für einen Cache Fehler. Es wird explizit einer der folgenden, nämlich der Markierte Fehler genannt:
  • 0x00: Unknown
  • 0x01: Cache Error
  • 0x02: TLB Error
  • 0x04: Bus Error
  • 0x08: Micro-Architectural Error
Wie sich das im Detail zusammen setzt: https://www.uefi.org/sites/default/files/resources/UEFI_Spec_2_2_D.pdf
Da stehts drin. Anhang N.
 
Kurze Update - leider habe ich wohl einen Händler erwischt, bei dem Kundenservice nicht sonderlich groß geschrieben wird (war ja klar bei meinem Glück). Auf meine Reklamation am Sonntag hin, habe ich zwar direkt am Sonntag Abend noch eine Mail bekommen, das man sich der Sache annehmen wird und Bilder von den Pins der Cpu braucht.

Soweit sogut am Montag früh gleich die entsprechenden Bilder gemailt und seitdem keinerlei Reaktion mehr. Telefonisch bei 4 Versuchen 3mal Warteschleife und nach 20 Minuten rausgeflogen und 1x direkt Besetzt Zeichen.

Also hab ich nun förmlich per Mail den Widerruf meiner Bestellung erklärt und den Händler um eine entsprechende Kenntnissnahme, sowie der Bekanntgabe der Rücksendeadresse für den Widerruf gebeten (allerdings befürchte ich bei der bisherigen Kommunikationsfreudigkeit wird da wenig kommen und ich werde die Cpu dann wohl spätestens am Montag auf meine Kosten gut versichert und verpackt mit Sendungsverfolgung an die in den AGBs angegebene Adresse schicken)

immerhin habe ich per automatisierter Mail zumindest mal einer Übermittlungsbestätigung und Bearbeitungsnummer für die Widerrufsmail erhalten...

Bei meinem Glück in letzter Zeit wird mich wohl auch das noch einige Zeit beschäftigen bis das alles gekärt ist. :(

Nebenbei warte ich halt nun wieder auf einen 5900X Drop in einem Shop allerdings nach der Erfahrung nur noch Shops die ich schon kenne und weiß das man Kundenservice zumindest vom Namen her kennt, und hoffe das ich diesmal mehr Glück habe...
 
Weiß nicht ob der Händler jetzt noch Widerruf zulassen muss, hast ja immerhin eine defekte CPU gemeldet. Denk der wird eher auf CPU einsenden und weiter an AMD bestehen.
Aber hier gibt es ja Widerruf und Fernabsatzgötter die das bestimmt wissen.
 
Sehe ich auch so.
 
Wenn der Händler sich quer stellt ist es eh besser die CPU direkt über AMD zu tauschen.
Sollte schneller gehen....
 
Wenn Tray dann nichts mit direkt AMD
 
Hab zum Glück die Boxed ;)
 
Die Frage ist aber was ilovebytes hat 😉
 
Ich würde auch erstmal AMD dazu befragen. Die Wahrscheinlichkeit keine 5900x CPU für angemessenes Geld zu bekommen ist groß..
 
Ich wüsste zwar nicht mit welcher Begründung der Händler den Widerruf ablehnen könnte, ausser eine Prüfung auf Funktion habe ich nichts gemacht(und die ist nicht gegeben). Aber ich sehe schon es wäre wohl auch hier besser gewesen nicht mit offenen Karten zu spielen und einfach einen Widerruf ohne Begründung zu machen.


Tja Ehrlichkeit wir scheinbar wirklich bestraft heutzutage... :(
 
Zuletzt bearbeitet:
Habe nur meine Befürchtung mitgeteilt... ob das so zutrifft steht auf einem anderen Blatt.
Den Widerruf hast ja schon geschickt, wirst ja sehen wie er reagiert...
 
kein Ding hab ich auch so verstanden. und ja ich hab sowieso Bammel das das alles glatt läuft weil eben der Händler nicht sonderlich kommunikativ bis jetzt war.

eine Prüfung der Beschaffenheit, Eigenschaften und Funktionsweise wird zudem auch in den Agbs des Händlers eingeräumt, an die und das Gesetz sollte er sich ja eigentlich halten müßen...

aber wie du sagst nun gibt es eh kein Zurück mehr - mal schauen wie es weiter geht.

ich werde auf jeden Fall mal die Cpu selbst, sowie die Verpackung derselben für den Widerruf, mit Zeugen in nem Video festhalten - sicher ist sicher.
 
Zuletzt bearbeitet:
Habe meinen PC auch neu aufgesetzt mit folgenden Komponenten
- 5900x
- Asus B550 Gaming F
- 2TB 970 Evo Plus

Vorher schon gehabt und übernommen:
- Gigabyte 2080 Super
- 16GB G.Skill Trident DDR4-3200 DIMM CL14 Dual Kit
- be quiet Dark Rock 4
- be quiet Dark Power 11mit 750W
- Win 10 Pro (clean install gemacht)

Ich hatte den WHEA Error jetzt immer wenn ich nach dem Zocken zurück in der Lobby des Spiels war (also sozusagen wenn die Last runter gegangen ist). Beim letzten Mal dann reboot und ein paar Minuten später in Windows selber Error mit autom. Reboot. Sonst lief in Windows eigentlich alles stabil (auch PRIME95 getestet). Minidump wird nicht geschrieben.

Error:
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 8

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.



Was empfehlt Ihr mir auszuprobieren? BIOS ist die neueste verfügbare Version (1401). AMD Chipsatztreiber sind die aktuellsten installiert. RAM mit MemTest geprüft. Neuer RAM (G.Skill Trident Z Neo 32GB DDR4 32GTZNC 3600 CL16) ist bestellt um ihn mal zu testen. XMP ist deaktiviert / alles läuft auf Stock.
 
Zuletzt bearbeitet:
Ich würde noch versuchen einen CCX zu deaktivieren. Möglicherweise entsteht der Fehler ja weil der eine CCX auf die selbe Adresse zugreifen will auf die der andere CCX auch zugreift.
 
gute Idee, bei mir waren die Reboots und Fehler weg als ich im Bios ein ccd deaktiviert habe. aber dauerhafte Lösung ist das halt auch keine, sondern nur mal etwas um den Fehler einzugrenzen.

Was mir auffällt du hast auch ein Asus Board, zwar ein B550 aber ich hab bis jetzt auch auf einem Crosshair 8 Dark Hero und einem Crosshair 7 getestet und immer war der Fehler vorhanden. Jetzt wäre die Frage ob es auch Leute mit anderen als Asus Boards betrifft ?

Aber selbst wenn es ein Asus Problem sein sollte bleibt die Frage warum es bei manchen dann trotz Asus Board problemlos funktioniert ?
 
Ich hatte eine MSI Unify wo es war.
 
Ja schau mal bei Asus im Forum, wir sind nicht allein.

Wie deaktiviere ich einen CCX? RAM Frequenz setze ich jetzt mal auf 1900MHz.

2012171.jpg
 
gute Idee, bei mir waren die Reboots und Fehler weg als ich im Bios ein ccd deaktiviert habe. aber dauerhafte Lösung ist das halt auch keine, sondern nur mal etwas um den Fehler einzugrenzen.

Mein erster 3950X hat auch nach ca einem halben Jahr angefangen Random Reboots zu machen oder auch BSOD. Als Ursache hat sich zum Schluß ein Defekt des Kern 16 raus gestellt.
Prime 95 Small FTT und entweder sind nach kurzer Zeit Thread 31 und 32 ausgestiegen oder ein sofortiger BSOD. Mit diversen Speicher getestet und auch später auf 2 Boards und es
war nachvollziehbar. Ein 3600 und später 3900XT hatte in dem System keine Probleme (1. in der Sig). Hier habe ich auch testweise das 2. CCD deaktiviert im BIOS und dann lief die CPU mit 8/16 auch stabil.
Auch auf setzen von niedrigen Taktraten traten die Probleme auf.

Der 3950X wurde vom Händler bei AMD getauscht - der neue 3950X läuft auch wieder tadellos.
 
Zuletzt bearbeitet:
Ich kann dir das Auswendig leider nicht sagen, ich habe persönlich nur ein MSI Board. Was aber gehen sollte ist der Ryzen Master. Der kann auch die einzelnen Corecomplexe deaktivieren.
 
@MorOsch
ich glaube beim Dark Hero ist das setting in erweitert und dann cpu settings und dort dann kann man bei nem Eintrag (ich weiß leider aktuell nicht wie der heisst) einstellen ob auto oder 1 CCD - bei 1 ccd wurde bei mir ccd1 abgeschalten und dann lief die cpu ohne Fehler aber eben nur auf 6 Töpfen.

Falls du es mit Ryzen Master hinbekommst, bitte gib kurz bescheid wie, ich kenne mich damit absolut nicht aus und würde das dann eventuell gerne auch nochmal testen.

@Scoty
danke das würde dann wieder dagegen sprechen, das es an Asus liegt - was hat noch mal bei dir geholfen ? neue Cpu - oder was anderes ich hab es leider nicht mehr im Kopf bzw weiß nicht ob du es angesprochen hast.

@eratte
danke für die Info, ich weiß nicht ob man die Fehler direkt vergleichen kann - bei dir vermute ich das in der Ereignisanzeige dann immer derselbe Kern (prozessor apic id) den Fehler verursacht hat ? weil bei mir oder den meisten aktuell sind es ja immer unterschiedliche Kerne der Cpu, die den Fehler verursachen.
 
Ich hatte bei mir alles getauscht gehabt.
 
also Board und Cpu ? ok dann wird es natürlich schwierig zu sagen was letztendlich geholfen hat, aber am wahrscheinlichsten wohl die neue Cpu...

@MorOsch
was mir noch einfällt, falls die Fehler weiter auftreten beobachte doch bitte mal ob die Prozessor-APIC-ID immer dieselbe bleibt oder auch von 0 bis 24 variiert
 
Eben wurde sogar mal eine Minidump beim Freeze erstellt:

minidump.PNG


File hier hochgeladen, falls jemand mehr draus erfahren kann:

RAM scheint schon was damit zu tun zu haben, wenn ich die Frequenz auf 1900 MHz stelle ist er mir sogar eben im BIOS eingefroren.
Beitrag automatisch zusammengeführt:

1CCD aktivieren beim B550:

2012172.jpg
 
Zuletzt bearbeitet:
nagut die Fehler bei zu viel Ram bzw IF Overclocking sind wieder eine andere Baustelle, da genügt es ja vorerst mit dem Speed runterzugehen und schauen ob die Fehler weiterhin auftreten. Falls nicht dann einfach abwarten bis Amd mit neueren Agesas nachbessert.

richtig problematisch wird es wenn du alles auf Stock hast, also Ram 2400 und if 1200 und dazu pbo und core performance boost sowie curve optimizer aus hast und dann die Reboots trotzdem noch vorhanden sind

wie man 1 ccd im Bios abschaltet weiß ich ja nur wie es mit Ryzen Master gemacht wird weiß ich nicht.
 
Hatte auch arg mit spontanen Neustarts und vielen WHEA Fehlern bei über 3200Mhz RAM zu kämpfen.
Abhilfe hatte die deaktivierung vom Curve Optimizer, SOC von 1,1V und 1,4V RAM gebracht.
Seit BIOS 3001X (STRIX x570 Gaming E) muss ich die Voltages nicht mehr anpassen und habe 3600 Mhz CL 16 16 16 16 ohne Fehler stabil am Laufen.

Curve Optimizer sorgt dennoch für instabilität im System
Zusätzlich habe ich Blackscreens (alle 30-40h) mit dem Errorcode 0d auf dem Mainboard. Diese treten allerdings nur auf, wenn ich Armory Crate inkl. Aura creator installiert habe.

Unter Last selbst 8h CBR20 / Prime95 stabil und dabei Taktschwankungen von 50-100Mhz. Beim Zocken habe ich bisher nur bei Anno 1800 einen BSOD gehabt und das lag am RAM über 3200 Mhz vor BIOS 3001X

Bin also recht guter Dinge, dass die Software/das Bios einfach noch nicht wirklich rund läuft und sich das in den nächsten Updates gibt

Edit: PBO ist bei mir aktiv, mit Limits auf Auto, Scalar auf 10x und 200Mhz OC - CPU Taktet im Multi auf 4,5 Ghz und im Single auf 5,05 Ghz, bei 167W Verbrauch
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh