Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

AMD 5950X mit XMP

 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Mahlzeit zusammen,

über Google bin ich auf meiner Suche nach einer Lösung für mein Problem bei Sich gelandet und reihe mich hiermit gerne in die Liste der Betroffenen ein: seit Inbetriebnahme meines Build im September 2020 kämpfe ich mit den beschrieben Bluescreens im Idlen wie beim zocken und gern auch mal bei Office-Tätigkeiten und surfen und bin es genauso leid wie Ihr.

Ausprobiert habe ich ebenfalls viel mehr als einem einfachen User zuzumuten ist, jetzt lese ich hier aber erneut von einem positiven All Core-Offset (zuletzt im Post von @********* über meinem) - wie und wo stellt man diesen denn ein? Da ich vor dieser Problemstellung keinerlei Berührung mit BIOS hatte bin ich da leider nicht so fit wie ihr ... wie genau heißt die Einstellung und wo ist sie zu finden, wenn ich fragen darf? Am besten aus Sicht des MSI Click Bios 😉 Vielen Dank im Voraus und noch einen schönen Feiertag!
 
Moin,

ich bin zufällig auf diesen doch schon sehr langen Thread gestoßen.
Hier meine persönliche Lösung die bei mir geholfen hat:

Ausgangslage:

- Ryzen 9 3900X , NVIDIA 1080Ti, 2x 16 GB G.Skill NEO F4 3600C16D
- ASUS ROG Hero VIII X570 mit den 2019 ausgelieferten BIOS AGESA (vor BIOS V1201)
- Installation Windows 10 V1903
- Installation Linux Mint glaube V16 oder V17

--> KEINE PROBLEME !!!

Problem seit Anfang 2020:

- Update Windows 10 "Novemberupdate 2019"auf V1909
- seit dem ständig und ausschließlich Idle Powerfehler 41 / WHEA Fehler
- mindestens 10 BIOS Updates inkl. AGESA bin bei 3402 (April 2022)
- Idle Fehler kommen jetzt auch bei aktuellen Linux Distributionen (Mint / Ubuntu)


- Fehler kommen nicht: im Windows Anmeldebildschirm, bei alten Linux Live CD´s, bei alten Win7 installationen ohne Patch
- auch bei AIDA 64 Memtest und L1-L3 Cache Test keine Abstürze


Kuriose Zwischenlösung:

- gleich nach start Windows 10 habe ich CPU-Z geöffnet und den CPU Benchmark bzw. Stresstest gemacht
--> danach hatte ich für ca. 1h im Idle Desktop keine Abstürze mehr
- auch nach leistungshungrigen Spielen lief der Idle Destop ohne Abstürze weiter


Lösung seit ca. 4 Wochen ohne Absturz:

- nach einigen Abenden der GOOGLE Forschung haben sich die C-States und Power Supply Idle Control
herauskritalisiert
-also habe ich im ASUS BIOS folgendes geändert:

-> Advanced / AMD CBS / CPU Common Options
# Global C-State Control -> Disabled
# Power Supply Idle Control -> Typical Current Idle !!!! wahrscheinlich ausschlaggebend !!!!

-> Extreme Tweaker / External Digi+ Power Control
# CPU Power PhaseControl -> Optimized
# V SOC PhaseControl -> Opimized
# DRAM PowerPhaseControl -> Optimized

Achtung wer die ASUS AI Suite nutzt, da kann man wieder einige Dinge verändern!


Viele Grüße



 
Diese Art der WHEA Fehler bezieht sich aber mehr auf die 5xxx CPU´s.
Bei 3xxx war das locker weg zu bekommen.
 
Diese Art der WHEA Fehler bezieht sich aber mehr auf die 5xxx CPU´s.
Bei 3xxx war das locker weg zu bekommen.
Wäre da an einem konkreten Lösungsweg interessiert.

Ich habe eine 3700X-CPU und quasi seit der ersten Woche des Gebrauchs Probleme mit Kernel Power 41 in Kombination mit Volmgr 161, daher auch meine Frage nach der Vorgehensweise für einen All Core-Offset.

@RealDerby hat seine Schritte schon sehr gut beschrieben, vielen Dank!
 
Zuletzt bearbeitet:
Bei 3xxx war das locker weg zu bekommen.
Wie das locker dann aussieht, würde mich aber auch interessieren. Bei mir haben die ganzen Vorschläge bis jetzt nämlich nichts gebracht. Das was @RealDerby beschrieben hat, hat mir etwa 5 oder 6 Wochen damals geholfen. Danach ging der Spaß wieder los. Auch das erhöhen von irgendwelchen Spannungen hat wenn überhaupt nur kurzzeitig etwas gebracht. Ich hänge derweil weiter bei AGESA 1.0.8.0 fest. Das ist das einzige, was einigermaßen läuft. Alles was danach kam glich einer Katastrophe.
 
Gut dann revidiere ich das locker. Wenn der IF gesenkt wurde, war bei mir das bei den 3xxx immer WHEA frei.
Also nicht immer auf max. pochen. Bei den 5xxx war es nicht so leicht.
Ohne Grund tausch die AMD nicht aus.
 
Wenn der IF gesenkt wurde, war bei mir das bei den 3xxx immer WHEA frei.
Sorry, wenn ich da direkt nochmal nachfassen, aber was genau meinst Du damit?

BIOS auf Stock und dann was genau tun und was ist zu berücksichtigen? IF = Infinity Fabric, soweit komme ich noch mit und wo ich den im BIOS umstelle bekomme ich wohl auch noch raus, aber unter welchen Berucksichtigungen geht man da vor und ist das alles was verändert wird?
 
Der Wunsch bei den 3xxx CPU´s war ja einen 1:1 den RAM und Infinity Fabric laufen zu haben.
Maximum war dort 3800 MHz Ram 1:1 1900 MHz Infinity Fabric. (bei 5xxx soll er höher liegen, leider ohne WHEA Fehler über 1900 IF noch nie geschafft)
Das konnte leider aber nicht jede CPU.
Dann auf Beispiel: 3733 MHz RAM und 1866 MHz IF zurück.
Oder halt weniger. Des weiteren war auch oft XMP dran schult.
Kann natürlich auch an 100 anderen Sachen liegen.
 
Des weiteren war auch oft XMP dran schult.
In diesem Zusammenhang habe ich schon öfter gesehen, dass User zwar XMP nicht als solches nutzen, sondern die daraus resultierenden Taktungen selbst händisch eingestellt haben.

Macht das einen Unterschied? Wenn das System mit den Werten instabil läuft sollte es doch egal sein, ob sie durch die Option XMP oder händisch eingestellt werden, oder?
 
Vom Gedanken her gebe ich dir recht. Mag sein das dort vielleicht noch mehr verstellt wird.
Cads, Rtts, ProcODT usw.
Habe auch bessere Erfahrungen gemacht ohne XMP.
Topology und RAM Bestückung ist dann auch so eine Sache.
 
Das System hat unter stock settings fehler- und absturzfrei zu funktionieren. Mit dem IF-Takt hat das dann nichts mehr zu tun, wenn stock-settings anliegen.
Dann muss man auch noch unterscheiden zwischen Reboots/Abstürzen nur unter Last, nur im idle und beides zusammen. Diese Szenarien werden leider in vielen Foren ständig durcheinander geworfen. Auch spielt es eine Rolle, ob bei den sog. Reboots ein Bluescreen generiert wird oder nicht.


Mahlzeit zusammen,

über Google bin ich auf meiner Suche nach einer Lösung für mein Problem bei Sich gelandet und reihe mich hiermit gerne in die Liste der Betroffenen ein: seit Inbetriebnahme meines Build im September 2020 kämpfe ich mit den beschrieben Bluescreens im Idlen wie beim zocken und gern auch mal bei Office-Tätigkeiten und surfen und bin es genauso leid wie Ihr.

Ausprobiert habe ich ebenfalls viel mehr als einem einfachen User zuzumuten ist, jetzt lese ich hier aber erneut von einem positiven All Core-Offset (zuletzt im Post von @********* über meinem) - wie und wo stellt man diesen denn ein? Da ich vor dieser Problemstellung keinerlei Berührung mit BIOS hatte bin ich da leider nicht so fit wie ihr ... wie genau heißt die Einstellung und wo ist sie zu finden, wenn ich fragen darf? Am besten aus Sicht des MSI Click Bios 😉 Vielen Dank im Voraus und noch einen schönen Feiertag!

Wie ist das BIOS eingestellt ? Hast du komplette stock-settings anliegen, XMP auf OFF und bekommst sowohl unter Last als auch im idle Abstürze/Reboots ?
 
Was für ein IF Takt gibt AMD bei den 3xxx Ryzens frei? Hab ehrlich gesagt keine Ahnung und grade mal geschaut. Dort wird zumindest Speichercontroller DDR4-3200 angegeben. Bedeutet für mich er sollte DDR4-3200 mit IF Takt von 1600Mhz mitmachen. Das ist dann 1:1. Wenn ich falsch liege, könnt ihr mich ja korrigieren. Aktuell läuft meiner auf DDR4-2400 und IF Takt 1200. Ist übrigens scheinbar das einzige was wirklich stabil funktioniert. Und das ist unter aller Kanone. Am Anfang war das nicht so, aber ich kann mich auch dunkel daran erinnern, bei alten Bios Versionen war der IF und der DDR4 Takt nie Synchron gewesen. Das kam erst irgendwann später.

Ich hab 3 verschiedene Kits durchprobiert. Alle haben die gleichen Symptome. Im Gegenzug laufen alle aber in einem Intel System ohne Probleme. Der Aktuelle hier ist Micron E DIE der mit 3000Mhz angegeben ist. Hat auf zwei verschiedenen Intel Systemen auch DDR4-3800 mit etwas mehr Spannung und etwas schlechteren Timings mitgemacht. Hier schafft er nicht mal seine angegebenen Timings und Takt. Dümpelt grade wie gesagt auf DDR 2400 herum bei keine Ahnung was für beschissenen Timings. Schlecht genug um ständig Mikro Ruckler zu haben...
 
Bei Ryzen3xxx ist der seitens AMD spezifizierte Standard bei DDR4-3200, IF-Takt = 1600 MHz. D.h. 1:1 Teiler = Synchronbetrieb.
Was den in der CPU sitzenden Speichercontroller betrifft, ist das seitens AMD kein OC. Was den RAM jedoch betrifft ist das immer OC, weil XMP ein Übertaktungsprofil ist und Speicherriegel nicht mit nativ 3200 MHz arbeiten.

Wenn deine Riegel im Intel-System einwandfrei funktionieren, gibt es (zunächst) nur zwei Optionen. Das AM4 Mainboard oder die CPU bzw. die Settings der CPU.
Hast du die Riegel im AMD System mit XMP getestet, oder hast du die Werte manuell eingestellt ?
Wie sieht die SoC-Voltage mit und ohne XMP-Profil aus ? (Höherer Ram-Takt -> höherer IF-Takt -> benötigt mehr SoC Spannung).
 
Ich hab beides zig mal durchprobiert. Mit XMP, ohne und auch verschiedene Spannungen probiert. Ich hab quasi vor Monaten schon den ganzen Thread hier durchgearbeitet und bin dann zum Entschluss gekommen, dass entweder die CPU oder halt das Mainboard defekt sind. Alles andere wurde ja auch schon durchgewechselt. Aber ich bekomme kein anderes Board oder CPU um das auch mal zu testen. Und auf gut Glück jetzt ein Teil zur RMA schicken mag ich auch nicht. Vor allem weil ich dann auch erst mal ohne Rechner da stehe.

Ganz am Anfang lief es auf jeden Fall mal für Monate... nun schlage ich mich mit den bescheidenen Default Settings erst mal durch und rege mich nur auf. Und wenn ich doch mal etwas finde, was ich noch nicht probiert habe, teste ich es. Deswegen hatte ich ja auch nochmal Nachgefragt, was Atomic Frost als einfache Lösung empfindet. Aber das hatte ich ja schon durchprobiert.
 
Ja kann ich nachvollziehen, aber dir bleiben sonst nicht viele Optionen übrig.
Ich bin ja ebenfalls nach wie vor am tüfteln mit meinem 3700X und meiner stürzt ausschließlich im idle ab bzw. startet neu - unter absoluten stock settings ohne XMP. Unter Last, egal ob stundenlanger P95 Test oder lange Spielesessions läuft die Kiste absolut stabil, auch mit XMP bzw. 3600MHz Ram-Takt.

Deswegen will ich an der Stelle noch mal betonen, dass das Szenario sehr wichtig ist und gleiche/ähnliche Symptome eine ganz andere Ursache haben können. Ich kenne bisher schon 3 Fälle, wo es die GPU war. Bei einigen war es das Netzteil, andere konnten das Problem durch Erhöhung der 1P8-Spannung um 50mV beheben und und und..

Das Hauptproblem bei der Ursachenforschung ist die Reproduzierbarkeit. Wenn man die Abstürze provozieren bzw. reproduzieren kann, dann kann man recht schnell das Problem ermitteln. Schwierig wird es aber, wenn man wie ich teilweise 2 Wochen keine Abstürze hat und dann spontan zwei mal Tag. Dann dreht man an einer Stellschraube und denkt nach 3 Tagen, dass das Problem gelöst wäre, doch am vierten kommt er zurück usw..

Keine Abhilfe brachten bisher folgende Optionen:

- SoC Voltage fix auf 1,1V, dann fix auf 1,15V
- SoC Voltage +0,05V Offset
- SoC Voltage +0,025V Offset
- SoC Voltage auf 1,05V
- CPU Voltage +0,025V Offset
- CPU Voltage - 0,025V Offset
- XMP Off
- XMP Profile 1 / Profile 2
- XMP On, jedoch Ram-Takt jeweils manuell in 100MHz Schritten nach unten setzen
- Ram Voltage jenseits 1,4V bei sowohl aktiviertem als auch deaktiviertem XMP
- Power Supply Idle Control -> Typical Current
- Power Supply Idle Control -> Low Current
- Global C-States On/Off
- Ultra Low Power State für die GPU deaktivieren
- Idle Voltage der GPU erhöhen/senken
- Balanced/High Performance Power Profile
- PBO ist standardmäßig aus
- ErP Ready On/Off
-


All das hat mich leider mehrere Wochen gekostet, weil der Fehler einfach in sehr unregelmäßigen Abständen kommt.

Was ich noch nicht getestet habe:
- Core Performance Boost deaktivieren (Das wäre aber echt traurig)
- ProcODT ändern

Was ist aktuell teste:
- Fast Boot in Windows deaktiveren
Diese Option - wenn aktiviert - sorgt dafür, dass beim Herunterfahren der Inhalt des Arbeitsspeichers auf die HDD/SSD geschrieben wird, damit der nächste Systemstart schneller von statten geht. Mit Fast Boot hat man quasi nie ein sauberes Herunterfahren (Der manuelle Neustart ist davon nicht betroffen).
Das kann oftmals zu Treiberkonflikten führen. Bisher sind 3 Tage vergangen ohne einen Absturz, aber das heisst ja nix ;)

Werde hier auf jeden Fall updaten.
 
Ich denke schon, dass ich mich irgendwie so halbwegs mit bei dir Einordnen würde. Unter Last ist er noch nie abgestürzt. Wenn dann auch mehr auf dem Desktop. Wobei da auch einfach nur im Netz Surfen dazu gehört. Ist ja dann kein richtiges idle mehr. Außerdem hatte er oft spaß daran, nach dem Rendern eines Bild mit seinem reboot zu kommen. Da war dann auch keine Chance mehr das Bild vorher zu speichern. Er war fertig, dann wollte ich auf Speichern gehen, aber bevor das geklappt hat, reboot. Das ist dann immer ärgerlich, vor allem, wenn das Bild stunden gebraucht hat...

Einige Sachen machten auch hier den Eindruck geholfen zu haben. C-State deaktivieren, lief mehrere Wochen ohne Probleme. Dann war aber irgendwann auf einmal wieder vorbei. Also wieder von vorne anfangen. In der Zwischenzeit hatte ich auch so ziemlich alles am Rechner mal durchgewechselt weil ersetzt. Das einzige was jetzt halt von Anfang an noch da ist, ist das Mainboard und die CPU. Wenn ich tippen soll, würde ich auf die CPU wetten. Da sich das verhalten unter verschiedenen AGESA Version verändert/verschlimmert... denke ich schon, dass es die CPU sein muss.

Was scheinbar wirklich zu 100% stabil läuft ist wohl alles ganz unten. Ram auf 2400 und IF 1200 hat bis jetzt keine Probleme verursacht. An sich werde ich früher oder später wohl nicht um eine RMA von CPU herum kommen.


PS. Fast Boot ist das erste was ich hier direkt nach der Windows 10 Installation deaktivieren muss. Das zerlegt mir sonst auf langer Sicht meine Daten. Ich hab dann Fehlermeldungen vom Schnellstart drin. Und auch seltsame Controllerfehlermeldungen von der M2. Das passiert aber nur, wenn Schnellstart aktiviert ist. Ohne passiert das nicht. Vielleicht also doch das Mainboard *haha* am ende eine 50/50 Chance. Man soll ja seinen Humor nicht verlieren :shot:
 
Wenn dann auch mehr auf dem Desktop. Wobei da auch einfach nur im Netz Surfen dazu gehört. Ist ja dann kein richtiges idle mehr. Außerdem hatte er oft spaß daran, nach dem Rendern eines Bild mit seinem reboot zu kommen. Da war dann auch keine Chance mehr das Bild vorher zu speichern. Er war fertig, dann wollte ich auf Speichern gehen, aber bevor das geklappt hat, reboot. Das ist dann immer ärgerlich, vor allem, wenn das Bild stunden gebraucht hat...
Wo du von Bildern erzählst.. Bei mir kommen die Reboots tatsächlich nur in Verbindung mit Browser-Video-Aktivitäten. Bisher kam jeder Reboot nur bei YouTube, Amazon Prime oder Netflix Videos. Auch das Deaktivieren der HW-Beschleunigung bringt nichts. Es war bisher auch immer so, dass das Browserfenster geöffnet war. Ich arbeite viel an Word- und Excel-Dokumenten und lasse dann auch stundenlang Lo-Fi Musik bei YouTube im Hintergrund laufen (Fenster minimiert). So hatte ich bisher noch nie einen Absturz.


Wenn ich tippen soll, würde ich auf die CPU wetten. Da sich das verhalten unter verschiedenen AGESA Version verändert/verschlimmert... denke ich schon, dass es die CPU sein muss.
Da fällt mir an der Stelle ein, dass ich die Probleme sogar mit AGESA Pre 1002 hatte. Finde ich auch wichtig zu erwähnen, weil einige meinen, dass die 3000er CPUs erst ab der AGESA mit Ryzen5000 Support angefangen haben Probleme zu machen. Dem muss ich leider widersprechen.


Was scheinbar wirklich zu 100% stabil läuft ist wohl alles ganz unten. Ram auf 2400 und IF 1200 hat bis jetzt keine Probleme verursacht. An sich werde ich früher oder später wohl nicht um eine RMA von CPU herum kommen.
Sieht bei mir auf lange Sicht mit der RMA nicht anders aus. Muss mir halt für die Übergangszeit einen günstigen gebrauchten Ryzen zulegen, denn paar Wochen ohne PC geht aktuell nicht. Nur dass ich bei mir den Fehler noch nicht ganz wie bei dir einschränken kann, denn dein System ist immerhin mit Stock-Ram-Settings stabil. Ich kann 6 Stunden MemTest mit 3600MHz Takt laufen lassen, Null Probleme. Guck ich ein Video, muss ich zittern und hoffen, dass er nicht abstürzt :fresse:


Man soll ja seinen Humor nicht verlieren :shot:
Finde ich auch wichtig :)
 
Wie ist das BIOS eingestellt ? Hast du komplette stock-settings anliegen, XMP auf OFF und bekommst sowohl unter Last als auch im idle Abstürze/Reboots ?
In meinem BIOS hatte ich inzwischen auch so einige Einstellungen verändert, ganz so detailliert wie Du kann ich das aber nicht wieder geben - das eine oder andere aus Deiner Liste kam mir jedoch sehr bekannt vor. Aktuell habe von Stock aus gesehen nur

* XMP2 aktiv
* AMD Overclocking auf NB/SoC mit 1,05V
* C-States Off
* Power Supply auf Typical Current Idle

Ist aber bisher auch nicht die endgültige Lösung. XMP hatte ich auch schon komplett aus (dann eben 2133 MHz statt 3200 MHz), deshalb auch meine vorherige Frage inwieweit sich das Outcome wohl unterscheidet zwischen XMP oder eben dessen Taktung händisch einstellen. Auch hier bisher kein endgültiger Erfolg.

Mein System stürzt idR mit Bluescreen ab und hat es sogar schon geschafft diesen nicht einmal flächig darstellen, sondern eher wie ein transparentes Bild über die letzte Darstellung zu legen - ich pack Euch einfach mal ein Beispielfoto davon an.

Mit OCCT habe ich schon die Stresstests durch, keine Abstürze. Neulich dagegen in Excel gearbeitet, es klingelt an der Tür und als ich zurück komme und mich hinsetze (noch nicht wieder Maus, noch Tastatur angefasst) springt das Bild auf Bluescreen 😔 Ansonsten auch viel bei WebVideos, Spotify, ... Passiert der Crash bei aktiver Arbeit habe ich ein Zeitfenster von 3-5 Sekunden in dem der Rechner nicht mehr reagiert (Text wird nicht beim Schreiben nicht mehr übertragen, Dinge lassen sich nicht mehr anklicken), bevor der Bluescreen kommt. Wenn der Rechner beim zocken aussteigt kommt allerdings eher ein Blackscreens oder er friert lediglich ein - seitdem bekomme ich von dem Geräusch einer Bohrmaschine Gänsehaut, weil es dem Ton eines eingefrorenen Rechners so nahe kommt 😅 Fast Boot habe ich ebenfalls seit Ewigkeiten deaktiviert.

Was mir allerdings spanisch vorkommt:

Wenn der Rechner einmal gecrasht ist kann ich ihn danach uneingeschränkt nutzen - bis zum nächsten Shutdown. Safe. Aber warum?

Ein Plan B für mich wäre ebenfalls der Tausch von MB und CPU auf einen Intel Chip, aber wenn es dann die GPU ist schmeiß ich die Kiste aus dem Fenster ... Lässt sich das irgendwie testen?
 

Anhänge

  • PXL_20201110_174705836.jpg
    PXL_20201110_174705836.jpg
    1,2 MB · Aufrufe: 91
Es macht keinen Unterschied, ob du alle Werte händisch einstellst oder das XMP Profil lädst, sofern du auch exakt die selben Werte eintippst, die im Profil hinterlegt sind. Das nachträgliche Handanlegen ist dann entweder für noch mehr OC oder für eine Optimierung bei Instabilitäten, indem man z.B. die Arbeitsspannung erhöht, die Zeiten etwas lockert andere Parameter wie Abschlusswiderstände ändert.
Bis man aber zu diesem Punkt ankommt, muss vorher sichergestellt sein, dass der Ram auch unter Standardeinstellungen (nicht XMP, sondern die nativen settings) einwandfrei läuft. Sonst kann man später nicht mehr ausgrenzen, ob die Instabilitäten wegen OC-Stellschrauben oder doch an einem Fehler des Riegels liegen.

Was ich zuerst machen würde:
- Schnellstart in Windows deaktivieren
- miit DDU den Grafiktreiber restlos entfernen
- BIOS durch CMOS Reset einmal komplett auf Stock-Settings bringen
- Kontrollieren, ob deine DIMMS auch in Slot A2 und B2 sitzen
- Rechner einschalten und jetzt nur noch die üblichen persönlichen Einstellungen vornehmen, wie z.B. Lüfterkurven, Bootprioritäten oder Bootmodus (UEFI) etc.. Kein XMP laden (falls aktiv, ausschalten), keine Spannungen verstellen und auch nicht was in den CBS Optionen ändern
- Hochfahren und aktuellen GPU Treiber installieren
- falls noch nicht getan, aktuellen Chipset-Treiber von AMD installieren und Ryzen Balanced Powerplan einstellen

Nun das System so lange nutzen, bis der erste Crash kommt.
Jetzt gibt es den Pfad, wo du einen Crash bekommst und den wo alles in Ordnung ist.
Wenn du diese Schritte noch nicht gemacht hast, dann einmal am besten in der Reihenfolge machen und melden.
Hattest du das bereits hinter dir, kannst du folgendes tun:

Alle bis auf einen Speicherriegel ausbauen und das System nur mit einem Riegel in Bank A2 betreiben.
Ram weiterhin auf stock settings, allerdings die Ramspannung manuell auf 1,35V setzen.
Wieder Crash ? -> Den installierten Riegel rausnehmen, markieren, dann den anderen in A2 stecken
Das ganze so lange wiederholen, bis du alle Riegel (ich denke mal du hast zwei) durch hast. Wenn die Abstürze inzwischen verschwunden sind, hast du einen defekten Riegel entdeckt.
Haben die Abstürze bis hier hin kein Ende gefunden, kannst du die Prozedur mit Bank B2 wiederholen um ein Mainboardfehler auszuschließen.
Ist das Problem jetzt verschwunden, dann liegt der Fehler mit hoher Wahrscheinlichkeit am Mainboard. Sind die Probleme immer noch da, wäre es dann am besten, wenn man einen anderen Testriegel hätte.
Falls man an keinen rankommt, kann man jetzt beide Riegel wieder einstecken und weiterhin mit deaktiviertem XMP, jedoch 1,35V Ramspannung sich ausschließlich auf die CPU/SoC Einstellungen stürzen.

Doch bis dahin hat man erst einiges zu tun, falls man Bock/Zeit dazu hat. Der schnellere, jedoch mit mehr Kosten verbundene Alternativweg ist; Du kaufst dir einen gebrauchten günstigen Ryzen und überbrückst damit die RMA Zeit - oder du kaufst dir einen besseren und verscherbelst deinen alten nach der RMA ;)
Wenn du Pech hast, sind die Probleme immer noch da und du kannst das gleiche Spiel mit dem Mainboard und/oder den Speicherriegeln spielen.
 
Zuletzt bearbeitet:
Es macht keinen Unterschied, ob du alle Werte händisch einstellst oder das XMP Profil lädst, sofern du auch exakt die selben Werte eintippst, die im Profil hinterlegt sind.
Wenn ein XMP-Profil im Hintergrund nicht mehr einstellt als MHz/ FLCK/ Timings, dann ja. Genau das war ja meine Frage, da ich genug Leute im Netz gesehen habe die das händisch einstellen statt einfach das XMP Profil zu laden 🤔

Das nachträgliche Handanlegen ist dann entweder für noch mehr OC oder für eine Optimierung bei Instabilitäten, indem man z.B. die Arbeitsspannung erhöht, die Zeiten etwas lockert andere Parameter wie Abschlusswiderstände ändert.
Alles Dinge, von denen ich null Ahnung habe und auch eigentlich keine haben möchte - ich hätte gern gehabt dass alles wie Lego zusammen gesteckt wird und dann funktioniert, so wie ich es von vorherigen (Intel-) Systemen auch gewohnt war. Keine Ahnung, ob ich AMD da Unrecht tue, aber das wird mein erster und letzter Rechner mit Ryzen-CPU sein ...

- Schnellstart in Windows deaktivieren
Siehe oben, unlängst geschehen.

- miit DDU den Grafiktreiber restlos entfernen
Wäre noch eine Option, ja. Hierzu die Frage an alle, nutzt Ihr bei Nvidia die GRD oder Studio Treiber?

- Kontrollieren, ob deine DIMMS auch in Slot A2 und B2 sitzen
Verständlicher Punkt, aber dem ist schon so, ja 😅

- falls noch nicht getan, aktuellen Chipset-Treiber von AMD installieren und Ryzen Balanced Powerplan einstellen
Tatsächlich erst in der vergangenen Woche wieder aktualisiert 👍 Dazu die Frage, hier installiert man doch einfach 'drüber', oder? Also nicht erst die alten Treiber löschen (wo ich speziell bei diesen Treibern schon gar nicht wüsste wie)?

Alle bis auf einen Speicherriegel ausbauen und das System nur mit einem Riegel in Bank A2 betreiben.
Ram weiterhin auf stock settings, allerdings die Ramspannung manuell auf 1,35V setzen.
Das habe ich mit meinem alten G.Skill-RAM schon durch gehabt. Damals jeden der beiden Riegel einzeln nacheinander in jeder der vier Bänke getestet, immer gab es Irgendwann Crashes. Allerdings muss ich passen, ob ich damals XMP aktiviert hatte, oder nicht. Die Spannung hatte ich jedenfalls nicht verändert gehabt, aber XMP1 läuft meine ich grds auf 1,35V wenn ich mich nicht irre ...

Der schnellere, jedoch mit mehr Kosten verbundene Alternativweg ist; Du kaufst dir einen gebrauchten günstigen Ryzen und überbrückst damit die RMA Zeit - oder du kaufst dir einen besseren und verscherbelst deinen alten nach der RMA ;)
Wenn du Pech hast, sind die Probleme immer noch da und du kannst das gleiche Spiel mit dem Mainboard und/oder den Speicherriegeln spielen.
Wie gesagt, meine Haltung AMD/ Ryzen gegenüber ist nach der Irrfahrt stark getrübt - berechtigt oder nicht. Ausnahmslos alle, die die hier beschriebenen Probleme haben, nutzen Ryzen-CPUs, das kann kein Zufall sein.

Plan B ist daher eher MB und CPU raus und gegen eine Kombi für einen Intel 11700K tauschen, allerdings wäre es natürlich am schönsten, wenn man vorher (per Diagnose-Software?) prüfen könnte, ob die GPU nicht zufällig der Schuldige ist - allein der Treiber muss es ja nicht sein ...
Beitrag automatisch zusammengeführt:

Nachtrag:
All Seine Tipps würden leider keine Antwort darauf geben, warum der Rechner nach einem Crash absolut stabil läuft bis ich ihn das nächste Mal runter fahren 🤔

Wenn die CPU, der RAM-Slot, die GPU, ... einen Knacks hätte, dann müsste der Fehler sich dich reproduzieren lassen oder zumindest in gewisser Weise regelmäßig auftreten, oder? Selbst wenn ein Treiber fehlerhaft wäre ... das System kann sich dich nicht nach einem Crash merken 'auf diese Stelle im System erstmal besser nicht zugreifen' 😀
 
Zuletzt bearbeitet:
Die chipset Treiber kannst du einfach drüberbügeln. Wenn dir das kein ruhiges Gewissen gibt, vorher via Systemsteuerung die als chipset Treiber wie eine herkömmliche Software deinstallieren. Hast du bisher schonmal Windows komplett neu installiert?

Die GPU testest du am besten mit Furmark mit mindestens ner halben Stunde. Einfach starten ohne was besonderes einzustellen. Damit testest du die Karte unter hoher Last (und belasse bitte dabei dein RAM auf Stock)
Um Fehlerquellen im idle auszuschließen, kannst du ULPS deaktivieren (z.B. mit MSi Afterburner) und auch dort die GPU P0 Spannung um +10-12mV erhöhen. Das geht kinderleicht mit dem Afterburner. Wie gesagt, ich kenne bereits drei Fälle, wo die GPU das Problem war.

Zu den Riegeln: Du sagst, du hattest schonmal ein anderes Kit und hast die einzeln getestet. Da du ja scheinbar jetzt ein anderes Kit, allerdings die selben Probleme hast, kannst du ja bereits einen RAM defekt ausschließen.

Was für ein Netzteil hast du und wie sieht die 1P8 Spannung aus ? Die kannst du im BIOS nachgucken, die sollte mind. 1.7V betragen, am besten ist zwischen 1.8 bis 1.85V, maximal 1.9V.

Welche tatsächliche RAM Spannung liegt aktuell an den Riegeln an ? Auch im BIOS nachgucken. SoC Voltage sollte zwischen 1.05 bis maximal 1.1V sein. PBO ausschalten.

Was für eine CPU Spannung zeigt dir das BIOS an wenn du dich darin befindest ? Was für ein Mainboard hast du und welche AGESA ?
 
Die chipset Treiber kannst du einfach drüberbügeln. Wenn dir das kein ruhiges Gewissen gibt, vorher via Systemsteuerung die als chipset Treiber wie eine herkömmliche Software deinstallieren. Hast du bisher schonmal Windows komplett neu installiert?
Gut zu wissen, danke. Nein, nachdem 100% aller Referenzfälle im Netz keine Besserung durch eine Neuinstallation gemeldet haben habe ich das immer außen vor gelassen.

Die GPU testest du am besten mit Furmark mit mindestens ner halben Stunde. Einfach starten ohne was besonderes einzustellen. Damit testest du die Karte unter hoher Last (und belasse bitte dabei dein RAM auf Stock)
Werde ich mir morgen mal anschauen.

Um Fehlerquellen im idle auszuschließen, kannst du ULPS deaktivieren (z.B. mit MSi Afterburner) und auch dort die GPU P0 Spannung um +10-12mV erhöhen. Das geht kinderleicht mit dem Afterburner. Wie gesagt, ich kenne bereits drei Fälle, wo die GPU das Problem war.
Kinderleicht 😅 Kannst Du das bitte etwas mehr ausführen?

Zu den Riegeln: Du sagst, du hattest schonmal ein anderes Kit und hast die einzeln getestet. Da du ja scheinbar jetzt ein anderes Kit, allerdings die selben Probleme hast, kannst du ja bereits einen RAM defekt ausschließen.
Genau. Zuerst hatte ich G.Skill-Steine drin, hab dann aber nachher herausgefunden, dass die weder in der QVL des Board noch der CPU standen (das Build basiert grundsätzlich auf einer damaligen Empfehlung eines anderen Forum, da hätte ich gedacht dass das selbstverständlich sei und habe leider selbst vorher nicht recherchiert. Inzwischen habe ich HyperX-Steine drin, die in beiden QVL vertreten sind.

Was für ein Netzteil hast du und wie sieht die 1P8 Spannung aus ? Die kannst du im BIOS nachgucken, die sollte mind. 1.7V betragen, am besten ist zwischen 1.8 bis 1.85V, maximal 1.9V.
750 W be quiet! Straight Power 11 Modular 80+ Gold. Vorher war es dasselbe mit 550W. Auch hier hat ein Tausch nicht das erhoffte Ergebnis gebracht - wegen Volmgr 161 hatte ich den Verdacht das NT sei zu schwach, aber immerhin können so auch die Kabel ausgeschlossen werden, da ich die natürlich mit getauscht habe.

Wegen der Spannung muss ich nachschauen, das kann ich hier an dieser Stelle nicht ad hoc beantworten. Reiche ich nach.

Welche tatsächliche RAM Spannung liegt aktuell an den Riegeln an ? Auch im BIOS nachgucken. SoC Voltage sollte zwischen 1.05 bis maximal 1.1V sein. PBO ausschalten.
Siehe oben, muss ich nachreichen. NB/SoC habe ich über die Option 'AMD Overclock' auf 1.05V gesetzt, die ist Stock aber höher.

Was für eine CPU Spannung zeigt dir das BIOS an wenn du dich darin befindest ?
Wird ebenfalls nachgereicht 😁

Was für ein Mainboard hast du und welche AGESA ?
Ich hatte eigentlich mein komplettes Build in die Signatur gepackt, aber irgendwie wird die nicht angezeigt. Mein Profil hier im Forum beinhaltet bis auf die genauen Bezeichnungen der m.2 alle weiteren Daten, falls Du mehr genauer wissen magst.

Mein MB ist ein MSI B550-A Pro mit BIOS A.50, das ist zu diesem Zeitpunkt die aktuellste, stabile Version mit AGESA 1.2.0.0

Das neuere BIOS mit 1.2.0.2 ist aktuell nur als Beta erhältlich, deshalb habe ich noch nicht geupdated. Generell gibt es für mein Board nur 5 BIOS-Versionen, die ich mit der Zeit alle durch hatte.
 
Wie es der Zufall so will hatte ich soeben wieder einen Crash, da hab ich die Gunst der Stunde genutzt mein BIOS umzustellen. Zu 100 % zurück auf Stock-Settings, bis auf

  • Boot-Reihenfolge (was keine Ursache für die Probleme sein sollte),
  • Precision Boost Overdrive deaktiviert und
  • RAM-Spannung wie von Dir angemerkt händisch auf 1,35 V gebracht

Die nachgereichten Daten von oben:

  • 1P8-Spannung (PLL) konnte ich leider keine Angabe über den aktuellen Wert finden, die Einstellung im BIOS steht lediglich auf [AUTO]
  • RAM-Spannung schwankt stock zwischen 1.196 V und 1.200 V
  • SoC ist auf stock tatsächlich niedriger als erwartet - schwankt zwischen 1.030 V und 1.032 V
  • CPU-Spannung schwankt auf stock zwischen 1.460 V und 1.466 V

P.S.: Meine Signatur mit allen Specs meines Builds ist anscheinend nur am Rechner sichtbar, nicht am Handy.
 

Anhänge

  • PXL_20210515_163830863.jpg
    PXL_20210515_163830863.jpg
    157,1 KB · Aufrufe: 84
Okay. Die DRAM Voltage bei ~1,2 V ist üblich wenn der RAM auf stock läuft. Aber die hast du ja jetzt auf 1,35V gefixt. +/- paar mV ist egal.
Die 1P8 Voltage kannst du evtl. auch mit HWinfo auslesen. Dazu Ausschau nach "CPU +1.8 V" o.Ä. halten. Falls der Wert unter 1.8V sein sollte, gerne im BIOS so umstellen, dass du irgendwo zwischen 1.82 - 1.85 landest.
Oftmals werden die Spannungen nicht 1zu1 so übersetzt, wie man sie eintippt (z.B. ist 1.35 V eingetippt, aber das BIOS zeigt 1.33 an). Dann einfach nachjustieren.
CPU Voltage ist auch okay. Ryzen darf sich bis zu 1.5V genehmigen.

Zum MSI Afterburner. Ich sehe gerade, dass du eine nvidia Karte hast. Damit hat sich das mit dem ULPS erledigt, die idle-Spannungen der GPU kann man auch erstmal ignorieren.

Was noch helfen kann ist den PCI-E Link des Grafikkartenslots im BIOS manuell auf 3.0 zu setzen. Die Einstellung sollte nicht schwer zu finden sein. Falls möglich, auch den Link des verwendeten M2 Slots der SSD auf 3.0 setzen.

Lad dir das Programm "ZenTimings" runter. Starten, Screenshot machen und teilen bitte.

Die nächsten Steps sind abhängig davon, ob du wieder einen Crash hast.
 
Okay. Die DRAM Voltage bei ~1,2 V ist üblich wenn der RAM auf stock läuft. Aber die hast du ja jetzt auf 1,35V gefixt. +/- paar mV ist egal.
Top 👍

Die 1P8 Voltage kannst du evtl. auch mit HWinfo auslesen. Dazu Ausschau nach "CPU +1.8 V" o.Ä. halten. Falls der Wert unter 1.8V sein sollte, gerne im BIOS so umstellen, dass du irgendwo zwischen 1.82 - 1.85 landest.
Gefunden - siehe Screenshot, vierter Wert von unten. Liegt nach initialem Start der Software zwischen 1.820 V und 1.824 V. Ich hab nur gerade keine Zeit die Software laufen zu lassen um zu schauen wie sich die Werte über Zeit verändern würden.

Oftmals werden die Spannungen nicht 1zu1 so übersetzt, wie man sie eintippt (z.B. ist 1.35 V eingetippt, aber das BIOS zeigt 1.33 an). Dann einfach nachjustieren.
CPU Voltage ist auch okay. Ryzen darf sich bis zu 1.5V genehmigen.
Nochmal top 👍 Solche Referezwerte hatte ich bisher nicht.

Was noch helfen kann ist den PCI-E Link des Grafikkartenslots im BIOS manuell auf 3.0 zu setzen. Die Einstellung sollte nicht schwer zu finden sein. Falls möglich, auch den Link des verwendeten M2 Slots der SSD auf 3.0 setzen.
PCI_E hatte ich bereits zeitweise auf 3.0 festgesetzt, kann ich aber gern unter sonst Stock-Settings (bzw. den aktuell oben genannten, leichten Modifikationen) nochmals probieren. In meinem Rechner stecken 2 Stück m.2. Wo im MSI Click Bios wären denn die Settings hierzu zu finden?

Lad dir das Programm "ZenTimings" runter. Starten, Screenshot machen und teilen bitte.
Siehe Anhang. Crashes gab es seit meinem letzten Post bisher keinen weiteren, aber wie gesagt, in der Regel läuft der Rechner danach auch zuverlässig, bis er das nächste Mal komplett herunter gefahren wird.
 

Anhänge

  • hwinfo.png
    hwinfo.png
    11,6 KB · Aufrufe: 90
  • ZenTimings_Screenshot_27018412,7101806.png
    ZenTimings_Screenshot_27018412,7101806.png
    16,3 KB · Aufrufe: 92
Die Spannungen sehen gut aus. Die PCI-E Einstellungen findest du unter Settings/Erweitert/PCI-Subsystemeinstellungen. Falls die M2 Slots auch gesteuert werden können, werden die dort aufgelistet.
Dann hoffe ich mal, dass jetzt erstmal keine Abstürze kommen, denn mit den RAM-Einstellungen sollte das ganze nichts mehr zu tun haben. Ich würde den Crash an deiner Stelle aber auch provozieren.
 
Die Spannungen sehen gut aus. Die PCI-E Einstellungen findest du unter Settings/Erweitert/PCI-Subsystemeinstellungen. Falls die M2 Slots auch gesteuert werden können, werden die dort aufgelistet.
Werde ich bei nächster Gelegenheit auf jeden Fall mal ein Auge drauf werfen, danke.

Dann hoffe ich mal, dass jetzt erstmal keine Abstürze kommen, [...]
Ich auch! 😅

[...] denn mit den RAM-Einstellungen sollte das ganze nichts mehr zu tun haben.
So es denn am RAM liegt.

Ich würde den Crash an deiner Stelle aber auch provozieren.
Habe ich bisher nie geschafft. Er taucht einfach auf oder eben nicht, also bleibt mir weiterhin nichts anderes übrig als den Rechner einfach zu nutzen. Office, Webbrowser, Steam-Games, ... alles kann, nichts muss.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh