Neues System - Neustarts unter Last (RAM?)

dionysos

Enthusiast
Thread Starter
Mitglied seit
10.02.2007
Beiträge
571
Ort
328 Dortmund
Hallo Leute,

ich habe ein neues System zusammengestellt mit folgenden Komponenten:

AMD Ryzen 7 3700X
MSI B550-A Pro
Corsair Vengeance RGB PRO Kit 32GB, DDR4-3600, CL18-22-22-42
Corsair Force Series MP600 1TB
MSI Radeon RX 5500 XT Mech 8G OC
be quiet! Straight Power E9-CM 580W (Netzteil ist Altbestand)

Windows 10 EDU 20H2 + alle Updates + Chipsatztreiber

BIOS ist das neueste non-Beta 7C56vA4

Laut Handbuch des Mainboards sollen die RAM Slots DIMMA2 und DIMMB2 zuerst bestückt werden, das habe ich so umgesetzt.

Ich betreibe das System ohne OC, nur das XMP Profile ist im BIOS gewählt (DDR4-3600, CL18-22-22-42), ansonsten ist im BIOS alles auf "Auto".

Im Betrieb kommt es sporadisch zu Neuboots ohne Fehlermeldung, im Windows Eventlog ist dann ein schwerwiegender Hardwarefehler (Machine Check Exception) hinterlegt.

Ich versuche aktuell den Fehler einzugrenzen und belaste das System mit Prime95 Large FFTs (memory and RAM).
Das läuft teilweise über eine Stunde stabil, manchmal kommt aber auch nach kurzer Zeit zum Absturz.

Woher könnte der Fehler kommen?
Mein Verdacht ist RAM, aktuell belaste ich die beiden Riegel einzeln (nur 16GB in DIMMA2)

DRR4-3600 sollte auf dem Board mit der CPU doch problemlos laufen, oder?
Ohne XMP-Profil aktiviert konnte ich den Fehler bisher zumindest nicht nachstellen.

Vielen Dank vorab für den Input!

Edit1: Okay ein einzelner Riegel @DRR4-3600 in DIMMA2 stürzt auch ab.
Ich teste jetzt den anderen Riegel im selben Slot.

Edit2: Riegel 2 alleine stürzt genauso ab.
 

Anhänge

  • aida64_1.PNG
    aida64_1.PNG
    40 KB · Aufrufe: 70
  • cpu_z_1.PNG
    cpu_z_1.PNG
    44,9 KB · Aufrufe: 68
  • cpu_z_2.PNG
    cpu_z_2.PNG
    29 KB · Aufrufe: 71
  • cpu_z_3.PNG
    cpu_z_3.PNG
    29,1 KB · Aufrufe: 59
  • cpu_z_4.PNG
    cpu_z_4.PNG
    38,9 KB · Aufrufe: 69
  • cpu_z_5.PNG
    cpu_z_5.PNG
    38,7 KB · Aufrufe: 65
  • eventlog_1.PNG
    eventlog_1.PNG
    94,3 KB · Aufrufe: 67
Zuletzt bearbeitet:
Mal den RAM auf 3200 laufen lassen? Hört sich doch sehr nach nem RAM Problem an.
Kannst auch nochmal den RAM Check laufen lassen, aber wenn beide Module das gleiche Muster abgeben, ist es vermutlich die Speichereinstellung, die das RAM nicht verkraftet.
Wäre natürlich ärgerlich wenn es das ist, dann würd ich den RAM umtauschen (ggf. in die im Forum bevorzugten Modelle).
Andere Option wäre das alte Netzteil, weil bei Speicherfehlern würde vermutliche erstmal ein BSD kommen. Von wann ist das NT und hast Du die Möglichkeit, ein höherwertiges zu nutzen?
 
Unter 3200 MHz ist der Absturz auch zu reproduzieren. (Screenshot anbei)

Das Netzteil ist zwar schon was älter, hat aber bisher tadellose Dienste geleistet. (In einem ähnlich stromzehrenden System)
Ein anderes zum Vergleich habe ich leider nicht zur Hand.

Wenn 3200 MHz auch nicht stabil sind, deutet das nicht eher auf einen RAM-Defekt hin als ein Netzteil-Problem?
 

Anhänge

  • 3200MHz.PNG
    3200MHz.PNG
    56,3 KB · Aufrufe: 79
Ich habe jetzt mit 3200MHz einen kompletten Durchlauf von MemTest86 gemacht, ist ohne Fehler durchgelaufen (ca. 7h Testzeit).

Windows stürzt aber trotzdem ab, nicht beim normalen Desktop-Usecase, aber unter Belastung.

Jetzt bin ich etwas ratlos.
Welche Komponenten kommen noch in Frage?
 

Anhänge

  • MemTest_1.jpg
    MemTest_1.jpg
    169,1 KB · Aufrufe: 57
  • MemTest_2.jpg
    MemTest_2.jpg
    107,2 KB · Aufrufe: 58
Nimm nicht Memtest, nimm mal Karhu oder TestMem5 und lass laufen. Wenn das keine Fehler produziert ist nicht der Ram schuld. Karhu kostet leider Geld, ist aber mega nice.
Wenn du magst kann ich dir meinen Key sagen, vielleicht klappt das ja mit zwei Usern
 
Ich hatte Mal einen i5-2400 da hatte die CPU bzw der Ramcontroller einen Hau. CPU lief, aber eben instabil. Ich hatte damals alles getauscht und konnte nachweisen dass der Fehler mit der CPU wandert.
 
Gibts schon Neuigkeiten vom Test?
 
Erstmal vielen Dank für die vielen Vorschläge.

Ja, es gibt Neuigkeiten:

Was ich bisher gemacht habe:

- DRR4-3200 eingestellt => Absturz
- DDR4-3600 + alle Timings manuell eingestellt => Absturz
- Die Module benötigen 1,35V Spannung, ich habe gesehen, dass wenn das Mainboard 1,35V einstellt, hinterher nur 1,33V ausgelesen werden.
Also habe ich die Spannung manuell erhöht, bis wirklich 1,35V gemessen werden => Absturz
- Ich habe das Tool Karhu Ram Test laufen lassen bei DDR4-3600: über drei Stunden ohne einen Error, dann => Absturz.
Es werden dann aber auch keine Errors beim Test gemeldet, sondern das System ist schalgartig weg. Nichtmal ein Bluescreen kommt.

- Speicher auch komplett ohne manuelle Einstellungen laufen lassen @DDR4-2666 => genau der selbe Absturz.

Anbei ein Screenshot vom Typenschild des Netzteils. Es ist von ca. 2012.
Das System zieht zum Zeitpunkt des Absturzes <150W, also an sich weit von der Maximalleistung des NTs weg.

Aufgrund der Abstürze mit niedrigem Speichertakt sogar im Idle, schließe ich ein Problem mit der Spannungsversorgung aus.

Das macht mein Problem bzw. die Fehlerlösung leider nicht einfacher.
 

Anhänge

  • bequiet.jpg
    bequiet.jpg
    95,9 KB · Aufrufe: 68
Update:
Ich habe mir ein 850W Netzteil nach ATX 2.52 Standard zum testen besorgt (Cooler Master MWE Gold V2 Full Modular 850W ATX 2.52).

Das System lässt sich weiterhin in weniger als 60min zum Absturz bringen.

Ab jetzt wird die Fehlereingrenzung (zumindest für mich) schwieriger.
Ich habe weder einen RAM-Riegel aus der Liste der unterstützten Riegel von MSI, noch eine AM4-CPU oder ein anderes AM4-Board.

Update II: es gibt Hinweise, das exakt mein Problem durch das Mainboard verursacht werden kann: MSI Support Forum - Windows Event Viewer Error (Even System Restart)

Es gibt seit gestern ein neueres BIOS, das ich werde heute testen.
 
Zuletzt bearbeitet:
Update III:
Auch das neue BIOS mit AGESA 1.1.9.0 brachte keine Abhilfe.

Ich gehe daher von einem Defekt aus und werde zunächst das Mainboard auf Garantie austauschen lassen.
 
Update:

Ich habe testweise die eingebaute Grafikkarte MSI Radeon RX 5500 XT Mech 8G OC (PCIe 4.0 x16 (x8)) gegen eine alte ASUS EAH6850 DirectCU Radeon HD 6850 (PCIe 2.1 x16) getauscht.

Siehe da, das System läuft absolut stabil, unter RAM Vollast +12 Stunden im Dauertest.

Was mich nur wundert, ist dass das System vorher gerade in 3D-Anwendungen nicht besonders häufig abgestürzt ist.
Ich bin mir nicht ganz sicher, ob die Grafikkarte das Hauptproblem ist, oder etwas mit dem PCIe-Bus des Mainboards nicht stimmt.
 
Zuletzt bearbeitet:
Du könntest mal im Bios schauen ob du den PCIe Modus auf PCIe3 statt PCIe4 umstellen kannst.
Vielleicht bringt das was?
 
Habe ich ausprobiert, bin manuell im BIOS alle PCIe Generationen durchgegangen und mit GPU-Z die Wirksamkeit der Umstellung überprüft.

Egal welche Generation eingestellt ist, mit der neuen PCIe 4.0 Grafikkarte stürzt das System ab.
 
Sowas ist aus der Ferne immer schwer zu beurteilen. Zwei Dinge fallen mir aber ins Auge, denen Du ggf. noch nachgehen könntest, so das Problem noch nicht gelöst werden konnte:

1. Im Windows-Fehlerprotokoll steht : "Quelle: MCE, Komponente: Prozessorkern".
Hast Du die Core-Spannung fix eingestellt, oder ist die vom Umstellen des XMP so eingestellt worden?
Ich würde da als erstes versuchen, die Spannung für die Cores ein klein wenig anzuheben. Entweder via Offset wenn das geht, oder die fixe Spannung eben erhöhen.
Etwas ist im Bereich von max 0.05V, das ist schon ganz ordentlich. Runtertasten kannst Du Dich jederzeit wieder, wenn das etwas verbessert.
Dann schauen, ob sich da etwas verbessert / ändert.

2. Dem XMP-Settings nach wird die geringe CAS-Latenz von 18 NUR durch die Erhöhung der Spannung erzielt.
Da würde ich versuchen, mal ein wenig mehr Spannung, z.B. 1.4V oder anderes herum versuchsweise mal mit nur 1.3V schauen, ob das irgendetwas verändert.
Da der Fehler aber bei Deinen beiden RAM-Tests sowohl mit 3200 als auch mit 3600 kam, würde ich hier den Fehler aber nicht erwarten.
Wenn das aber was bringt, dann die Spannung langsam wieder soweit runter, bis der Fehler wieder auftritt.

Desweiteren kannst Du mal schauen, ob Du die LoadLineCalibration ggf, mal etwas reduzierst.
Ggf. kannst Du die LoadLineCalibration sogar für das RAM separat einstellen. Ob das bei Deinem Board geht, weiß ich aber nicht.

Ist viel stochern im Nebel, aber manchmal ist das so ;)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh