[Ungelöst] Ratlos: Nicht reproduzierbare Abstürze aus dem Nichts

dooyou

Enthusiast
Thread Starter
Mitglied seit
21.01.2008
Beiträge
871
Ort
München
Hallo Leute,

ich habe mir einen Mini-ITX Rechner mit dem bekannten DAN A4 Gehäuse zusammengebaut.

In dem Gerät stecken folgende Komponenten:
  • Ryzen 5 3600
  • Noctua NH-L9a
  • Powercolor Radeon 5700 XT Red Dragon
  • Gigabyte Aorus B450 Pro Wifi (Bios F50 ab Werk)
  • Crucial Ballistix BL2K16G32C16U4B 3200 MHz
  • Corsair SF600
  • WD 550 Nvme 1TB
Zum Problem:
Seit kurzem habe ich ab und zu sich nicht ankündigende Abstürze, d. h. Windows startet aus dem nichts neu und nicht gespeicherte Änderungen sind natürlich dann verloren.
Das kann in einem Spiel sein, in Blender oder auch ganz normal im Desktop Modus. Aber ich kann nie sagen wann.

Ich dachte erst an ein Hitzeproblem oder dergleichen.

Folgendes habe ich gemacht, um dem Problem auf dem Grund zu gehen:

  • Memtest86 - kein Fehler
  • 10 Stunden Prime 95 - stabil, kein Absturz
  • PC Mark 10 - stabil, mehrere Durchläufe
  • 3D Mark - Stresstest - keine Abstürze, Framrate bei 99,3 %, Temperatur GPU 75 Grad

Kurioserweise gabs bei den extremen Belastungen keine Abstürze und der RAM ist lt. Memtest okay.

Ehrlich gesagt, ich habe keine Ahnung woran das liegt! Treiberproblem? Aber ich habe eigentlich nichts geändert.
Das System lief die ersten Monate ohne Probleme.

Die Systemlog sagt nach dem letzten Absturz in Windows 10:

Protokollname: System
Quelle: EventLog
Datum: 01.09.2020 08:48:55
Ereignis-ID: 6008
Aufgabenkategorie:Keine
Ebene: Fehler
Schlüsselwörter:Klassisch
Benutzer: Nicht zutreffend
Computer: DESKTOP-R93JL4K
Beschreibung:
Das System wurde zuvor am ‎01.‎09.‎2020 um 08:36:13 unerwartet heruntergefahren.

Ereignis-XML:
Code:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
  <System>
    <Provider Name="EventLog" />
    <EventID Qualifiers="32768">6008</EventID>
    <Version>0</Version>
    <Level>2</Level>
    <Task>0</Task>
    <Opcode>0</Opcode>
    <Keywords>0x80000000000000</Keywords>
    <TimeCreated SystemTime="2020-09-01T06:48:55.7106444Z" />
    <EventRecordID>10582</EventRecordID>
    <Correlation />
    <Execution ProcessID="0" ThreadID="0" />
    <Channel>System</Channel>
    <Computer>DESKTOP-R93JL4K</Computer>
    <Security />
  </System>
  <EventData>
    <Data>08:36:13</Data>
    <Data>‎01.‎09.‎2020</Data>
    <Data>
    </Data>
    <Data>
    </Data>
    <Data>4810</Data>
    <Data>
    </Data>
    <Data>
    </Data>
    <Binary>E407090002000100080024000D007303E407090002000100060024000D007303600900003C000000010000006009000001000000B00400000100000000000000</Binary>
  </EventData>
</Event>

Helfen andere Protokoll-Dateien?
Beitrag automatisch zusammengeführt:

Aber das sind halt nur die Statusangeben zur Folge des Absturzes, nicht die Ursache. Nur wie kriege ich die raus? Ich kann ja nicht zig Komponenten auf Verdacht tauschen?
Beitrag automatisch zusammengeführt:

Vor dem Absturz sind Meldungen zu finden wie:

Code:
Hypervisor initialized I/O remapping.

Hardware present: true
Hardware enabled: true
Policy: 0x0
Enabled features: 0x4A
Internal information: 0x0
Problems: 0x0
Additional information: 0x0
Beitrag automatisch zusammengeführt:

Nach dem Neustart ist auch das hier zu finden:

Code:
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 3

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.

Code:
ErrorSource 3
  ApicId 3
  MCABank 5
  MciStat 0xbea0000000000108
  MciAddr 0x1f8034e329ab0
  MciMisc 0xd01a0ffe00000000
  ErrorType 9
  TransactionType 2
  Participation 256
  RequestType 0
  MemorIO 256
  MemHierarchyLvl 0
  Timeout 256
  OperationType 256
  Channel 256
  Length 936
  RawData 435045521002FFFFFFFF03000100000002000000A80300002F300600010914140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131FE6FF5E89C91C54CBA8865ABE14913BBCC9C58F02B80D60102000000000000000000000000000000000000000000000058010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000001000000000000000000000000000000000000000000000018020000800000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000001000000000000000000000000000000000000000000000098020000100100000003000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000100000000000000000000000000000000000000000000007F010000000000000002010000000000100F87000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000300000000000000000000000000000000000000000000000000000000000000000000000000000007000000000000000300000000000000100F870000080C030B32D87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C03000000000000009F00020600000000B09A324E03F801000000000000000000000000000000000000000000000000000200000002000000E5607CF12B80D601030000000000000000000000000000000000000005000000080100000000A0BEB09A324E03F8010000000000FE0F1AD0000000000300000000000000B00005000000004D0000000079000000230000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001B00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
 
Zuletzt bearbeitet:
Eventuell tritt das Problem eher auf, wenn der Takt der CPU starke Sprünge macht? Würde jetzt auch mal vorsichtig das Netzteil in Erwägung ziehen.

Das Corsair ist ja schon seit 2015 am Markt.
 
Von Corsair gab es fuer SFX-Netzteile einen Rueckruf fuer bestimmte Modelle. Die CPU-Kuehlung ist echt mager. Da waeren Werte mal interessant. Ja, wuerde mit Karhu oder HCI nochmal einen Stresstest fuer den RAM durchfuehren.
 
Also alle Teile sind neu bzw. vor ca. drei Monaten (auch das NT) zusammengebaut worden. Es ist also kein altes NT verbaut. Die Abstürze habe ich deswegen nicht reproduzierbar genannt, da es in völlig unterschiedlichen Situationen vorkommt, manchmal auch Stunden gar nicht.

Mich wundert halt das alle Belastungstest anstandslos durchliefen.

System ist weder untervoltet noch übertaktet, Speicher Standardtakt. Ich habe also auch nichts verbastelt.

Deswegen bin ich über das neuerliche Verhalten so verwundert. Es gibt wahrscheinlich keine Logdatei, die eindeutig Auskunft geben kann?

Warum denkt ihr es könnte das NT sein?

Wie gesagt, Prime95 volle Belastung ohne Probleme, zig Stresstests mit 3D Mark auch. Der CPU Lüfter ist für das Gehäuse mit dem Prozessor ne gängige Kombi. Heute morgen, Absturz, kein Spiel nur bissl dies und das.
 
...weil solche Abstürze durch plötzliche Spannungsabfälle produziert werden können.
Aber ich glaube du bist nicht der einzige mit B450-Mainboard und solchen Problemen...

gruß
hostile
 
HinweisCorsair Austauschprogramm für Netzteile der SF Serie, die zwischen Oktober 2019 und März 2020 produziert wurden (Seriennummern zwischen 194448xx und 201148xx). Betroffene Netzteile weisen unter bestimmten Bedingungen eine erhöhte Ausfallsrate vor. Weitere Information: SF Series Voluntary Product Replacement
 
System ist weder untervoltet noch übertaktet, Speicher Standardtakt. Ich habe also auch nichts verbastelt.
Sicher? Man glaubt garnicht was die Hersteller ab Werk alles für einen Käse anstellen...

Ich würde tippen das die Cpu im Idle oder bei Teillast zu wenig Saft bekommt und deshalb das System instabil wird. Ist natürlich rein geraten.
 
Einfach schauen, ob dein Netzteil dazu gehoert bei der Rueckrufaktion. Einfach mal schauen. Mich wuerde halt interessieren, ob die CPU drosselt.
 
die zwischen Oktober 2019 und März 2020 produziert wurden

Ups, ich dachte das war viel früher. Guter Hinweis! Ich melde mich.

Ich würde tippen das die Cpu im Idle oder bei Teillast zu wenig Saft bekommt und deshalb das System instabil wird. Ist natürlich rein geraten.

Wie kann ich das auf einfachstem Weg messen? Bei mir läuft i.d.R. CPU-Z oder HWInfo im Hintergrund. Ist halt schon echt strange, weil die erste Zeit gabs keine Probleme. Ich stelle ein Bild zu den RAM-Timings rein.
 
Hast du die CPU und Ram übertaktet / untervoltet / am IF Takt gedreht oder sowas in der Richtung?
Oder läuft dein PC komplett stock?

Mein Ryzen 3600 hat ebenfalls sporadischen Schluckauf, seit ich Vcore etwas hochgedreht hab (1.080V stat 1.030V ) kommts deutlich seltener vor, aber passiert immernoch ab und an.
 
Nein, wie gesagt nicht verbastelt. Kein Under oder -overvolting. Aber siehe weiter unten, vielleicht
unbewusst, weil ich die Einstellungen nach Einbau nicht kontrolliert habe.

@Syrokx Netzteil fällt nicht unter das Umtauschprogramm. Hab die Nr. 201448X. Dann wohl eher ok?

Mir ist aber was anderes aufgefallen, ursprünglich hatte ich diesen Speicher (lt. Kompatibilitätsliste ok) verbaut:
Crucial Ballistix BL2K8G30C15U4W 3000 MHz (2x 8 GB)

Den habe ich getauscht gegen:
Crucial Ballistix BL2K8G32C16U4W 3200 MHz (2x 16 GB)

Seit dem habe ich die Probleme, aber ich denke, dass das Zufall ist. Mir ist aber eingefallen, dass ich kein
Biosreset nach Speicherwechsel oder ähnliches gemacht habe.

So siehts da aus im Bios, da stimmt doch was nicht oder? Falsches Timing, zu wenig Volt? Aber beim
dritten Bild (SharedScreenshot2) unter Timings Table "XMP-3200" wäre es ja korrekt? 1.35v und 1600 MHz wg. Dual-Channel?
IMG_0757.JPG
 

Anhänge

  • SharedScreenshot.jpg
    SharedScreenshot.jpg
    41,1 KB · Aufrufe: 94
  • SharedScreenshot2.jpg
    SharedScreenshot2.jpg
    56,9 KB · Aufrufe: 85
Zuletzt bearbeitet:
Du müsstest XMP laden, damit die Spannung auf 1,35V automatisch gesetzt wird. Ich würde auch ein CMOS-Reset durchführen und anschließend XMP laden.
 
Wow, irgendwie stresst mich der Schlafentzug durch unser Baby mehr als ich dachte^^. Gestern mit leerem Akku zum fotografieren,
beim RAM-Einbau geschlampt ...

Ich habe es jetzt geändert. So siehts nun aus. Denke das passt?

Also habe ich nicht wissentlich den RAM undervoltet und höchstwahrscheinlich damit die Abstürze verursacht?
 

Anhänge

  • IMG_0758111.JPG
    IMG_0758111.JPG
    39,1 KB · Aufrufe: 146
  • nach_bios_xmp.jpg
    nach_bios_xmp.jpg
    43,1 KB · Aufrufe: 165
Diese XMP-Scheiße mal wieder. Ich würde es auf JEDEC lassen.
Dann würde ich nen BIOS-Update machen.

gruß
hostile
Beitrag automatisch zusammengeführt:

Nein, RAM ist/war nicht undervoltet. JEDEC-Spezifikation sagt ja 1,20V @ 1333Mhz (real) / 2667 Mhz effektiv.

gruß
hostile
Beitrag automatisch zusammengeführt:

Aber probiere es doch einfach so aus.

gruß
hostile
 
@hostile

Hm, das hieße für mich, dass der Fehler mit der Einstellung jetzt wohl doch nicht behoben wurde und die Abstürze nach wie vor auftreten können? Menno.
 
Also habe ich nicht wissentlich den RAM undervoltet und höchstwahrscheinlich damit die Abstürze verursacht?
Könnte sein. Meine Rams laufen @1.35V, im ersten Bild waren deine auf 1.20V
 
@dooyou
Ja. Aber wie gesagt, probiere es einfach mal so aus. Kann ja sein, dass der Speicher mit mehr Spannung jetzt perfekt läuft.
Von Crucial ist dein RAM für das Mainboard freigegeben - habe ich eben nochmal gecheckt.

gruß
hostile
 
@Tzk @hostile @alle
Welche Werte brauchst du/ihr da um zu schauen ob die Werte der CPU evtl. nicht stimmen?

Was das betrifft bin ich leider ehrlich gesagt nicht wirklich im Thema. Ich übertakte/undervolte meine CPU nie.
Zumindest nicht bewusst ^^ Sollte eigentlich alles auf Standard sein.
 

Anhänge

  • SharedScreenshot4.jpg
    SharedScreenshot4.jpg
    56,8 KB · Aufrufe: 106
1) Bios Default Einstellungen laden.
2) CPU Spannung: Auto (sollte dann bei 1.300V sein ca.), Takt Auto = 3600MHz
3) Ram Spannung Auto: sollte 1.350V sein bei 2660MHz.
Wenn nicht: händisch oder über XMP auf 1.350V einstellen. Wenn XMP aktiviert ist sollte der Ram auf 3200MHz laufen. Wenn du händisch die Spannung änderst kann es sein dass der Ram auf 2660MHz bleibt.

Damit sollte die Kiste dann definitiv stabil laufen. Wenn du den stabilen Zustand hast, kannst du wieder anfangen mit Spannungen und Takt zu spielen, solltest aber auf jeden Fall die definitiv stabilen Werte aufschreiben als "Geht immer: Nullinie"
 
@2k5lexi
Warum sollte die Spannung bei 1,350V sein @ 2660Mhz? Gerade im automatischen Modus?
Weil dann (im Auto-Modus) wird ja eine JEDEC-Einstellung gewählt und dort ist 1,200V spezifiziert (siehst du im Screenshot oder im Datenblatt JESD79-4C zur Spezifikation).

gruß
hostile
 
bzgl netzteil, mal corsair ne email schreiben was sie dazu meinen könnte man trotzdem machen.
beim rest schauen ja schon die anderen ganz gut ;)
 
@2k5lexi
Warum sollte die Spannung bei 1,350V sein @ 2660Mhz? Gerade im automatischen Modus?
Weil dann (im Auto-Modus) wird ja eine JEDEC-Einstellung gewählt und dort ist 1,200V spezifiziert (siehst du im Screenshot oder im Datenblatt JESD79-4C zur Spezifikation).

gruß
hostile
Weil die Rams seitens Crucial mit 1.350V spezifiziert sind. Die Spannung nach Herstellerangabe würde ich denen auf jeden Fall geben.

:wayne: JEDEC, vor allem wenn wir Instabiles verhalten ausschließen wollen. Erstmal Spannung hoch, kann man ja immernoch runterdrehen.
 
Also JEDEC ist halt nur die Spezifikation auf die sich alle geeinigt haben um es überhaupt DDR4-Speicher nennen zu dürfen - aber klar, wen interessiert das schon ;)
XMP ist von Intel... desweiteren heißt es auf der Produktseite:
"Dank XMP 2.0-Unterstützung und vordefinierten Profilen können Sie übertakten, um die maximale Leistung herauszuholen. Wählen Sie das JEDEC-Standardprofil für normale Leistungen aus."

gruß
hostile
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh