NVMe Spiele-SSD fällt aus beim Zocken nach längerer Nutzung

schnipp959

Urgestein
Thread Starter
Mitglied seit
30.05.2011
Beiträge
1.678
Ich habe gerade ein komisches Problem.

An meinem PC habe ich (bis auf andere Lüfter, die an einem AC Octo hängen) nichts geändert in letzter Zeit.

In den letzten Tagen hatte ich ungewöhnliche Game-Crashs (Assetto Corsa Competizione über Steam, FH5 über MS Store).
Ab dem Zeitpunkt des Crashs wird die SSD zwar noch im Explorer angezeigt, kann aber keinen Ordner mehr öffnen, Spiele starten nicht und CrystalDiskInfo findet die SSD nicht mehr.
2023-06-12 22_36_08-Window.jpg


Muss den PC neustarten und dann ist alles wieder da, kann dann auch eine Weile (>30 Minuten) zocken, bis irgendwann wieder der Crash erfolgt.

Ich hatte erst meine Spiele SSD in Verdacht, Samsung PM9A1 2TB. Habe auch mal die SSD von M.2-Slot 2 (4.0 x4) in Slot 3 (4.0 x2; ist vom Board nur x2 angeschlossen) gepackt, aber der Fehler blieb.
Habe dann die SSD auf eine fast ungenutzte (so gut wie neue) 970 Evo Plus 2TB geklont, aber der Fehler existiert weiter, SSD ist aktuell in Slot 3. Die alte SSD war vorher in Slot 3.
Die System SSD in Slot 1 macht bisher keinerlei Fehler, wird aber auch eben nicht so stark genutzt.

Max. Temp. der SSD laut HWInfo ist auch unter 50°C, glaube also eher nicht an ein Temp.-Problem. Auf jeder meiner SSDs ist auch ein BeQuiet MC1 Pro Kühler verbaut.

Ich weiß halt gerade nicht wie ich den Fehler eingrenzen soll.
Ist ein Problem der SSD(s)? Liegt es am Mainboard? Der CPU? Oder ist es eine (BIOS-)Einstellungssache?!



PC: Ryzen 7 5800X3D, Gigabyte X570 Aorus Ultra, Radeon RX6800XT, 32GB B-Die RAM 3800, Crucial P5+ 1TB (System SSD), Win 10
CPU: UV mittels Curve Optimizer
 

Das neueste Bios sollte da immer drauf sein!

Max Memory Speed

2x1R

DDR4-3200

2x2R

DDR4-3200

4x1R

DDR4-2933

4x2R

DDR4-2667


Außerdem ist da DDR4-3800 schon gigantische Übertaktung, die man testweise da absolut immer zurück nimmt!
 
RAM OC könnte ich mal senken.

Mir ist aber gerade noch was anderes aufgefallen.
Ich hatte nach dem letzten Crash vorhin mal in HWInfo geschaut, da wurde als Max. Temp. der SSD 48°C oder 49°C angezeigt. Dann habe ich erstmal mein ganzes Problem dargestellt und somit war bis zum Neustart schon einige Zeit vergangen. Denke mal so 10 Minuten, ggf. mehr und habe dann den PC neu gestartet um einen Screenshot von CrystalDiskInfo zu machen.
Dort wurden mir immer noch 51°C der SSD angezeigt, obwohl sie schon so 10-15 Minuten nicht mehr genutzt wurde. Laut Aquasuite ist meine Raumtemp. bei 21°C, im Gehäuse sind es 26°C (habe CPU + GPU wassergekühlt mit MoRa, daher kaum Abwärme im Gehäuse)

Ich muss (morgen) mal den PC direkt neu starten sobald es zum Crash kommt und die Temperatur auslesen. Vielleicht ist es auch ein Temp.-Problem.

Es wundert mich nur, dass es jetzt auftritt. Da mein PC im Keller steht ist die Temperatur vielleicht 2°C höher als sonst und sie hängt jetzt besser im Luftstrom der Gehäuselüfter, vorher saß sie direkt unter der Graka.
Kann mir irgendwie nicht erklären warum die SSD (ggf.) jetzt so heiß wird.

Hier mal der Screenshot nach dem Neustart:

2023-06-12 22_59_13-Einstellungen.jpg
 
Ich würde ich mir mal den 24-Pin-ATX-Strom vorknöpfen. Wenn da der Kontakt schlecht ist, sabotieren die rücklaufenden Ströme der GPU die +3,3 V, und instabile / zu niedrige Versorgungsspannungen mögen SSDs nicht besonders. Teilen sich die zwei 8-Pins an der GPU einen Strang oder sind es zwei, wie es eigentlich sein sollte?

Wegen der Temperatur: Ich vermute mal, ASPM nicht aktiv. Meine hier hat gerade 39°C, mit Kühlkörper, aber ohne GPU drüber, minimaler Luftzug. Kühlkörper würde ich noch nicht mal als handwarm bezeichnen.

RAM- und IF-Übertaktung kann zu bizarren Tonknacksern / Aussetzern führen. Außerdem steigt jenseits von 3200 die Leerlauf-Stromaufnahme sprunghaft an, weil die VSOC automatisch erhöht wird. Zieh im Zweifelsfall lieber bei 3200 die Timings entsprechend an.

Wenn du richtig Pech hast, haben sich am Chipsatz irgendwo ein paar Lötstellen verabschiedet.
 
Zuletzt bearbeitet:
Teilen sich die zwei 8-Pins an der GPU einen Strang oder sind es zwei, wie es eigentlich sein sollte?
Muss ich noch mal nachsehen, aber ich meine ich habe zwei Stränge.
RAM- und IF-Übertaktung kann zu bizarren Tonknacksern / Aussetzern führen.
Das finde ich ja merkwürdig, es läuft alles einwandfrei und ohne (Mikro-)Ruckler, bis eben auf einen Schlag das Spiel crasht (so zwischen 30-60 Minuten). Dann ist auch die SSD nicht nutzbar.
Kann dann sofort neustarten und sie ist bei CDI und im Explorer dann auch wieder lesbar.
Tonknacken kann ich leider nichts zu sagen, da ich einen USB-Kopfhörer-DAC von Fiio nutze. Damit ist allerdings alles problemfrei.

Höherer Idle-Verbrauch über 3200 ist mir bekannt, allerdings hatte ich mal 3200 probiert und selbst da war der Verbrauch bei mir irgendwie nicht oder nur minimal niedriger (unter 5W Unterschied meine ich).
Wegen der Temperatur: Ich vermute mal, ASPM nicht aktiv.
Weiß ich nicht, aber sobald ich im Idle bin sinkt die Temperatur ja auch einigermaßen zügig. Hat durch den recht massiven Kühler halt eben eine gewisse Trägheit.
C: und H: sind bei mir noch M.2 SSDs, eine über bzw. unter dem GPU-Slot.

Wenn du richtig Pech hast, haben sich am Chipsatz irgendwo ein paar Lötstellen verabschiedet.
Ich hoffe mal nicht. Ersatz wäre halt recht teuer, da nicht viele Boards 3x M.2-Slots haben.
Hatte den Lüfter vom X570 Chip auf Silent stehen bisher, aber gestern auch mal Balanced probiert. Hauptsächlich um den Chipsatz auszuschließen, aber auch kam es zum Absturz.

Der PC hängt beim Crash halt generell für so etwa 3 Sekunden und dann läuft er "normal" weiter, halt nur die Spiele-SSD wird nicht erkannt.
 
Zuletzt bearbeitet:
Die SSDs temps sind schon sehr komisch - nur wenige C mehr unter last ohne Kühlung!?
SSD FW aktuell? Mal im anderen Slot testen?
 
Muss ich prüfen.

Die SSDs temps sind schon sehr komisch
C: und H: stecken halt direkt über/unter der Graka.

Die Problem-SSD habe ich schon in den Slot ganz unten gesteckt wo zumindest etwas mehr Luft drüber strömen sollte.

Komisch ist halt, dass ich FH5 ja schon seit Monaten spiele, auch mal 2-3h am Stück und es nie Probleme gab.
Jetzt machen zwei verschiedene SSDs (PM9A1 2TB, 970 Evo Plus 2TB) Probleme, beide in zwei verschiedenen SSD-Slots ausprobiert. Der Fehler wandert mit.
 
Und das einzige, was beide Slots gemein haben, ist (neben der Stromversorgung, die aber alle 3 betreffen würde) der Chipsatz. Andererseits hast du ja wiederum mit USB keinen Ärger.

Hast du vielleicht mal eine PCIe-Karte übrig, die du in einen der Chipsatz-Slots stecken könntest (PCIEX4 / PCIEX1)? Oder kann man alternativ vielleicht testweise die Geschwindigkeit der M.2-Slots runterschrauben? Dito ggf. bei der GPU.
 
Kann ich alles mal versuchen. Außer PCIe Karte, da habe ich gar nichts zur Verfügung.

Mein Plan ist also erstmal:
- RAM auf 3200
- M.2 Geschwindigkeit reduzieren
- Chipsatzlüfter auf höchste Stufe
- Gehäuselüfter auf höhere Drehzahl setzen
- im Falle eines Crashs direkt ein Neustart und mit CDI/HWInfo die Temperatur auslesen, ggf. auch mal per Hand die Temperaturen der Kühlkörper vergleichen
- ASPM Einstellungen prüfen

Edit:
- Alle Steckverbindungen vom Netzteil und Komponenten prüfen
- kontrollieren ob 2 Stränge vom NT zur GPU gehen
 
Zuletzt bearbeitet:
Nächste Auffälligkeit:
Wollte gerade den PC einschalten, aber selbst nach mehrfachem drücken der Power-Taste passierte nichts.
Netzteil war an, habe es aus- und wieder eingeschaltet und dann fuhr der PC ohne Fehler hoch.

Tja, so langsam befürchte ich, dass sich wohl irgendwas doch verabschiedet.
 
Tja, so langsam befürchte ich, dass sich wohl irgendwas doch verabschiedet.
Das wäre dann bei dem Fehlerbild wahrscheinlich das Netzteil. Es sei denn der 24-Pin hat ganz miserablen Kontakt. Da gesellt sich anscheinend zu einer +3,3V-Schwäche auch noch eine +5Vsb-Schwäche. Das riecht schon sehr nach irgendeinem Elkoproblem.

Was hast du denn für ein NT, und hat das evtl. noch Garantie?

Der zugehörige Luftfilter ist aber nicht verstopft, oder? Wenn das Ding vor sich hinbrutzelt, dürfte das die Alterung deutlich beschleunigen.
 
So, nachdem ich vorhin mit DDR4 3200 einen Absturz und Ruckler hatte bin ich wieder auf 3800 hoch.
Habe dann die SSD Kühler angefasst und keiner davon war mehr als Handwarm oder leicht drüber.

Ich konnte jetzt gut eine Stunde lang ohne Crash spielen. Die SSD-Temp. lag eigentlich weitgehend im Bereich um 42°C (+/- 1-2°C).

Was ich gemacht habe:
- SSD H: ausgebaut, die ist nämlich nicht so wichtig aktuell
- Chipsatz-Lüfter auf höchste Stufe gestellt
- Seitenfenster offen gelassen (nach SSD-Ausbau, glaube aber nicht, dass dies einen Einfluss hat, die Gehäuse-Temperatur war vorher auch im grünen Bereich)

Ich beobachte es weiterhin und werde heute Abend noch mehr spielen.

Was hast du denn für ein NT, und hat das evtl. noch Garantie?
Seasonic Focus PX 650W, müsste ca. 2 Jahre alt sein.
Filter vorm NT hat ein wenig Staub drauf, war aber nicht zu. Trotzdem mal abgesaugt gerade.
Habe per Schalter das NT aber auf Dauerbetrieb des Lüfters für geringere Temperaturen.
Beim Zocken bin ich so bei ca. 300W CPU+GPU, das ganze System dürfte dann so bei 400W liegen. (Mainboard, WaKü-Komponenten, sonst. Verbraucher)
 
Seasonic Focus PX 650W, müsste ca. 2 Jahre alt sein.
Das ist ja nun kein Billigteil, allerdings ist es vollmodular und bietet damit gleich an beiden Kabelenden Möglichkeiten für Kontaktprobleme. Am besten alles mal einzeln abziehen und neu verstöpseln und die Sache im Auge behalten.
 
So, Chipsatzlüfter wieder auf Balanced gesetzt, Gehäuse geschlossen und nach knapp 2h kein Crash.
Unterschied zu vorher ist aktuell nur, dass ich eine NVMe SSD (H:) weiterhin ausgebaut ist.

Werde es weiter beobachten und dann (über-)morgen mal die 3. SSD wieder einbauen. Mal sehen was dann passiert.
Wenn dann der Fehler wiederkehren sollte, dann hat entweder ein Slot einen weg oder der Chipsatz geht ggf. doch hops demnächst.

Die Spiele SSD hatte Maximalwerte von 47°C (typisch eher 40-44°C), Chipsatz 62°C, Gehäusetemp. max. knapp 30°C.
 
Habe gestern noch die Netzkabel mal neu gesteckt. Wobei an allen Steckern die Nasen alle eingerastet waren.
Die GPU ist auch über zwei Stränge angeschlossen.
Zusätzlich habe ich dabei gemerkt, dass das Kabel vom USB-C Frontheader etwas gespannt war und habe es mal abgezogen. (glaube aber nicht, dass es einen Unterschied macht)

Gestern und heute hatte ich soweit keinen Crash mehr.
Muss demnächst die SSD mal wieder in ihren ursprünglichen Slot stecken und noch mal probieren und dann auch mal wieder die entfernte SSD (H: ) wieder einbauen.

Habe heute trotzdem mal ein gebrauchtes Board (gleiches Modell) und Netzteil (BQ SP11 Plat 1000W) gekauft, einfach damit zur Not auch quertesten könnte.
Muss die nächsten Tage beobachten was das System so macht.

Erstmal Danke an alle für die Hilfe.
 
Hatte gestern ein ähnliches Problem bzw. immer wieder mal in Spielen Crashes. Gestern AC Syndicate installiert und obwohl das Spiel schon etliche Jahre alt ist, crashte das Spiel entweder beim Laden ins Spiel oder kurz danach im Spiel. Komischerweise war jedesmal auch die NVME auf der es installiert war nicht mehr erreichbar, sie wurde mir zwar noch unter Win angezeigt, aber HWInfo und auch das Herstellertool von WD konnte die NVME nicht mehr finden, Zugriff nicht möglich. Zuerst dachte ich die NVME ist defekt, konnte das aber mit ner anderen NVME reproduzieren. Meistens bin ich zurück auf den Desktop gecrashed, 3 - 4 Mal aber auch ein Restart des gesamten PCs.
Da ich meine 4090 im UV + 13700K mit nem 760W Netzteil betrieben habe, habe ich aufs Netzteil getippt.
Extremes UV der 4090 verhinderte einen Crash, sobald ich die Karte wieder auf normale Werte geschraubt habe, also über 350W, kamen die Crashes zurück.
Hab mir dann gestern ein neues ATX 3.0 Netzteil mit 1050W besorgt und siehe da, alles läuft wieder.
Obwohl ich vorher keine Probleme mit dem 760W Netzteil hatte und damit auch Spiele gezockt habe die weit mehr als 350W gezogen haben und immer spielen konnte, hat das Netzteil anscheinend langsam seinen Geist aufgegeben. Obs nun die aktuellen Temperaturen schuld waren oder das betreiben des Netzteils an der Kotzgrenze, keine Ahnung, denke die Kombi aus beidem. Hab eh schon länger auf ein neues Netzteil geschielt.
 
Dein Problem kenne ich nur zu gut aus (mehrfacher) eigener Erfahrung. ;)

bug.png

Muss demnächst die SSD mal wieder in ihren ursprünglichen Slot stecken und noch mal probieren und dann auch mal wieder die entfernte SSD (H: ) wieder einbauen.
Beobachte das mal und wenn auf der SSD im gleichen M.2 Slot irgendwann mal wieder kein Zugriff statt finden kann (tritt temporär auf), dann schau mal, ob zeitgleich in der Windows Datenträgerverwaltung bei der betreffenden SSD an der Partition noch eine unlocated 1MB Partition angehangen wird die erst wieder verschwindet, sobald mal wieder die SSD erkannt wird / Zugriff möglich ist.
Wenn dem so ist, dann ist die Wahrscheinlichkeit hoch, dass der M.2 Slot beschädigt ist. Hatte das (siehe oben) mittlerweile schon bei zwei Boards (ROG Strix B560 WiFi Gaming-F / MSI Pro Z690-A WiFi).
In beiden Fällen hatte der Hersteller den Fehler auch entsprechend bei den M.2 Slot lokalisiert. Asus hatte sich bzgl. der RMA ins Höschen gemacht (hatte im Endeffekt den Umtausch über den Händler abgewickelt weil mir das zu dumm war, mit den Kaspar da von Asus frontal zu gehen) MSI hat die RMA vorbildlich durchgeführt und schnell - ohne wenn und aber.
 
Zuletzt bearbeitet:
Gut, versuche dran zu denken falls/wenn der Fehler wieder auftritt.

Komisch ist halt, dass es in zwei verschiedenen Slot bei mir aufgetreten ist mit verschiedenen SSDs. Allerdings gehen beide Slots wohl über den Chipsatz.
 
Wenn der/die Slot/s eine Macke hat/haben, dann kannst du auch 100 SSDs testen, werden alle temporär diesen Bug generieren. ;)

ps: Hier ist übrigens der Thread wo ich beim ersten Board das Problem hatte. Ersatzboard anderer Marke war dann alles wieder einwandfrei.
 
Wollte auch eher sagen, dass es nicht auf den einen Slot begrenzt ist bei mir, aber wohl beide gleich angebunden sind.
Von daher würde ich jetzt eher weniger auf den Slot tippen und eher Richtung Chipsatz gehen, falls es ein Problem des Boards ist.

Aber gestern halt einige Stunden FH5 und ACC gespielt ohne Fehler.
 
Bei mir waren auch alle Slots die am Chipsatz hängen betroffen. Hab bis auf meine M.2 die an der CPU hängt, alle M.2 (4 Stk.) munter durchgetauscht und da ich das Problem reproduzieren konnte, jede M.2 mit dem Spiel in jedem Slot getestet. Immer Crash.
Als ich dann eine M.2 draussen gelassen habe, lief es erstaunlicher Weise kurz stabil (dachte der Slot bzw. das MB hat einen weg) aber dann folgte schnell der nächste Crash.
Du hast ja ein neues Netzteil bestellt, damit würde ich als erstes Anfangen. Es gibt im Netz den einen oder anderen Bericht, z.B. auf Reddit, der die gleichen Probleme schildert und bei vielen waren es die Netzteile.
Einer schrieb sogar, bei ihm waren gesleevete Verlängerungen vom Netzteil das Problem.
 
Von daher würde ich jetzt eher weniger auf den Slot tippen und eher Richtung Chipsatz gehen, falls es ein Problem des Boards ist.
Erklär mir mal bitte, wie ein Chipset zwei von meinetwegen drei oder vier M.2 Slots korrupt schalten soll? Gilt für Netzteilbugs genau so. :unsure:

..bei dir scheinen halt "zufällig" mehrere M2 Slots betroffen zu sein und wie schon zuvor erwähnt -> teste das noch einmal bis der Bug wieder auftritt und schau dann mal in der Datenträgerverwaltung.
Hast du das Phänomen wie schon in Post #18 erwähnt, dann weißt du es ziemlich sicher. Wenn nicht, dann probier es meinetwegen mit einen anderen Netzteil.
 
Zuletzt bearbeitet:
Ja der Slot 1 geht über die CPU, die anderen über den Chipsatz. Es kann natürlich sein, dass der Chipsatz unzureichend mit Saft beliefert wird, aus welchem Grund auch immer (NT zu schwach, irgendeine Volt-Schiene versagt, NT defekt, NT überhitzt, etc) und darum fallen dann die Slots aus... kann sein, muss aber nicht. Im schlimmsten Fall ist das MB defekt.
 
Schlimm geht so.
Habe ~235€ gezahlt für (gebrauchten) Ersatz, ca. 105€ für MB und 130€ fürs NT. Sollte die nächsten Tage geliefert werden.

Dann wäre ich zumindest vorbereitet, falls ich davon doch nichts brauche kann ich es ja auch wieder verkaufen.
 
Mal ein kleines Update.

Bisher ist es zu keinen wiederholten oder neuen Problemen gekommen. Der PC funktioniert ohne Fehler aktuell, eigentlich seit ich die Netzteilkabel alle neu gesteckt habe.

Mittlerweile ist die Spiele-SSD wieder vom unteren in den mittleren Slot gewandert und die dritte SSD ist auch eingebaut seit ein paar Tagen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh