Bluescreen ohne Minidump, M.2 defekt?

Haithabu84

Experte
Thread Starter
Mitglied seit
28.07.2015
Beiträge
192
Hallo,

ich habe hier ein ungewöhnliches Problem. Die letzte Monate keine Lust gehabt zum Zocken und der Rechner wurde hauptsächlich zum Surfen, Bildbearbeitung und Programmierung verwendet. Jetzt, heute, wollte ich mal nach langer Zeit ein Game anwerfen und prompt bekam ich einen Bluescreen. Leider war die Meldung so schnell weg das ich sie nicht lesen konnte. Nach erneutem Anlauf, konnte ich im Game bisschen umher klicken. Zack wieder Bluescreen. Manchmal konnte ich einer Online-Session joinen und bisschen umher laufen, danach wieder. Ein Muster war nicht erkennbar, außer das es jedes Mal ingame passierte. Auch unterschiedliche Games, jedes Mal dasselbe. Nur der Zeitpunkt unterscheidet sich.

Beim Surfen oder jetzt auch hier beim Verfassen des Threads, keine Probleme. Zwischenzeitlich dachte ich das es an den SSD-Laufwerken liegt. Crystaldiskinfo sagte aber bei allen verbauten Laufwerken 100%. Egal von welchem Laufwerk aus ich die Games gestartet habe, der Fehler blieb. Ich hatte vor paar Wochen schonmal einen ähnlichen Fall im November, dachte mir nichts weiter dabei. Kurz darauf habe ich eine neue NVMe (990 Pro) eingesetzt. Da dachte ich wiederum an fehlende Kompatibilität und habe das BIOS geupdatet. Brachte aber auch nichts. Temps soweit ich das beobachten konnte, sahen eigentlich gut aus. Zur Sicherheit dann noch alle Einstellungen vom Bios und der Grafikkarte auf Defaults zurückgesetzt.

Mit Bluescreeninfo nachgesehen ob es einen Minidump gibt, nichts. Es sind nur zwei von letzten Jahr November verzeichnet. Wie oben bereits geschrieben. Da habe ich dann auch die Treiber aktualisiert, direkt von der Gigabyte-Homepage. Da war unter anderem ein Fehler mit der storport.sys verzeichnet. Jetzt ist meine Vermutung das irgendwas mit den Storage-Treibern nicht stimmt.

Hat jemand eine Idee wie man dem Problem auf die Schliche kommen kann?

System:

Ryzen 3700X
Gigabyte Aorus Pro X570 (Bios F37, Chipset-Treiber 5.11.02.217)
32Gb RAM
GTX1080
1x Samsung 990 Pro NVMe
1x 970 Evo Plus NVMe
1x 860 Evo Sata
1x Transcend TS1TSSD370S

Grüße
 
Lösung
Ich habe letzte Woche meinen Ersatz erhalten. Leider ist bei diesem Exemplar das Problem noch schlimmer. Vorher war es wenigstens so, das marginale Schreibprozesse möglich waren. Hier meldet sich das Teil, schon bei gerinsgster Belastung ab und ist selbst unter Windows nicht mehr sichtbar. Slots getauscht, selber Effekt. Dieses Exemplar scheint eine noch ältere Charge zu sein, da hier noch ein Firmware-Update durchgeführt werden musste auf die Version 4B2QJXD7, da war meine vorherige bereits auf dem Stand.

Zwischenzeitlich hat mir ein Freund sein Exemplar zur Verfügung gestellt zum Testen. Diese hatte er vor einigen Wochen neu erworben. Stellt sich raus, das diese einwandfrei läuft. Es verdichten sich die Indizien das Samsung in frühen...
Mit Bluescreeninfo nachgesehen ob es einen Minidump gib
Schau mal ob das überhaupt aktiviert ist zum abspeichern

1710707666053.png
 
Der war gesetzt, habe ihn rausgenommen und probiere nochmal vielleicht zeigt er dieses Mal eine brauchbare Fehlermeldung an.
 
Er sagt:

WHEA_UNCORRECTABLE_ERROR

Laut meiner Kenntnis beschreibt es ein beliebiges Hardware-Problem. Es wurde zu dem Zeitpunkt auch nichts in der Ereignisanzeige hinterlegt, geschweige ein Minidump. Das lässt vermuten das Windows absolut keinen Zugriff mehr auf das Storage hat. Ich probiere mal ein chkdsk.
Beitrag automatisch zusammengeführt:

Nach Neustart und Durchlauf chkdsk, hat er irgendwas repariert. Ging relativ schnell. Plötzlich startet er noch schneller als vorher und scheinbar hat es auch mein Problem behoben. Ich konnte jetzt 10 Minuten lang mein Game zocken ohne BSOD. Das war vorher nicht möglich. Ich bin also mal vorsichtig optimistisch, das es das gewesen ist. Vermutlich haben irgendwelche Überbleibsel des Treibers der Vorgänger SSD Probleme gemacht. Aber das ist nur eine Vermutung.

Ich beobachte weiter. Wenn nicht, melde ich mich wieder. Danke.
 
Zuletzt bearbeitet:
Ok. Nachdem ich heute wieder mal zocken wollte und das Game wieder auf die M.2 gepackt habe, kam der Bluescreen direkt nach Start. Die einzige Möglichkeit dich jetzt noch sehe: Win10 komplett neuinstallieren.

Wenn es danach immer noch nicht funktioniert. Muss ich wohl davon ausgehen, das etwas mit dem Mainboard nicht stimmt. Eine defekte SSD, kann vorkommen, aber zwei und eine davon ist neu, sehr unwahrscheinlich. Kühlung könnte auch noch ein Thema sein, wobei die Temps immer so um die 55°C liegen.

Ich werde jetzt mal eine Sicherung starten und dann Win10 komplett neuinstallieren.
 
Schau parallel auch, ob bei dir OC/UV betrieben wird, was RAM und CPU angeht. Ggf. auch die Chipset/GPU-Treiber alle platt machen und komplett neu installieren. Und zum Schluss natürlich dein Netzteil und GPU überprüfen, denn scheibar schmierst du nur bei Gaming ab und sonst nicht.
 
USB-Geräte stecken nur meine Maus und meine Tastatur dran. Die Tastatur ist etwas in die Jahre gekommen und gehört eigentlich auch ausgetauscht, die hatte auch immer wieder Probleme mit den LEDs. Ich werde die mal abstecken und eine andere dran machen, nur um sicher zu gehen.

Das mit Spiel auf SATA oder M.2 müsste ich nochmal genauer testen.

OC/UV hatte ich aktiv, auch an der Graka. Nachdem die Probleme losgingen habe ich aber BIOS und alle Profile zurückgesetzt, weil das auch gleich meine erste Vermutung war. Komisch ist halt das im ganz normalen Desktop-Betrieb, auch mit Schreib- und Lese-Prozessen auf der SSD, keine Probleme gibt. Das wundert mich sehr.

An Graka oder Netzteil glaube ich auch nicht, weil dazu wäre zumindest Windows in der Lage gewesen zumindest einen Minidump abzulegen. Bzw. bei Netzteil, wäre es sofort ausgegangen. Macht für mich jetzt weniger Sinn.

Am Ende wird es nichts bringen, um sicher zu gehen das nicht irgendwelchen Treiberleichen mir dazwischen funken, muss ich neuinstallieren und dann von einem komplett sauberen Betriebsystem testen.
 
Nochmal weiter getestet: Das Spiel jeweils auf SATA und NVMe getestet. Auf der SATA schmiert er Rechner ebenfalls mit BSOD ab. Aber ich kann deutlich länger im Game sein. Während bei der NVMe schon teilweise nach paar Sekunden im Menü der BSOD kommt, konnte ich bei der SATA immer öfter einem Spiel joinen und paar Minuten herumlaufen.

Also entweder ist das Last oder Temperatur abhängig, Meine Vermutung ist das nach einer bestimmten Last auf der NVMe oder PCIe-Bus das System instabil wird.

Als nächstes würde ich alles sichern und Rechner neuinstallieren, einfach um schon vorher auszuschließen das irgendwelche alten Treiber mir einen Streich spielen.
 
Such mal im Bios die PCI-E Einstellung die auf automatisch wahrscheinlich gesetzt ist. Änder die mal auf die kleinste verfügbare option
Was für ein Netzteil hast du verbaut ?
 
Windows 10 frisch neuinstalliert. Nur aktuelle Win Updates, Nvidia-Treiber und Steam inklusive zwei verschiedene Spiele. Problem bleibt. Bluescreen nach wenigen Minuten ingame. Egal von welchem Festspeicher. Ob NVMe oder SATA.

Ich konnte noch eine Beobachtung machen: Ich hatte am zweiten Bildschirm den Task-Manager offen und konnte die Auslastung der 990 Pro sehen. Kurz bevor der BSOD kommt, ist sie meist bei 100% Last.

Netzteil ist ein Sea Sonic SS-760XP2. Eigentlich kein billiger China-Knaller und hat mir über Jahre hinweg treue Dienste geleistet. Ich könnte mal alle anderen NVMe und SATA abstecken bzw. ausbauen und schauen ob es etwas bewirkt. Aber ich hatte vorher schon zwei NVMe und zwei SATA verbaut, da gab es diese Probleme nicht.
 
Zuletzt bearbeitet:
mehr wie 7 Jahre ?
Laut Rechnung 2013 gekauft. Aber das Fehlerbild spricht nicht gerade für Netzteil-Probleme. Da würde ich erwarten das er aus geht und mir nicht noch einwandfrei den Bluescreen präsentiert. Vorher hatte ich auch zwei Gen3 NVMe drin und die liefen einwandfrei über Jahre. Soll die Gen4 auf einmal soviel mehr Strom ziehen?

Das würde bedeuten das wenn ich alle restlichen SATA und die andere NVMe entferne soll es gut laufen?

Ich habe noch einen anderen Verdacht, weil ich auf diesen bei meiner Recherche mehrmals gestoßen bin: Kann es sein das die Gigabyte X570 nicht sonderlich gut klar kommen mit Misch-Konfiguration bei den PCIe? Laufen bei Aorus Pro bei NVMe-Slot über die CPU direkt oder ist einer von denen über den Mainboard-Chipsatz angebunden? Wenn ja, welcher von beiden?

Die PCIe-Slot Konfiguration im BIOS hatte ich überall gerade jeweils fest auf Gen4 und Gen3 gestellt. Jedes Mal BSOD.
Beitrag automatisch zusammengeführt:

Habe gerade mal den maximalen Strom verglichen von den drei NVMe die ich hier zur Verfügung habe:

Ich bin schockiert... aus 3.3V ziehen die über 2 Ampere. Alter Falter.

960 Evo 256Gb 2.3A => War vorher drin und wurde gegen die 990 Pro getauscht
970 Evo Plus 1Tb 2.7A
990 Pro 1Tb 2.2A

Wenn man rein nach dem maximalen Strombedarf geht, dann sollte es eigentlich kein Problem sein, wenn er vorher schon die 960 über lange Jahre gestemmt hat. Natürlich kann es sein das die neuere Technik im Mittel und unter Last mehr von den möglichen 2.2A zieht, als es hätte die 960er gemacht. Aber das kann ja ehrlich nicht das Problem sein.

Thema Thermik: Zugegebenermaßen ist die Wahl der NVMe-Steckplätze nicht optimal, die werden hier direkt von der Grafikkarte bedeckt. Ich könnte die Grafikkarte allerdings einen Slot weiter nach unten verbannen. Vielleicht sind die Temps zu hoch.
 
Zuletzt bearbeitet:
Ich bin schockiert... aus 3.3V ziehen die über 2 Ampere. Alter Falter.
Ich auch aber von dir. :coffee2:
Ich war mit der Frage nach dem Netzteil eigentlich schon bei der Grafikkarte (was mir aufgefallen ist das du das Netzteil vergessen hast im anfangspost zu erwähnen oder eher absichtlich?) nachdem du mit umstecken der m2 /sata immer noch den Fehler bekommst. Aber ich merke schon das mir das zu anstrengend ist :d :d :d :d
Wünsche dir natürlich viel Glück beim finden dies Problems leider bin ich hier raus :wink:
 
Zuletzt bearbeitet:
Du hast jetzt nicht wirklich die Amper von dem m2 gemessen und verglichen nach der Frage mit den Netzteil oder ?
In dieser verschwendeten Zeit genauso wie die Windows Installation... egal
Ich wünsche dir viel Glück beim finden dies Problems leider bin ich hier raus :wink:
Wenn du auf das Netzteil hindeutest, muss ich jeden Strohhalm greifen, wenn die Sachlage unklar ist.

Ich habe es zwischenzeitlich selbst herausgefunden. Es ist ein Thermik-Problem.

Die NVMe schaltet ab 60°C ab, wenn sie unter Last kommt reichen wenige Sekunden und die hat die Abschalt-Temperatur erreicht. Ich habe die Grafikkarte einen Slot runter gesetzt, jetzt kommt direkt Luft ran. Konnte somit dauerhaft zocken bei Temperaturen um die 48°C. Im Endeffekt hätte ich mir die Neuinstallation tatsächlich sparen können, aber wie eben gesagt, die Lage war unklar. Zumal es vorher Jahrelang keine Probleme gab in diesem Setup. Die 990 Pro scheint in den Schwankungen bei den Temps etwas "hitziger".

Wie ist das mit diesen "Thermal Guards" von Gigabyte? Kann man das Pad tauschen gibt es dafür irgendwo Ersatz?
Beitrag automatisch zusammengeführt:

Ich auch
:coffee2:
Wünsche dir viel Glück beim finden dies Problems leider bin ich hier raus :wink:
Wer wird denn da gleich bockig werden? Was wäre den deine Herangehensweise gewesen? Außer auf das Netzteil hinzuweisen, ist ja auch nicht mehr rum gekommen bei dir.
 
Zuletzt bearbeitet:
Ich habe es zwischenzeitlich selbst herausgefunden. Es ist ein Thermik-Problem.
Natürlich wenn man denkt die 990 pro schaltet sich bei geschmeidigen 60 Grad ab :wink:

ist ja auch nicht mehr rum gekommen bei dir.

Das mit Spiel auf SATA oder M.2 müsste ich nochmal genauer testen.
komisch angeblich kommt ja nix bei mir ?!
Leider falsch so wie deine Temperatur Diagnose :lol:
Du hast das Problem immer noch nicht gelöst mit dem heruntersetzen der Grafikkarte läuft jetzt die Karte auf 3.0 was du ja angeblich im Bios schon versucht hast
 
Zuletzt bearbeitet:
Zumindest funktioniert es vorerst, konnte jetzt eine Stunde lang zocken, warum auch immer. Das ging vorher nicht.

Aber wenn ich mich in anderen Foren so umsehe sind die Probleme vor allem mit der 990 Pro weit verbreitet. Da wird oft von Random BSOD berichtet, meist ohne konkretes Ergebnis.
 
Im Endeffekt werde ich auch die Thermal Guards demontieren. Das Problem bei denen ist, das die Pads nicht richtig aufliegen. Die Teile sind nicht die hohe Ingenieurs-Kunst. Die Wärme staut sich da eher, als das sie abgeführt wird.

Des weiteren habe ich noch das hier gefunden: https://www.reddit.com/r/techsuppor...samsung_990_pro_keeps_disconnectingmaking_pc/

Da wird berichtet das die NVMe einen DIsconnect vollzieht. Solange es kein Systemlaufwerk ist, sind die Auswirkungen überschaubar, wenn nicht bekommt man sofort BSOD und dadurch aber eben keinen Minidump. Letztendlich wurde sich beholfen indem man dort den Power Mode in der Magician Software aktiviert. Das habe ich jetzt ebenfalls mal gemacht und werde weiter beobachten. Ansonsten geht das Teil wieder zurück.
 
Meine 970 ging bis 80 Grad am Anfang. Ich merkte da nichts von einer Abschaltung. Eine Drosselung setzte ein, aber keine Abschaltung. Aufkleber habe ich entfernt. Fand sowieso seltsam, dass die so viel Hitze entwickelt und Samsung dann, ausgerechnet auf der Seite, die nach aussen zeigt, auch noch zugeklebt hat. Dann merkte ich aber erst, dass unter dem Aufkleber sich eine sehr dünne Schicht Kupfer befindet. Da musste ich lachen. Was soll so eine dünne Schicht bringen, die auch noch mit Papier zugeklebt ist? Habe auf die GK dann einen 12er Lüfter hochkant gestellt, der sehr langsam die SSD und Ram anpustet.
Bluescreens hatte ich viele, als ich mit der neuen CPU und Ram experimentiert habe. Meist gab es einen blauen Schirm, aber sehr oft keine MiniDump zum Auslesen. Oft hatten sich manche Anwendungen komplett zurückgesetzt und paar Mal sogar die Boot Datei zerschossen. Sowas gabs es früher mit Festplatten nicht.

Vielleicht kannst du ja testweise auf die Transcend TS1TSSD370S als Systemplatte umsteigen?

ps: die Systemplatte kann sich doch gar nicht abschalten, da dorthin und von der permanent was gelesen und geschrieben wird.
Bild_2024_03_24_11_39_26_860.png
 
Zuletzt bearbeitet:
Die nimmt sich halt raus. Die Leute schreiben von Disconnects, möglich das die vom Controller initiiert werden. Die Bluescreens sind jetzt weniger häufig nach den letzten Änderungen, aber noch existent. Ist echt ein Ding was sich da Samsung leistet. Aber bei mir scheinen die 60°C so eine magische Grenze.

Ich habe das OS jetzt auf die 970 umgesattelt. Die läuft auch deutlich wärmer, aber bis heute Mittag (ungefähr 3 Stunden) keine Bluescreens. Manche Schreiben auch direkt das man das OS besser auf eine andere Platte packt.
Beitrag automatisch zusammengeführt:

Also es liegt definitiv an meinem Exemplar da muss irgendwas defekt sein. Jetzt ist sie schon keine OS-Platte mehr, wollte sie jetzt als Game-Platte verwenden. Ich hatte das Spiel vorher noch auf der 970, habe da etwa zwei Stunden durchgehend gespielt. Wollte nun per Steam die Spieldateien auf die 990 verschieben: Festplattenschreibfehler.

CrystalDiskInfo führt das Laufwerk auch nicht mehr. Samsung Magician sagt ebenfalls das keine Verbindung zur NVMe möglich ist.

Unter Windows komme ich auf das Laufwerk nicht mal mehr drauf:

Im Endeffekt ohne nennenswerte Last, ohne das Daten drauf liegen, Disconnect. 1A Qualität
Screenshot 2024-03-24 132226.png
 
Zuletzt bearbeitet:
Das Problem hab ich mit einer 980 Pro.

Hab die seitdem im langsamen Slot stecken da ich auch die Temperaturen im Verdacht habe. Da der 2ste unter der Grafikkarte sitzt und auch keinen Kühler dran hat.

Ich hab davon 2 die erste sitzt weiter oben mit Kühler des Mainbaords dran und läuft ohne Probleme.

Beide neu im November gekauft. Sollte es ein Defekt sein werde ich die zurückgeben bei Saturn und mich von Samsung SSD trennen.
 
Mal den Samsung NVMe Treiber probiert von früher ? Glaube ehrlich gesagt nicht das die Temperaturen zu hoch sind, die stecken einiges Weg und werden sogar erst ab bestimmen Temperaturen überhaupt kalkuliert gedrosselt, weil sie das auch auf Dauer problemlos vertragen können.

"PowerSettingsExplorer" kann ich dir noch an Herz legen da kann man einige NVMe Settings noch sichtbar machen und zusätzlich zum Samsung Magician noch etwas die Wakeup Latenzen und Power Einstellungen manipulieren.
Das ne SSD bluescreened Aufrund von 60°C außer sie ist tatsächlich defekt halt ich für Unsinn, NAND Flash brauch sogar etwas Temperatur für optimale Funktionalität wenn die richtig gehämmert werden sind sogar Temperaturen über 100°C bei der 990 Pro beispielsweise völlig normal.
 
Das ist halt das was ich beobachtet habe: Wenn die NVMe unter Last 100% kam und 60°C erreicht hatte, war Feierabend. Ob das nun miteinander zusammenhängt, kann ich nicht mit Sicherheit sagen. Komischerweise lief sie dann wieder Mal für eine Stunde mit Zocken und Last bei 30% mit Max 48-49°C wieder ganz anständig, bevor dann wiederum der BSOD kam. Konnte man gut mit HWMonitor beobachten. Total random.

Vorher hatte ich nur die Treiber vom Chipsatz des Boards und den Microsoft-Standardtreiber für NVMe-Controller installiert, der war auch immer aktuell. Da gab es auch schon die Probleme. Später dann mit dem Samsung NVM-Treiber 3.3 von 2020 genau das gleiche Problem, keine Besserung. Andere Versionen haben ich nicht gefunden.

Fakt ist bisher nur eines: Es liegt an der neuen 990 Pro.
Beitrag automatisch zusammengeführt:

Immerhin bekomme ich jetzt keinen Bluescreen mehr, weil Windows nicht gleich komplett sein Dateisystem unter dem Arsch wegggezogen bekommt. Sondern das Spiel beendet sich, meist mit Schreibfehlern. Interessanterweise kann ich im Dateisystem dieses Mal herumklicken, aber es kann nichts mehr geschrieben werden. Die Ansicht ist aber nur noch im Cache. Die NVMe ist schon zu diesem Zeitpunkt komplett vom System disconnected. Das Teil geht zurück.

Screenshot 2024-03-24 172831.png

Screenshot 2024-03-24 173445.png
 
Zuletzt bearbeitet:
Mach dir mal Memtest86 aufn USB Stick und lass kurz (3-10 min) laufen.

Defekter RAM der dir nach und nach das Filesystem zerschießt?
Been there, done that, seit dem gibts ECC für mich. :d

Würde aber nicht erklären warum die Fehler derzeit nur mit der 990 auftreten, aber nicht mit 970. Denkbar ist natürlich ein Bitflip durch defekten RAM. Aber dann würde es zwangsläufig auch mit den anderen Laufwerken auftreten. Vorher kam der Bluescreen bei allen Laufwerken, weil Windows auf der 990 lag. Nach Disconnect war dann ganze Filesystem weg und schwupp BSOD. Jetzt wo das OS auf der 970 liegt, konnte ich keinen Bluescreen mehr beobachten.
 
Lass sie vom Händler austauschen.

Werde ich mit der 980 Pro nun auch tun. Gestern wieder ausgefallen.
 
Das stimmt, wobei du für Memtest nur 10 Minuten und den kleinsten billigsten USB stick brauchst, den du hast...

... aber wenn dus eh soweit eingegrenzt hast, dann schick sie halt zur Garantie, so alt ist sie ja nicht...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh