4090 FE - Crash to Desktop mit nvlddmkm Fehlermeldung

Martin7

Enthusiast
Thread Starter
Mitglied seit
16.09.2011
Beiträge
2.069
Ort
Steiermark
Hi,

Hab seit Ende Jänner das Problem das während dem Spielen und Benchmarks (Sea of Thieves, Tarkov, 3DMark TimeSpy) Blackscreens auftreten und man wieder auf dem Desktop landet. Im Event-Viewer sind dann diese nvlddmkm-Einträge ersichtlich, Bluescreens gab es nie bis jetzt.

Bevor das Problem auftrat gabs keine Veränderungen am System (GPU hat davor 11 Monate in einem anderen Rechner mit nem 13600K gewerkelt ohne Probleme und wurde dann im Dezember 23 ins aktuelle System eingebaut)

Ende Jänner trat das Problem für 4 Tage auf, verschwand dann wieder für ca 1 Monat und seit ein paar Tagen tritts wieder auf.

System:
  • GPU: 4090 FE mit originalem Nvidia-Adapter verkabelt - Stecker bereits kontrolliert und nachgesteckt, alles in Ordnung, keinerlei Anzeichen von geschmolzenen Plastik etc.
  • Motherboard: Asus ROG STRIX B650E-E
  • CPU: 7800x3D
  • PSU: Seasonic Prime TX-1000
  • RAM: G.SKILL Trident Z5 NEO schwarz DIMM Kit 32GB - F5-6000J3038F16GX2-TZ5N (in A2/B2 installiert)
  • Storage: 2x Samsung 980 Pro (in M2_1 und M2_2 verbaut)
  • Gehäuse: Corsair 7000D Airflow
Treiber/Firmware:
  • GPU: Derzeit den aktuellsten 551.61 Treiber installiert - trat auch mit anderen älteren Treibern auf
  • Bios: Derzeit das aktuellste Bios installiert (2413)
  • Windows 23H2
Bisher versucht:
  • Memtest86 durchlaufen lassen mit 4 passes - keine Fehler
  • Expo deaktiviert/Bios komplett zurückgesetzt (Clear CMOS Button) - keine Verbesserung
  • Treiber mit DDU im Safe-Mode entfernt und neu installiert - keine Verbesserung
  • Power Management im Nvidia Control Panel auf Max. Performance gesetzt - keine Verbesserung
  • Im Bios Pcie-Slot manuell auf Gen4 gesetzt - keine Verbesserung
  • Nvidia kontaktiert - mit deren Tools Treiber nochmals komplett entfernt und neu installiert - keine Verbesserung
  • nvlddmkm.sys File alle Zugriffs-Berechtigungen erteilt
  • Temperaturen beobachtet - ist alles im Rahmen und nix kritisch
  • Karte deinstalliert, Kontakte mit Iso-Alkohol gereinigt
Einzig Windows hab ich noch nicht neu aufgesetzt...

Meine Fragen;
Was mich derzeit stutzig macht ist das zB.: Furmark einwandfrei läuft und in 3DMark Timespy oder Speedway gleich mal abstürzt - Furmark belastet die GPU doch noch stärker als 3DMark oder?
Im Netz findet man einiges dazu, jedoch unterscheiden sich die Fehler oft, bei manchen tritt das Problem selbst am Desktop beim surfen auf, bei anderen drehen die Lüfter hoch (da scheints wohl an nem Custom-Kabel eher zu liegen etc).

Was meint ihr wie groß die Wahrscheinlichkeit ist das es wirklich an der GPU liegt? Heute beim ersten einschalten lief der erste TimeSpy Benchmark durch, Leistung passt jedenfalls würde ich sagen, weitere Benchmarks danach stürzten dann wieder ab.

Bin weiterhin mit Nvidia in Kontakt und so wie es derzeit aussieht muss die GPU lt. Nvidia eingeschickt werden.

Vielen Dank
 

Anhänge

  • Screenshot 2024-02-29 194847.png
    Screenshot 2024-02-29 194847.png
    8,5 KB · Aufrufe: 58
  • Screenshot 2024-02-29 160646 - Copy.png
    Screenshot 2024-02-29 160646 - Copy.png
    255,1 KB · Aufrufe: 52
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Kein Riser-Kabel, direkt im PCIe-Slot installiert mit Stützen das die GPU nicht durchängt.

Ja die Games stürzen ab bzw. frieren ein, 3DMark beendet nur den Benchmark mit der Fehlermeldung "Error Occured".

Edit: Im Computerbase hat jemand von einem ähnlichen Problem berichtet welcher dann die GPU zu NBB eingeschickt hat - dort wurde dann der Kaufpreis rückerstattet da GPU nicht reparierbar.
 
Wen einschicken eine Option ist, warum nicht.
Du könntest eventuell probieren ob die Karte mit leicht gesenktem Takt stabil läuft. Falls noch nicht getestet...
 
Natürlich, Nvidia sagt sie schauen sich noch die übermittelten Files an (System-Info und dxdiag) aber wenn dort nichts auffällig ist scheints wohl ein HW-Problem zu sein und überraschenderweise hat sich Nvidia hier im Support als recht angenehm und leicht kompetent bis jetzt gezeigt - wenn Nvidia sagt einschicken mach ich das natürlich.

Im Netz liest man halt viel bzw. werden viele unterschiedliche Fehler die auf den ersten Blick gleich erscheinen auf einen Haufen geworfen. Gibt Aussagen das diese nvlddmkm-Abstürze reine Software-Geschichte ist, andere konnten solche Fehler dann durch Ram-Tausch beheben etc - schlussendlich werde ich mich auf Nvidia verlassen müssen/können.
 
Natürlich, Nvidia sagt sie schauen sich noch die übermittelten Files an (System-Info und dxdiag) aber wenn dort nichts auffällig ist scheints wohl ein HW-Problem zu sein und überraschenderweise hat sich Nvidia hier im Support als recht angenehm und leicht kompetent bis jetzt gezeigt - wenn Nvidia sagt einschicken mach ich das natürlich.

Im Netz liest man halt viel bzw. werden viele unterschiedliche Fehler die auf den ersten Blick gleich erscheinen auf einen Haufen geworfen. Gibt Aussagen das diese nvlddmkm-Abstürze reine Software-Geschichte ist, andere konnten solche Fehler dann durch Ram-Tausch beheben etc - schlussendlich werde ich mich auf Nvidia verlassen müssen/können.
Hast Du es denn mal mit einer neuen Windows Installation auf einer freien SSD probiert? Ansonsten haben sich solche Abstürze in Games bei mir zuletzt als RAM Fehler erwiesen. Dachte auch die Karte ist das Problem, aber hab es dann einmal mit anderen Sticks probiert und damit ging es dann.
 
Windows neu habe ich noch nicht probiert (wurde erst im Dezember neu aufgesetzt), kann ich aber morgen machen und testen.

Ja RAM war zuerst auch meine erste Vermutung aufgrund div. Beiträge - hab sogar mit den zwei RAM-Riegeln ohne Expo jeweils einzeln getestet ohne Verbesserung - 100% würde ichs auch noch nicht ausschließen aber müsste jetzt RAM kaufen um gegenzutesten.

Waren bei dir die Abstürze auch unabhängig davon ob Expo/XMP aktiviert war oder nicht?
 
BIOS 2413 ist höchstwahrscheinlich der Übeltäter.
 
BIOS 2413 ist höchstwahrscheinlich der Übeltäter.

Danke für die Info - würde ich aber ausschließen da ich die Version erst gestern aufgespielt habe im Zuge der Fehlersuche....
 
Windows neu habe ich noch nicht probiert (wurde erst im Dezember neu aufgesetzt), kann ich aber morgen machen und testen.

Ja RAM war zuerst auch meine erste Vermutung aufgrund div. Beiträge - hab sogar mit den zwei RAM-Riegeln ohne Expo jeweils einzeln getestet ohne Verbesserung - 100% würde ichs auch noch nicht ausschließen aber müsste jetzt RAM kaufen um gegenzutesten.

Waren bei dir die Abstürze auch unabhängig davon ob Expo/XMP aktiviert war oder nicht?
XMP in meinem Fall, ja, unabhängig davon. Ich habe das OC langsam zurück gefahren und daran gemerkt dass es am RAM liegen muss, da die Abstürze dann immer später kamen. Aber selbst @ stock gab es die. Also anderen RAM eingebaut und zack funktionierte alles wieder, incl. XMP Profil.
 
Wen einschicken eine Option ist, warum nicht.
Du könntest eventuell probieren ob die Karte mit leicht gesenktem Takt stabil läuft. Falls noch nicht getestet...
Mit gesenktem Tak kann ich den Fehler jetzt ein/ausschalten - jetzt auf die Schnelle paar mal mit -500 Core Clock getestet und Spiele/Benchmarks laufen jetzt durch - aber ist das jetzt aussagekräftig das es an der GPU liegt?

Hast du bereits eine ältere Version versucht?
Deine exakte Fehlerbeschreibung findet sich gerade vermehrt im Unterforum.
Nein noch nicht, kann natürlich auch downgraden versuchen - Motherboard wurde damals mit 1813 oder 1809 geliefert - am 24.01 fingen die Probleme an und im Zuge der Fehlersuche habe ich dann 2214 aufgespielt.
 
Es kann auch eine Kombination aus instabilen Takt der GPU und einer anderen Komponente sein.

Aber direkt -500 Core ist zu viel. Taste dich mal langsam ran. In 25mhz Schritten.

Ich hatte bei einem Wechsel von einer 4090 auf die zweite 4090 auf einmal riesen Probleme mit Stabilität. Besonders BF2042 crashte immer zum Desktop.
Habe dann die Spannung meiner CPU erhöht und nun über ein Jahr keine Probleme mehr.
Frag mich bis heute warum die CPU auf einmal mehr Spannung brauchte.

Deshalb müsstet du einfach für dich testen ab wann es Stabil wird.

Ob du am Ende eventuell mit einer 4090 leben kannst die den Standard Takt nicht halten kann musst du für dich entscheiden.
Ich würde sie einschicken 👍🏼
 
Danke @viohlenze - werde ich noch machen.

Edit: Ab -50 Core Clock laufen die Benchmarks durch...

Folgende Tests hab ich jetzt noch gemacht:
  • Gestern downgrade auf Bios 2412 mit Default-Settings getestet -> Fehler tritt noch immer auf (Standardtakt GPU)
  • Heute Windows neu installiert - nur Chipset, LAN, GPU-Driver + Win-Updates gemacht -> Fehler tritt noch immer auf (Standardtakt GPU)
Die RAM-Riegel nochmals einzeln testen und eventuell anderen RAM holen werde ich vielleicht noch machen - Nvidia hat sich bis jetzt eh noch net gemeldet.
 
Zuletzt bearbeitet:
Dann läuft die GPU nicht mit Standard Takt und Spannung.
Liegen die 1.05v an wenn die Karte unter Last ist?
 
Ich glaube es ist an der Zeit für eine Reklamation.

Du wendest hier Unmengen an Nerven und Zeit auf die anderweitig investiert werden könnten.

Von dem was ich hier gesehen habe, hast du wirklich alles menschenmögliche getan um die Fehlerquelle zu bestimmen und kannst ruhigen Gewissens den nächsten Schritt wagen.

Mit großer Wahrscheinlichkeit ist es das Board in solchen Situationen.
 

Anhänge

  • Screenshot 2024-03-01 124101.png
    Screenshot 2024-03-01 124101.png
    14,5 KB · Aufrufe: 56
Ja, das Motherboard.

Wenn du ein zweites zur Hand hast würde ich vorher einen Test vornehmen, aber mit ziemlich hoher Wahrscheinlichkeit ist das die Fehlerquelle. Besonders in Anbetracht der Tests bzw. Anpassungen die du bereits durchgeführt hast bleibt eigentlich nur mehr das Board übrig.
 
Ja, das Motherboard.

Wenn du ein zweites zur Hand hast würde ich vorher einen Test vornehmen, aber mit ziemlich hoher Wahrscheinlichkeit ist das die Fehlerquelle. Besonders in Anbetracht der Tests bzw. Anpassungen die du bereits durchgeführt hast bleibt eigentlich nur mehr das Board übrig.

Da musst du mich aufklären. Er senkt den Takt der GPU und hat keine Abstürze mehr und soll nun das Mainboard tauschen?
Warum?
 
Zweites Board habe ich leider nicht da - aus Interesse wie kommst du aufs Motherboard?
 
Da musst du mich aufklären. Er senkt den Takt der GPU und hat keine Abstürze mehr und soll nun das Mainboard tauschen?
Warum?
Das Verhalten ist typisch für defekte PCIE Slots.
Entweder beim ersten Einsetzen passiert oder bereits werkseitig.

Wenn kein zweites Board vorhanden ist kann auch die Karte in einen anderen Slot gesteckt werden um das zu testen.
 
Danke - das versuch ich am Nachmittag noch zu testen falls es der Platz zulässt.
 
BIOS 2413 ist höchstwahrscheinlich der Übeltäter.
In dem verlinkten Unterforum hat doch niemand das Problem? Wo wird denn dieser Fehler auf das 2413 zurückgeführt. Habe das BIOS auch drauf und nichts problematisches festgestellt
 
Klingt für mich nach defekter GPU, möglich aber auch das es am HPWR Kabel liegt, du könntest mal mit GPU-Z die Voltage vom Stecker auslesen.
Wenn die 12 Volt nicht gehalten werden, hat das Kabel oder NT einen Schuss, da du ja die Stecker kontrolliert hattest, sollte physikalisch eigl alles okay sein.

Wenn die GPU einen Schuss hat, möglich das die GPU von der Karte sich entlötet hatte, das kommt öfters mal vor.
Oder ein Speicherchip ist defekt.

Was auch die Ursache sein kann, Riss in der Platine, kommt gerne mal vor wenn man den PC mit eingesteckter GPU transportiert.
Wenn du die Möglichkeit hast, Karte einschicken.
 
GPU zeigte im zweiten PCIe-Slot das gleiche Verhalten....

Danke euch - werde schlussendlich in beide Richtungen gehen (GPU und MB) aber beim MB aus einem anderen Grund.

Bei der Kontrolle vom MB sieht man bei den Leiterbahnen die zum Audio-Chip gehen entweder einen kleinen Riss oder ein kleines Haar?! das mitlackiert wurde - ich kanns nicht genau beurteilen und ich kanns ausschließen das ich hier mit dem Schraubenzieher oder dergleichen abgerutscht bin. Kann nur Schönheitsfehler sein oder auch nicht.
 

Anhänge

  • 20240301_153539047_iOS.jpg
    20240301_153539047_iOS.jpg
    789,5 KB · Aufrufe: 65
  • 20240301_153542294_iOS.jpg
    20240301_153542294_iOS.jpg
    929,8 KB · Aufrufe: 68
  • 20240301_153636808_iOS.jpg
    20240301_153636808_iOS.jpg
    920,8 KB · Aufrufe: 61
  • 20240301_153903916_iOS.jpg
    20240301_153903916_iOS.jpg
    923,6 KB · Aufrufe: 67
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh