Asus Strix 4090, defekt? (event id 0 nvlddmkm)

ssj3rd

Legende
Thread Starter
Mitglied seit
31.10.2006
Beiträge
5.006
Ort
Hannover / Seelze
Hallo zusammen,

ich glaube meine 4090 Strix verabschiedet sich langsam aber sicher von mir, bin mir aber noch nicht zu 100% sicher, dass hier definitiv ein defekt vorliegt.
Habe die Karte seit Anfang November 22 bei mir im Rechner und mit mit PT 90% damit bisher völlig problemlos betrieben und auch viele viele Games (meist die AAA Teile) damit durchgezockt. Nun bekomme ich plötzlich seit ein paar Wochen immer häufiger einen schwarzen Bildschirm und der Rechner reagiert nicht mehr oder startet sich kurz nach dem Blackscreen neu, dass ist dabei in der Ereignisanzeige zu finden:

1688045902469.png


Was habe ich bisher unternommen:

- Habe schon komplett im abgesicherten Modus gestartet und den Treiber mal komplett per DDU entfernt und danach sauber neu installiert
- Komplettes OC/UC entfernt und auch PT wieder auf 100% gesetzt, Karte läuft auf Stock
- Dachte kurzfristig es liegt an den Temps, aber selbst bei Spielen wie Solasta mit 45 Grad GPU stürzt er irgendwann ab


Folgendes sei noch dazu gesagt:
Der Blackscreen/Absturz erfolgt erst nach vielen Gaming Stunden (meist ab 4-5 Stunden).

Was meint ihr: Muss ich die Karte einschicken?
(Habe echt Angst davor das die nächste übles Spulenfiepen hat, meine ist echt leise. Wäre meine erste defekte GPU überhaupt nach über 30 Jahren Gaming)
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Also was ich mindestens einmal testen würde ist, Windows auf eine leere Platte ziehen, das Spiel Deiner Wahl drauf und mal zwei drei Tage so wie sonst zocken.

Zudem auch mal per HDMI statt DP anschließen, oder zumindest n anderes Kabel nutzen.
 
Zudem auch mal per HDMI statt DP anschließen, oder zumindest n anderes Kabel nutzen.

Das musst du mir erklären, wie genau kann hier das Kabel der Verursacher sein?

Edit:
Ich kann den Fehler in der Ereigniszeige übrigens reproduzieren, allerdings dann ohne Absturz oder Blackscreen.
Wenn ich wie hier im 1 Post beschrieben OCCT mit VRAM 100% 2 Minuten laufen lasse erscheint der Fehler.
 
Das Kabel ist halt teilweise Schmutz und kann zu Problemen führen, gab hier im Forum diesbezüglich schon mehrere Threads ->
https://www.hardwareluxx.de/community/threads/rtx-4090-freezes.1336463/ - zB

Muss nicht helfen, kann aber die Lösung deines Problems sein. Hatte es selber mit meinem Rig, dass ich n Cablemod Kabel hatte was Probleme hatte, mein aktuelles Kabel direkt von Corsair hat sich bisher bewert, aber sofern irgendwann irgendwas mit der GPU passiert, wäre das mein erster Angriffspunkt.

Ansonsten kann man dir leider wenig helfen und wenn dass das Problem nicht behebt, wirst du sie wohl oder übel einschicken müssen
 
Habe das Original Kabel von Nvidia, also die Krake und ganz normal 4 Kabel zu meinem NT seit November wohlgemerkt ohne Probleme.

Und dein Vorredner meinte ja das HDMI Kabel…
 
Dein Netzteil als Problem kannst du aus schließen?
 
Das musst du mir erklären, wie genau kann hier das Kabel der Verursacher sein?

Edit:
Ich kann den Fehler in der Ereigniszeige übrigens reproduzieren, allerdings dann ohne Absturz oder Blackscreen.
Wenn ich wie hier im 1 Post beschrieben OCCT mit VRAM 100% 2 Minuten laufen lasse erscheint der Fehler.
Also ich habe mit DP hin und wieder mal Black Screens, er wacht nicht aus dem Ruhemodus auf etc... mit HDMI funktioniert das immer.
 
Wie weit kannst denn den Vram Übertakten bzw. ist da noch Luft nach oben?
Ansonsten halt RMA auf machen .
 
Habe das Original Kabel von Nvidia, also die Krake und ganz normal 4 Kabel zu meinem NT seit November wohlgemerkt ohne Probleme.

Und dein Vorredner meinte ja das HDMI Kabel…

Das kann von heute auf morgen passieren, mein CableMod Kabel lief auch 2 Monate lang ohne Probleme bis es anfing Probleme zu machen.
Ich würd es in jedem Fall mal ausschließen, bevor ich RMA anstreben würde.
 
ich habe alle paar wochen mal folgendes phänomen:

monitor zeigt beim aufwachen aus dem energiesparmodus kein bild. monitor alienware oled LED geht in den regenbogen modus.

nur eine komplette stromwegnahme hilft da. so genau woran es liegt hab ich noch nicht rausgefunden
 
Der Blackscreen/Absturz erfolgt erst nach vielen Gaming Stunden (meist ab 4-5 Stunden).
So Sachen wie ausbauen, Kontakte reinigen, Lüfter richtig sauber machen usw. hast Du wahrscheinlich schon probiert? Ich konnte damit mal tatsächlich solche Probleme bei einer 2080ti beheben.

Windows komplett neu installieren würde ich definitv auch probieren. Eigentlich ist die von Dir beschriebene Fehlermeldung untypisch für eine defekte Grafikkarte. Sofern du XMP oder ähnlich hast, würde ich das auch mal ausschalten - ich weiß es lief damit problemlos, aber probiere es einfach mal. Manchmal braucht man auch ein BIOS Update um das Problem zu lösen, weil eine doofe Kombination von NVIDIA-Treiber, MB, BIOS und vielleicht sogar RAM eben zu dem Fehler führt.

Viel Erfolg bei der Lösung!
 
Wie weit kannst denn den Vram Übertakten bzw. ist da noch Luft nach oben?
Ansonsten halt RMA auf machen .
Das verstehe ich nicht, warum sollte ich bei Instabilität gerade OC ausreizen/betreiben? Und nein, wirklich viel OC konnte ich nie betreiben, hatte damals schon gesagt das ich die schlechteste 4090 Strix überhaupt habe.

Hier wird übrigens vehement behauptet das es ein Treiber Problem ist:
 
Zuletzt bearbeitet:
Wenn denkst liegt am Treiber dann nimm einen älteren . Geht darum ob der Vram schon am Limit läuft . Kannst auch den Vram runter takten und schauen ob’s stable läuft .
Wenn es stabil läuft im Anschluss weißt ja das es daran liegt . Es ist nicht unüblich , dass Vram mit der Zeit etwas schwächeln kann . Daher lote ich anfangs immer aus was die Karte kann und schau mal nach halben Jahr oder mehr ob die Karte die Werte noch packt . Kannst das selbe auch für die GPU testen .

Habe selber den Nvidia 531.79 installiert.
Habe gerade den ganzen Juni geschaut und nicht einmal ein Nvidia Fehler in der Ereignisanzeige.

Habe im Juni Crysis 1-3 Remastered durchgespielt und BF 2042 und Darktide gezockt.
Keine Probleme in irgendeiner Art und Weise. Karte läuft bei mir @ Stock
 
Zuletzt bearbeitet:
Das Märchen vom Treiber ist sicher der letzte Strohalm.
Fahr mal abgesichert hoch und teste mal mit MemtestVulkan ob er abgesichert auch abkackt. Dann weisst du eigentlich recht sicher das es die Karte ist.
(Ausgehend davon das Netzteil und Power Kabel ok sind, kannst ggf. das Power Kabel mal am Netzteil auf andere Rails klemmen wenn das geht. Bei meinem DarkPower war ein Rail kaputt, die anderen liefen problemlos.)
Bei mir ist letztens der Rechner mehrfach eingefroren, aber konnte es nachstellen, lag an Aida, wenn ich gleichzeitig Fancontrol und Hwinfo Sensoren aktiv hatte.
 
Wie läuft eigentlich eine RMA beim Asus Shop ab, da habe ich die her.
Gibt’s da Erfahrungswerte? Wie geht man vor und sie lange dauert die gesamte Abwicklung?
 
Wenn es direkt über Asus ging sollte es schnell gehen. Früher hätte ich da angerufen und die hätten mir ne Karte geschickt, aber die Guten sind leider nicht mehr da :(
 
Was soll ich sagen, meine Karte zeigt nun seit Tagen den Fehler gar nicht mehr an und auch kein black screen nach vielen Stunden Gaming nachdem ich ein paar Sachen gemacht habe:

- neusten Treiber installiert (536.40)
- zweiten HDMI vom Wohnzimmer TV abgesteckt und den vom C2 umgesteckt
- Low Latency Ultra abgeschaltet im Treiber
- Karte läuft inzwischen auf mit 85% PT und VRAM nach unten gedreht

Edit: Zur früh gefreut, Fehler ist doch wieder da nach 5 Tagen ohne ihn, wieder komplett abgestürzt im blackscreen und der sound hat nur noch ekelig gezischt... hach ja
 
Zuletzt bearbeitet:
Hört sich halt nen bisschen nach nem defekten Vram chip an. Gerade dass du lange Zocken kannst ohne das was passiert. Getriggert wird der Absturz ja erst dann wenn was genau in den defekten Chip geladen wird, was durchaus gar nicht vorkommen muss bei so üppigem speicher. Auch dass du den Fehler reproduzieren kannst indem du den Vram vollaufen lässt spricht ja dafür. Ansonten gilt ja wie bei allen Systeminstabilitäten... ist der Ram Stressgetestet?

Und dass dieses Fehlerbild durch nen mangelhaftes Kabel ausgelöst werden kann... da muss ich doch ein wenig schmunzeln. Digitale Signalübertragung funktioniert oder eben nicht. Dem Kabel fällt nicht nach 4 Stunden ein dass es keine Lust mehr hat. Selbst wenn die Verbindung abbricht würde der Monitor halt kein Signal mehr anzeigen aber doch nicht zum Teil der ganze rechner abstürzen;)

Edit: Ich glaube zwar nicht dass das Netzteil hier das Problem ist, trotzdem die Frage warum du ne 4090 mit 450W mit nem 700W Netzteil verwendest. Es ist ja bekannt dass Spannungspitzen die 2-3 fache Leistung benötigen können. Unter anderem ein Grund für die Sense Pin im neuen im neuen Stromanschluss.
 
Zuletzt bearbeitet:
ist der Ram Stressgetestet?

Ich habe den RAM nun seit 2 Jahren verbaut und alles mögliche seitdem gespielt, der ist quasi Ultra super duper gestresstestet. 😏

Oder meinst du die ganzen Test‘s ala memtest, occt etc die ich ganz am Anfang durchgeführt habe vor 2 Jahren?
 
Zuletzt bearbeitet:
Hallo zusammen,
.....
Nun bekomme ich plötzlich seit ein paar Wochen immer häufiger einen schwarzen Bildschirm und der Rechner reagiert nicht mehr oder startet sich kurz nach dem Blackscreen neu, dass ist dabei in der Ereignisanzeige zu finden:

.....

Folgendes sei noch dazu gesagt:
Der Blackscreen/Absturz erfolgt erst nach vielen Gaming Stunden (meist ab 4-5 Stunden).

....

Ich hatte vor paar Jahren das exakt gleiche Verhalten einer Vega64....
Erst kurz mal das Bild schwarz... dann mal länger das Bild schwarz... dann mal nen reboot ...
Am Ende war es das 6 Monate alte BQ DPP Netzteil... Netzteil getauscht und fertig.. Das läuft seither ohne Probleme...

Kabel, Treiber, den ganzen Klimbim hab ich alles durch damals...
 
Wenn es das Netzteil ist müsste ich doch einen Absturz irgendwie willentlich reproduzieren können, oder?
 
Ich würde das Netzteil in jedem Fall als Verursacher ausschließen wollen, sonst hast du nachher mit der neuen Karte wieder ähnliche Probleme.
 
Die volle tdp kannst du ja in jedem Benchmark abrufen, das dürfte auch nicht das Problem sein. Wenn eher zufällige Spannungsspitzen mit denen dein Netzteil (auf einmal) nicht mehr umgehen kann. Da wüsste ich nicht wie man diese provozieren könnte. Da das netzteil aber ja jetzt schon längere Zeit gut mit der Karte gelaufen ist, riecht es für mich einfach mehr nach der Karte. In deinem Screenshot deutet imho auch alles auf die Karte. Ist ja auch die Frage was für dich das kleinere übel ist. Ne Austausch karte mit potenziellem Spulenfiepen oder das netzteil eventuell völlig unnötig zu tauschen. Obwohl ich eh in deinem Fall nen größeres empfohlen hätte ^^
Beitrag automatisch zusammengeführt:

Gerne, aber wie genau?
Nur über Austausch
 
Leider habe ich Netzteile hier nicht im bulk rumliegen. 😞

Werde nochmal paar Tage paar Software Sachen testen und auch wirklich alles auf Stock drehen und wenn alles nicht hilft einen RMA machen.

Es bleibt ein seltsamer Fehler und im Netz haben ihn auch wirklich viele (besonders im Nvidia Forum), manche haben aber selbst nach GPU + PSU + RAM Austausch weiterhin den Fehler…
 
Zuletzt bearbeitet:
Ja, das ist natürlich doof... Ich hatte für die besonders mysteriösen Fälle des Lebens bis neulich noch ein 750W NT hier für solche Tests rumliegen... leider verkooft...
Aber nen 2. PC in Teilen rumliegen haben zum Testen ist natürlich auch keine Option :-(
 
Wenn es Vram ist dann lasss doch mal die 2 UE5.2 Demos parallel laufen, da ist der Speicher voll.
Hatte mal früher eine neue Asus, alles lief, nur RainbowSix Vegas ist immer nach paar Stunden abgestürzt. Gab gute Tage, aber normalerweise bei dem Game ging nix mehr, alles andere lief. Karte ausgebaut und gegen die Wand geworfen, Problem gelöst.(Mit neuer Karte)
Pro Tipp, es ist zu 99% nie ein Problem von Dir, solange bis es ein Problem von Dir ist.
 
Wenn Du Dir noch nen Shop in der Nähe warm gehalten hast, kannst Du dort mal nachfragen wegen NT Test. Ich kaufe meinen Sachen z.B. immer noch zu einem großen Teil in einem Shop ein. Als ich mein NT in Verdacht hatte, bin ich dahin und habe mit Kaution ein NT zum testen mitbekommen für ein paar Stunden.
 
Ich mische mich mal ein, ich vermute hohe Temperaturen vom NT in Verbindung mit Spannungsspitzen von der Graka. Das NT kann die Peaks dann nicht mehr ab. Wie alt ist das NT denn? den Ryzen kannst auch ausschließen?
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh