RTX 3060 Ti und nvlddmkm reagiert nicht mehr

Hallo,

ich habe exakt das gleiche Verhalten bei OCCT beobachten können. Wollte eigentlich den CPU Overclock testen und dabei ist mir eben der Nvidia Treiber um die Ohren geflogen.
Ebenfalls neuester Nvidia Treiber mit RTX 30xx und Ryzen 5xxx.

Welches Mainboard verwendest du?

EDIT: Da wir beide Ryzen verwenden könnte ich mir vorstellen, dass das ganze durch Vdroop des SOCs ausgelöst wird. Hast du die Möglichkeit die Load Line Calibration auf dem SOC höher zu schalten? Alternativ könnte man auch mal versuchen die SOC Voltage generell um 20-30 mV anzuheben, z.B. von 1.0V auf 1.02V. Wichtig ist aber dabei, dass du nicht höher als 1.2V gehst.

Heute sind mein Mainboard und meine CPU von Mindfactory wieder zurückgekommen: Nach einer Fehlerdiagnose konnte keinerlei Fehler reproduzieren können, die Hardware wurde auf Funktionsweise geprüft und alles in Ordnung.

Habe nun wieder alles zusammengebaut, eben nochmal ein BIOS Update durchgeführt und bei 100% ging der PC aus und startete mit einem Blue Screen: IRQL NOT LESS OR EQUAL.
Naja, ich habe alles versucht, ich kann mir auch nicht vorstellen, dass eine meiner Festplatten defekt ist, eben sowenig wie mein Arbeitsspeicher.

Vdroop SOCs höre ich alles zum ersten mal, was genau meinst du damit?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hi,

da du ein Intel System hast, ist das für dich so nicht anwendbar. Ich hatte mich mit meinem Post eher an den TE gerichtet, da er die Probleme ebenfalls mit OCCT reproduzieren kann.
Sorry!
 
Hi,

da du ein Intel System hast, ist das für dich so nicht anwendbar. Ich hatte mich mit meinem Post eher an den TE gerichtet, da er die Probleme ebenfalls mit OCCT reproduzieren kann.
Sorry!
Altes System war Intel, habe im Dezember auf folgende Hardware gewechselt:
Neues Mainboard: MSI MAG B550 Tomahawk
Neue CPU: AMD Ryzen 9 3900XT
 
Hi,

dann hab ich das überlesen, sorry ^^
Ehrlich gesagt glaube ich nicht dran, dass mein Vorschlag wirklich was bringt. Aber es würde erklären, warum der Treiber bei mir und dem TE bei extrem hoher CPU Last wegknallt.
Bei steigender Last fällt grundsätzlich bei CPUs die anliegende Spannung. Hierfür gibt es die LLC (Load Line Calibration) die das verhindern soll.
Selbiges gilt neben der CPU auch für den SOC, welcher zum Beispiel grundlegende Verwaltungsaufgaben auf dem Mainboard tätigt.

Ich könnte mir daher vorstellen, dass bei hoher Last die Spannung für den SOC zu niedrig wird und es dann Probleme mit PCI-E gibt.
Du kannst mit dem Tool "ZenTimings" die aktuelle "VSOC (SVI2)" auslesen. (Bei mir 0,9938V und unter Last ca. 0,97V)
Im Bios kann man diese Einstellung überschreiben. In meinem Fall würde ich daher einmal 1.03-1.05V testen, was absolut im Rahmen ist. (Aktuell aber bei mir leider nicht möglich)

Je nach Mainbaord und Arbeitsspeicher, kann die VSOC (SVI2) aber auch bereits bei recht hohen (z.B) 1.175V liegen. Hier würde ich dann nicht unbedingt höher gehen.

VG
 
Hallo zusammen,

ich habe bei mir das Problem gelöst bekommen, heute kein einziges mal abgestürzt - ich werde das beobachten aber ich glaube es ist behoben.
Folgendes habe ich festgestellt: Als ich mein Mainboard und die CPU gewechselt habe von Intel auf AMD, habe ich Windows neu installiert und über die MSI Support Seite alle Treiber für mein Mainboard heruntergeladen und installiert. Gestern habe ich die Dragon Center App installiert, dort wurde mir angezeigt, dass noch 3 Treiber von AMD installiert werden müssen, habe dies letztendlich gemacht und heute habe ich gut 5 Stunden damit verbracht zu probieren ob der Fehler nun behoben ist, und tatsächlich konnte ich sehr lange ohne jegliche Abstürze spielen.

Daher denke ich, dass der Fehler behoben ist.. falls nicht, werde ich mich erneut melden!
 
Hallo,

ich habe Anfang des Jahres meine Grafikkarte auf eine 3060Ti geupgraded, CPU & MB waren damals noch Intel Basis. Konnte das resetten des Treibers + Blackscreen ebenfalls täglich beobachten.
Hab aktuell den Treiber in Version 461.09 drauf, damit läuft es nun mindestens schon die letzte Woche ohne Blackscreens :unsure:
 
Grüße

meine Vermutung geht momentan auch eher Richtung Treiberprobleme die vielleicht aufgrund der immer noch recht neuen Ampere Architektur und der Wahrscheinlichkeit, das die Karten nicht in dem Umfang beim Endkunden landen, wie das evtl. bei bisherigen Launches der Fall war.

Dennoch zur Frage von gjn:

da du ein Intel System hast, ist das für dich so nicht anwendbar. Ich hatte mich mit meinem Post eher an den TE gerichtet, da er die Probleme ebenfalls mit OCCT reproduzieren kann.
Es handelt sich bei dem Board um ein MSI MAG B550 Gaming Carbon Wifi.
Ich werde mal mit ZenTimings die Spannungen abfragen und dann nochmal Bericht erstatten. ;)
 
Grüße

meine Vermutung geht momentan auch eher Richtung Treiberprobleme die vielleicht aufgrund der immer noch recht neuen Ampere Architektur und der Wahrscheinlichkeit, das die Karten nicht in dem Umfang beim Endkunden landen, wie das evtl. bei bisherigen Launches der Fall war.

Dennoch zur Frage von gjn:


Es handelt sich bei dem Board um ein MSI MAG B550 Gaming Carbon Wifi.
Ich werde mal mit ZenTimings die Spannungen abfragen und dann nochmal Bericht erstatten. ;)
Schau im Dragon Center nach, ob dort alle Treiber als installiert angezeigt werden, das selbe Problem war bei mir auch. Alle Treiber habe ich über msi runtergeladen und installiert aber über die App wurden diese wohl „richtig“ installiert
 
Schau im Dragon Center nach, ob dort alle Treiber als installiert angezeigt werden, das selbe Problem war bei mir auch. Alle Treiber habe ich über msi runtergeladen und installiert aber über die App wurden diese wohl „richtig“ installiert
Was für "fehlende" Treiber sollen das deiner Ansicht nach sein? Das einzige was aus meiner Sicht in Frage kommt, wären die AMD Chipset Driver und diese lade ich mir lieber direkt über die AMD HP runter, anstatt diese über die (aus meiner Sicht schreckliche) MSI Dragon-App auf den Rechner zu kriegen.

Das Problem kann by the way extrem sportadisch auftreten. Könnte es daher nicht auch sein, das du im Moment den Fehler bei vermeintlich fehlerhaft installierten Treibern vermutest, sich das unter Umständen aber als Irrtum herausstellen könnte? Ich glaube dir wenn du sagst, das dein Problem sich dadurch gelöst hat, nur wäre dann die Frage wodurch. Die App macht ja nichts anderes als die üblichen Treiberpakete zentral bereit zu stellen, anstatt diese bei MSI manuell herunterladen zu müssen. Oder sind dir bestimmte Treiber aufgefallen, die durch die App installiert wurden?
 
Was für "fehlende" Treiber sollen das deiner Ansicht nach sein? Das einzige was aus meiner Sicht in Frage kommt, wären die AMD Chipset Driver und diese lade ich mir lieber direkt über die AMD HP runter, anstatt diese über die (aus meiner Sicht schreckliche) MSI Dragon-App auf den Rechner zu kriegen.

Das Problem kann by the way extrem sportadisch auftreten. Könnte es daher nicht auch sein, das du im Moment den Fehler bei vermeintlich fehlerhaft installierten Treibern vermutest, sich das unter Umständen aber als Irrtum herausstellen könnte? Ich glaube dir wenn du sagst, das dein Problem sich dadurch gelöst hat, nur wäre dann die Frage wodurch. Die App macht ja nichts anderes als die üblichen Treiberpakete zentral bereit zu stellen, anstatt diese bei MSI manuell herunterladen zu müssen. Oder sind dir bestimmte Treiber aufgefallen, die durch die App installiert wurden?
Weil ich diese Treiber von der Webseite runtergeladen und installiert habe - die App jedoch trotzdem mehrere dieser Treiber als nicht installiert aufgelistet hat.
Ist aber auch dementsprechend egal, da der Fehler bei mir nun wieder da ist, also nichts wurde dadurch behoben.
 
Ist aber auch dementsprechend egal, da der Fehler bei mir nun wieder da ist, also nichts wurde dadurch behoben.
Das habe ich befrüchtet.
Hast du bereits 461.40 ausprobiert? Dieser ist vorgestern erschienen.
Vielleicht testest du (falls noch nicht geschehen) das einmal aus und berichtest einmal, ob sich dadurch Verbesserungen ergeben.
 
Das habe ich befrüchtet.
Hast du bereits 461.40 ausprobiert? Dieser ist vorgestern erschienen.
Vielleicht testest du (falls noch nicht geschehen) das einmal aus und berichtest einmal, ob sich dadurch Verbesserungen ergeben.
Den habe ich eben erst installiert, ich versuche es jetzt einfach mal wieder aus - schade das man den Fehler eben nicht reproduzieren kann.
Beitrag automatisch zusammengeführt:

Fehler besteht immer noch, mit dem 461.40 Treiber @D€NNIS
 
Zuletzt bearbeitet:
Der Fehler ist bei mir zumindest mit dem OCCT Stresstest reproduzierbar. (Großer Datensatz / Extrem)
Damit kann das Problem innerhalb von 4-8 Stunden zumindest bei mir mindestens einmal getriggert werden.

Bist du mal dem Vorschlag von gjn gefolgt?
 
Der Fehler ist bei mir zumindest mit dem OCCT Stresstest reproduzierbar. (Großer Datensatz / Extrem)
Damit kann das Problem innerhalb von 4-8 Stunden zumindest bei mir mindestens einmal getriggert werden.

Bist du mal dem Vorschlag von gjn gefolgt?
So in der Art habe ich noch nie irgendwas bearbeitet - normalerweise dürfte der Fehler doch nicht kommen. Habe jetzt auch den älteren Treiber der Grafikkarte 457.09 ohne Erfolg, werde morgen nochmal die Festplatten ausgrenzen und wenn mein neuer Arbeitsspeicher ankommt diesen ebenfalls tauschen, ob es eventuell daran liegt.

Mein Fehler existiert seit dem ich Mainboard und CPU gewechselt habe - logisch bedacht muss es am Mainboard oder CPU liegen, beides habe ich beim Verkäufer testen lassen ohne jeglichen Fund an Fehlern.
 
Also meine RTX 3090 mit AsRock X570 Board und aktivierten PCIe 4.0 bei der Grafikkarte macht gar keine Probleme. Bei AM4 und MSI Boards habe ich bis jetzt nur schlechte Erfahrungen gemacht, kann also gut sein das es am Board liegen könnte. CPU glaube ich eher nicht. Viel Glück, hoffe du bist bald problemfrei. 👍
 
Festplatten ausgrenzen und wenn mein neuer Arbeitsspeicher ankommt diesen ebenfalls tauschen
Meinen Erfahrungen nach dürfest du über den Ansatz Festplatten und RAM nicht wirklich weiterkommen.
Trotzdem natürlich sinnvoll zu prüfen, ob das System generell stable ist. (Also ggf. mal RAM auf DDR4-3200 reduzieren (XMP=off)

Der Fehler tritt bei mir extrem sporadisch auf und im Alltagsbetrieb bzw. beim zocken passiert quasi gar nichts.
Insofern ist es momentan im Praxisbetrieb unauffällig und kann lediglich über besagten OCCT Test ausgelöst werden.

Das Board hatte ich auch erst im Verdacht, würde ich aber mittlerweile erstmal aufgrund dessen, das mein System im Alltag ohne Schwierigkeiten funktioniert ausklammern.
Vielleicht kann man ja gemeinsam u.a über diesen Thread die Problemursache ermitteln.
 
Meinen Erfahrungen nach dürfest du über den Ansatz Festplatten und RAM nicht wirklich weiterkommen.
Trotzdem natürlich sinnvoll zu prüfen, ob das System generell stable ist. (Also ggf. mal RAM auf DDR4-3200 reduzieren (XMP=off)

Der Fehler tritt bei mir extrem sporadisch auf und im Alltagsbetrieb bzw. beim zocken passiert quasi gar nichts.
Insofern ist es momentan im Praxisbetrieb unauffällig und kann lediglich über besagten OCCT Test ausgelöst werden.

Das Board hatte ich auch erst im Verdacht, würde ich aber mittlerweile erstmal aufgrund dessen, das mein System im Alltag ohne Schwierigkeiten funktioniert ausklammern.
Vielleicht kann man ja gemeinsam u.a über diesen Thread die Problemursache ermitteln.
Wir sind nicht die ersten mit dieser Art an Problem, ich lese mich täglich durch das Internet über ähnliche Fehlermeldungen, jedoch gab es bisher keinerlei Lösung dabei, die auch mir geholfen hat.

Mein System läuft derzeit mit 2 x 8Gb 2400 MHz Arbeitsspeicher, eventuell ist das einfach zu schwach im Vergleich zu einem Ryzen 9 3900xt und einer RTX 3070.

Komischerweise kriege ich auch jedes Mal nachdem ich ein BIOS Update durchführe nach dem Neustart direkt ein BlueScreen, ein mal Memory Management, letztendlich bleibt er in der Startschleife hängen mit unzähligen weiteren BlueScreens: PAGE_FAULT_IN_NONPAGED_AREA, SYSTEM_PTE_MISUSE, KMODE_EXCEPTION_NOT_HANDLED usw.

Mein Fehler tritt meistens beim spielen auf, also im Durchschnitt nach 45 Minuten Spielzeit wars das mit dem spielen.

Neulich war mein Computer eingeschaltet jedoch war ich noch kurz abwesend vom Computer und als ich wieder dran war, bemerkte ich das der folgende Fehler auch 3 mal auftrat obwohl keinerlei großartige Aktivität stattgefunden hat..
 
Wir sind nicht die ersten mit dieser Art an Problem, ich lese mich täglich durch das Internet über ähnliche Fehlermeldungen, jedoch gab es bisher keinerlei Lösung dabei, die auch mir geholfen hat.

Mein System läuft derzeit mit 2 x 8Gb 2400 MHz Arbeitsspeicher, eventuell ist das einfach zu schwach im Vergleich zu einem Ryzen 9 3900xt und einer RTX 3070.

Komischerweise kriege ich auch jedes Mal nachdem ich ein BIOS Update durchführe nach dem Neustart direkt ein BlueScreen, ein mal Memory Management, letztendlich bleibt er in der Startschleife hängen mit unzähligen weiteren BlueScreens: PAGE_FAULT_IN_NONPAGED_AREA, SYSTEM_PTE_MISUSE, KMODE_EXCEPTION_NOT_HANDLED usw.

Mein Fehler tritt meistens beim spielen auf, also im Durchschnitt nach 45 Minuten Spielzeit wars das mit dem spielen.

Neulich war mein Computer eingeschaltet jedoch war ich noch kurz abwesend vom Computer und als ich wieder dran war, bemerkte ich das der folgende Fehler auch 3 mal auftrat obwohl keinerlei großartige Aktivität stattgefunden hat..

naja dann haste wohln defekt.. schau doch in den anderen thread hier rein mit BSOD, da sind wir anderen leidesgenossen mit drin wobei dein problem viel heftiger ist.
 
naja dann haste wohln defekt.. schau doch in den anderen thread hier rein mit BSOD, da sind wir anderen leidesgenossen mit drin wobei dein problem viel heftiger ist.
Die Frage ist jedoch was für eine Art defekt ich habe, Mainboard und CPU wurde auf Funktionsweise vom Hersteller geprüft ohne Fehler.

Vielleicht sollte ich testweise ein anderes Mainbord bestellen und es austesten.

Update:
Heute ist gegen 13:30 mein Arbeitsspeicher angekommen welches ich die Tage bestellt habe da ich sowieso aufrüsten wollte: 2 x 8Gb 3200 MHz.
Ich habe jetzt ab 14:00 bis 19:00 Uhr zwei Spiele gespielt ohne jegliche Abstürze oder Fehler.

Auch dieses mal werde ich es beobachten und mich ggf. nochmal melden.

Update 31.01.2021:
Bisher keinerlei Fehler, während dieser Zeit hätte ich schon mehrmals diesen Fehler gehabt, nun ist es endgültig behoben, zu 100%.
Somit lag bei mir der Fehler ausschließlich am Arbeitsspeicher - entweder zu lahm mit 2400Mhz oder defekt.

Hoffe konnte jemandem weiterhelfen, mit freundlichen Grüßen!
 
Zuletzt bearbeitet:
Hey,

ich muss das Thema nochmal aufwärmen, denn zumindest in meinem Fall besteht das Problem nach wie vor.
Das große Problem daran ist, das es im Alltagseinsatz nur extrem sporadisch auftritt. So war der Rechner quasi über 2 Wochen komplett unauffällig und dann trat das anfänglich beschriebene Problem plötzlich wieder häufiger auf.

Das einzige was ich recht verbindlich sagen kann ist, das mit einem AMD Zen3 (CPU ist ganz neu und wurde bereits einmal ausgetauscht) in Verbindung mit einem MSI MAG B550 Gaming Edge Wifi und einer Geforce RTX 3060 Ti der nvlddmkm Fehler im PCIe Gen3 Mode weniger häufig auftritt als im Gen4 Mode.

Die Erhöhung der SoC Voltage brachte diesbezüglich leider auch keine Verbesserung.
 
Hey,

ich muss das Thema nochmal aufwärmen, denn zumindest in meinem Fall besteht das Problem nach wie vor.
Das große Problem daran ist, das es im Alltagseinsatz nur extrem sporadisch auftritt. So war der Rechner quasi über 2 Wochen komplett unauffällig und dann trat das anfänglich beschriebene Problem plötzlich wieder häufiger auf.

Das einzige was ich recht verbindlich sagen kann ist, das mit einem AMD Zen3 (CPU ist ganz neu und wurde bereits einmal ausgetauscht) in Verbindung mit einem MSI MAG B550 Gaming Edge Wifi und einer Geforce RTX 3060 Ti der nvlddmkm Fehler im PCIe Gen3 Mode weniger häufig auftritt als im Gen4 Mode.

Die Erhöhung der SoC Voltage brachte diesbezüglich leider auch keine Verbesserung.

Bei mir trat der Fehler auch insgesamt 3 mal auf, nachdem ich auch den Arbeitsspeicher gewechselt hatte. Jedoch ist es jetzt sehr selten bis kaum, seit einer Woche keine einzige Fehlermeldung daher finde ich es jetzt nicht mehr so dramatisch.

Hast du die Möglichkeit dein Mainboard testweise auszutauschen um gegenzutesten
 
Der aktuelle Januar Treiber von Nvidia taugt nix.
Ich bin zurück auf den Dezember Treiber.
 
Der aktuelle Januar Treiber von Nvidia taugt nix.
Ich bin zurück auf den Dezember Treiber.
Das Problem liegt jedoch leider nicht an einem Treiber der Grafikkarte (Auch wenn die Fehlermeldung es meldet) ich habe bereits alle kompatiblen Treiber der 3070 probiert und jedes Mal der selbe Fehler.

Was mir jetzt noch spontan einfällt: Windows auf einer anderen Festplatte installiert und ausprobiert?
 
Speicher übertaktest du aber nicht oder so?

Naja Gerätemanager alle nicht angezeigten Dinger kicken, Chipsatztreiber nochmal frisch drauf wäre mein Weg.
 
Chipsatztreiber habe ich bereits diverse Versionen durch, sowohl direkt von AMD als auch jene die man über MSI beziehen kann.
Speicher wird definitiv nicht übertaktet, XMP Profil deaktiviert und ganz regulär auf DDR4-3200 betrieben.

Diverse RAM Stresstest über 12 Stunden durchlaufen lassen. (Memtest, RAM Test, OCCT RAM Test)
Alle Tests werden erfolgreich absolviert. Der Fehler tritt selten af, das ist korrekt aber auch nur dann wenn ich PCIe auf Gen3 eingrenze, zumindest bei mir tritt es mit Gen4 deutlich häufiger auf.

Das Motherboard habe ich noch nicht getauscht, dies einfach auf Verdacht, ohne konkreten Anhaltspunkt zu tun ist natürlich auch so eine Sache, wo ich zunächst mal etwas zögere.
 
Chipsatztreiber habe ich bereits diverse Versionen durch, sowohl direkt von AMD als auch jene die man über MSI beziehen kann.
Speicher wird definitiv nicht übertaktet, XMP Profil deaktiviert und ganz regulär auf DDR4-3200 betrieben.

Diverse RAM Stresstest über 12 Stunden durchlaufen lassen. (Memtest, RAM Test, OCCT RAM Test)
Alle Tests werden erfolgreich absolviert. Der Fehler tritt selten af, das ist korrekt aber auch nur dann wenn ich PCIe auf Gen3 eingrenze, zumindest bei mir tritt es mit Gen4 deutlich häufiger auf.

Das Motherboard habe ich noch nicht getauscht, dies einfach auf Verdacht, ohne konkreten Anhaltspunkt zu tun ist natürlich auch so eine Sache, wo ich zunächst mal etwas zögere.

Steht dir kein alternatives Mainboard zur Verfügung welches zu spontan zum gegentesten einbauen kannst?
Vermutlich liegt es einfach am Mainboard, ich habe die selben Fehler mit dem MAG B550 Tomahawk, vor allem beim spielen also wo der Computer ordentlich ausgelastet wird. Jedoch kam der Fehler schon paar Tage nicht mehr.
 
Bei mir beschwerdefrei momentan nachdem ich Hardware Beschleunigung in chrome aus machte
 
Wie ich vermutet habe, gibt es überhaupt keine richtige Lösung für diese Art von Problem (Hardwarefehler, LiveKernelEvent 141)

Bei mir tritt das Problem dennoch ab und zu auf, häufig bei Assassins Creed: Valhalla, der Fehler ist anders nicht reproduzierbar. Seit dem ich von 2400 MHz auf 3200 MHz Arbeitsspeicher gewechselt habe, tritt der Fehler seltener auf.

Für alle: An der Grafikkarte liegt das Problem nicht, ich habe mittlerweile 3 verschiedene Grafikkarten ausprobiert: GTX 980, RTX 2080 SUPER und RTX 3070.
Ich persönlich vermute einen Fehler am Mainboard (Produktionsfehler oder sonstiges) Serie MAG B550 Tomahawk.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh