RTX 2080 TI Probleme

scandal

Enthusiast
Thread Starter
Mitglied seit
28.09.2008
Beiträge
124
Ort
Bern, Schweiz
Hallo zusammen

ich habe seit zwei tagen heftige probleme mit meiner rtx 2080ti. sobald ich ein spiel spiele wird nach ca 3-4 minuten den bildschirm schwarz und geht in den standby, der rechner selbst läuft aber weiter, einfach ohne bild.
in der ereignisanzeige kommt der fehler: Der Anzeigetreiber "nvlddmkm" reagiert nicht mehr. das ganze hat angefangen ohne das ich was geupdatet oder deinstalliert hätte, auch windows hatte keine updates installiert.

furmark bleibt auch nach 1h am laufen.
bei the division 2 und read dead 2 egal ob direct x 12 oder 11 geht nach ca 5 minuten der bildschirm aus.

mein system steht in der infobox aber kurz:
ryzen 9 3900x
msi x570 ace
msi rtx 2080 ti trio x
gskill trident z royal 3200
seasonic ultra titanium 650 watt
cpu und gpu mit einer custom wakü
windows 10
usv

was ich alles schon probiert habe:
treiber neu installiert
bios update vom mb rückgängig gemacht, das schon einige tage zuvor drauf war
älterer treiber für gpu installiert
anderes nt getestet
windows standard treiber getestet
takt für speicher und gpu um 100 mhz gesenkt
andere kabel getestet
antivirus deinstalliert

alles ohne erfolg, das einzige was mir noch einfällt ist eine windows neu installation.

so langsam gehen mir die gpus auf die nerven. zuvor im alten system sind mir zwei verreckt. eine rx480 in 11 monaten und eine 1070 in 8 monaten. die waren beide ohne oc oder sonst was, nur werks takt. die hd 7970 die ich mit dem system zusammen gekauft hatte lebt immer noch und war ca 6 jahre im system verbaut.
jetzt mit dem neuen system scheint das schon wieder los zu gehen. das ganze system ist ca. 4 monate alt.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
so langsam gehen mir die gpus auf die nerven. zuvor im alten system sind mir zwei verreckt. eine rx480 in 11 monaten und eine 1070 in 8 monaten.
Dann muss der Fehler vor dem Bildschirm sitzen.
Du musst irgendwas schräges mit deinem PC machen.
Entweder schrottest du die Karten wenn du auf WaKü umbaust, oder du übertaktest schrecklich.
Wenn du ein Geiz ist Geil anhänger bist, in dem Fall HighEnd günstig kaufen willst, am besten noch von Ebay und Co, dann khast du womöglich beschädigte Hardware gekauft.
 
Hast du schonmal Probiert was passiert wenn du die GPU um 100mhz untertaktest und den vRAM mal um 200mhz absenken? ob die dann stabil läuft? Welcher Wasserkühler ist auf der Graka verbaut?
 
Dann muss der Fehler vor dem Bildschirm sitzen.
Du musst irgendwas schräges mit deinem PC machen.
Entweder schrottest du die Karten wenn du auf WaKü umbaust, oder du übertaktest schrecklich.
Wenn du ein Geiz ist Geil anhänger bist, in dem Fall HighEnd günstig kaufen willst, am besten noch von Ebay und Co, dann khast du womöglich beschädigte Hardware gekauft.
Die Karten vorher waren alle neu und original verpackt. Die sind alle aus einem shop nicht von ebay und co. Die habe ich auch nicht auf wakü umgebaut erst die 2080ti. Die waren weder übertaket noch sonst was.
Wie man auf geiz ist geil kommen kann verstehe ich nicht ganz. Die trio x kostet 1400 fr. Der ganze rechner um die 5k.
Beitrag automatisch zusammengeführt:

Hast du schonmal Probiert was passiert wenn du die GPU um 100mhz untertaktest und den vRAM mal um 200mhz absenken? ob die dann stabil läuft? Welcher Wasserkühler ist auf der Graka verbaut?

100mhz für gpu und ram habe ich schon getestet. Da hatte sich nichts verändert. Ich teste das sonst nochmal mit 200 mhz heute abend.
Der kühler ist ein ek vector trio rtx 2080 ti
 
Zuletzt bearbeitet:
Jau, teste mal mit - 200 oder mehr, kannst auch erstmal alles was geht rubterziehen am takt - und dann mal schauen ob der immernoch so schnell ein blackscreen bringt. Welcher vRam ist bei der 2080ti verbaut (gpu-z zeigt es z. B. an)

Hast du mal den wasserkühler nochmal runtergrnommen und alle wärmeleitpads kontrolliert ob da auch ein Abdruck vom zu kühlende Chip ist? Wie eben z. B. Die spannungswandler Mosfets oder die vRams... Da muss ein Abdruck auf den wärmeleitpads zu sehen sein, an sonsten hat das pad keinen richtigen Kontakt (zu dünn?) und dann kann es durchaus sein, daß sich ein Mosfet oder ein vRam punktuell zu stark aufheizt. Man könnte das PCB auf der Rückseite mit einer wärmebildkamera auch messen ob es Hotspots gibt... Oder eben die Abdruck Methode ;)
 
Zuletzt bearbeitet:
Kühler hatte ich noch nicht abgebaut. Da ich 4 monate ohne probleme spielen konnte, dachte ich nicht das der kühler zu wenig anpressdruck haben könnte.

Ich werde erstmal versuchen den takt ab zu senken und wenn das nichts bringt, schaue ich einmal wie es darunter aussieht. Leider hat gpu-z keine vrm temperatur anzeige bei der 2080 ti.
Wärmebild kamera habe ich leider keine. Höchstens ein ir thermometer.
 
kann es am Treiber liegen?
Hatte ähnliche Probleme mit meiner 980Ti.
Da gab es massig Meldungen in GTA 5 und Forza Horizon 4, über mehrer Treiber Versionen sind immer die Spiele nach paar Minuten abgestürzt.
(Gelöst habe ich es indem ich ein Treiber von vor 1 Jahr genommen habe)
 
naja darf aber auch nicht sein das mit dem Treiber...

bei GPUZ meinte ich nicht die VRM Temperatur - auch die würde nichts bringen ;)
Bei GPUz steht aber welcher Speicheer verbaut ist, da wo auch die Speichermenge angezeigt wird...mach am besten mal ein Screenshot vom GPUz :)
 
Ich weis schon was du gemeint hast. Aber die vrm temps würden auch sagen wie gut oder nicht gut der kühler montiert ist.

kann es am Treiber liegen?
Hatte ähnliche Probleme mit meiner 980Ti.
Da gab es massig Meldungen in GTA 5 und Forza Horizon 4, über mehrer Treiber Versionen sind immer die Spiele nach paar Minuten abgestürzt.
(Gelöst habe ich es indem ich ein Treiber von vor 1 Jahr genommen habe)

Da sich die gpu quasi ausschaltet, kann es halt alles mögliche sein. ich könnte noch versuchen einen noch älteren treiber zu installieren. ich denke am ehesten könnte es noch ein software problem sonst sein.
 
Zuletzt bearbeitet:
Eben nicht, da wenn eine vrm temp angezeigt wird, wird es nur von einer einzelnen Thermistor Diode oder NTC erfasst, welche meist mittig zwischen den ganzen Mosfets sitzt. Sonst müsste jeder mosfet einen eigenen, adressierbaren sensor haben.
Und diese angezeigte vrm Mittelwert Temperatur sagt nichts darüber aus, ob z. B. Die unteren beiden Mosfets guten Kontakt zum Kühler haben. Klar wird die meiste Abwärme übers PCB abgegeben, aber wenn der ganze vrm Part da nur mittelmäßig gekühlt wird oder eben kein richtigen kühlerkontakt hat weil das wärmeleitpad doch zu dünn bemessen war ubd über die zeit etwas geschrumpft ist, dann kann es schon sein das es einem einzelnen mosfet zuheis wird - und er dann ein emergency shutdown anfordern (alert pin am mosfet, kann auch anders heisen) sodas der komplette spannungswandler abgeschaltet wird...

Also das könnte ein möglicher Fehler sein...
 
@scandal
Deine Karte ist defekt, sie zeigt eines der typischen Verhalten, das du beschreibst. Ich hatte zwei defekte 2080 Ti, eine davon fing auch an so defekt zu gehen, irgendwann geht dann gar nichts mehr. Bitte tauschen lassen, auch wenn es ärgerlich ist.
 
@scandal
Deine Karte ist defekt, sie zeigt eines der typischen Verhalten, das du beschreibst. Ich hatte zwei defekte 2080 Ti, eine davon fing auch an so defekt zu gehen, irgendwann geht dann gar nichts mehr. Bitte tauschen lassen, auch wenn es ärgerlich ist.

genau das wollte ich eigentlich nicht.... da kann ich wieder 5-6 wochen warten bis ich weis was los ist.
 
thema treiber die letzten die ich hatte waren beim wechsel von wddm 2,4 auf wddm 2,6
Revision 390.xx vs 416.xx
Das liegt aber primär an win 10 und der treiber Implementierung.
Spätere treiber also ab 42x.xx war das problem weg.
Der aktuelle 442.19 läuft stabil
Ob maxwell auch so ist ? probiere mal ältere aus.
Zur not den letzten stabilen um die 380.xx (2017)
Edit hab den thread titel vergessen natürlich geht das bei einer rtx2080ti nicht dann den letzten 425.xx
 
Eben nicht, da wenn eine vrm temp angezeigt wird, wird es nur von einer einzelnen Thermistor Diode oder NTC erfasst, welche meist mittig zwischen den ganzen Mosfets sitzt. Sonst müsste jeder mosfet einen eigenen, adressierbaren sensor haben.
Und diese angezeigte vrm Mittelwert Temperatur sagt nichts darüber aus, ob z. B. Die unteren beiden Mosfets guten Kontakt zum Kühler haben. Klar wird die meiste Abwärme übers PCB abgegeben, aber wenn der ganze vrm Part da nur mittelmäßig gekühlt wird oder eben kein richtigen kühlerkontakt hat weil das wärmeleitpad doch zu dünn bemessen war ubd über die zeit etwas geschrumpft ist, dann kann es schon sein das es einem einzelnen mosfet zuheis wird - und er dann ein emergency shutdown anfordern (alert pin am mosfet, kann auch anders heisen) sodas der komplette spannungswandler abgeschaltet wird...

Also das könnte ein möglicher Fehler sein...

Da sind Samsung Speicher Chips drauf
Beitrag automatisch zusammengeführt:

Ich glaube ich kann für das erste eine entwarnung geben.

es scheint als sei ein wakü kühler wie eine auto felge, erstmal eine runde drehen und dann nach ziehen.

Ich habe alle schrauben am kühler jetzt so fest angezogen wie es irgendwie noch gesund für das pcb ist. dann habe ich wärend last auf der gpu war das pcb auf der rückseite mit einm ir thermometer gemessen. Bei den vrm's ist die temperatur zwischen 45-50°C. Speicher Chips sind auch in etwa in der gegend. einzige eine stelle die so aussieht als würde da die stromversorgung vom pcie slot durchgehen wird ca 60 grad warm nach 15 minuten spiele last. der rest ist weniger oder max 40°C

ich hoffe das bleibt jetzt so und bedanke mich erstmal für die hilfestellung vor allem @AssassinWarlord

Ich teste weiter und berichte dann noch einmal
 

Anhänge

  • gpuz.gif
    gpuz.gif
    33,5 KB · Aufrufe: 123
Zuletzt bearbeitet:
Das klingt aber schon sehr stark danach, dass ein Chip nicht richtig gekühlt wird... Also wenn das wieder auftritt -> Kühler runter und wärmeleitpada genau anschauen... Ggf. Ersetzen durch die arctic cooling wärmeleitpada mit 1.5mm Stärke... Das passt immer :d
 
Also nach gut 3h spielen ist es Stabil geblieben. Jup da scheint wohl ein chip etwas zu warm bekommen zu haben. danke nochmal.
ich glaube ich hole mir die mal auf vorrat, man weis ja nie wann das wieder nicht mehr geht, oder sich die dinger zu fest zusammen ziehen,
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh