Assa's Repair-Worklog: Wenn Grafikkarten ein zweites Leben erhalten

Waren die dann ohne Wärmesignatur deutlich zu unterscheiden?

Ich glaube ich verstehe die Frage nicht :-)

Also ich habe ja irgendwo in der RAM Phase nen kurzen. Spannungsregler sind ausgelötet also ist er dahinter. Habe 1,3V rauf gegeben mit Strombegrenzung. Also wenn ich die Messspitzen aneinander gehalten habe hatte ich 1,3V ca 8,5A und wenn ich die RAMs damit versorgt habe (über Elko) hatte ich 1,3V ca 5,5A und auf der Wärmebildkamera haben 2 Module angefangen sich aufzuwärmen und der Rest ist gleich geblieben.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
ist die GPU an einer kante vom Silizium da aber eventuell auch heiß geworden? oder blieb die unbekümmert?
Speicher kannst du runter nehmen, wenn die Pads gereinigt sind, kannst du das ding auch starten. Bild kann kommen - muss aber nicht, jenachdem wo die karte zuerst die daten hin addresiert. Mit Mats/mods kann man die dann aber trotzdem testen.

Meistens ist aber erfahrungsgemäß der Memory controller in der GPU defekt wenns da Speichertechnisch schon nen kurzschluss gibt :-/ die Pascal GPUs sterben da recht häufig an defekten Memorycontrollern :(
 
Ich glaube ich verstehe die Frage nicht
War der Speicher auf dem Wärmebild dunkel und hat sich von anderen Bauteilen abgehoben oder wurde der dennoch warm?
Beitrag automatisch zusammengeführt:

Oh Wärmebild und Vram bei Google eingeben zeigen deinen YT Acc und darunter den HWLUXX Thread @AssassinWarlord 8-)
 
Update zur 1080 Mobile: habe nun mit einen Netzteil und Wärmebild 2 RAM Module identifiziert die ich tauschen werde. Wenn ich die jetzt schonmal auslöte, wird die Graka dann (falls sonst alles OK ist) mit 6 statt 8 Modulen auch laufen? Oder mache ich da was kaputt wenn ich sie so ausprobiere?

Vielen Dank!
Grüße von mir!
Ich bin bei den mobile GPUs nicht so ganz fit aber Bild wird sie sicher keines ausgeben und auch es werten auch nicht 6GB erkannt.
Evtl. wird die Karte aber erkannt und Mats autotest kann laufen.
Aber warum hast du Speicher abgenommen? Hast du vorher mit Mats testen können?
 
Das C wird nur wärmer aufgrund der Übergangswiderstände. Dann löte ich sie nachher mal aus, neue Spannungswandler rein und gucken ob ich wenigstens einen schönen Bluescreen zu Gesicht bekomme.
Beitrag automatisch zusammengeführt:

Die GPU verändert sich nicht in der Temperatur. Auch am Rand habe ich nichts entdeckt. Nur die beiden RAM Module werden wärmer. Alles andere sind Reflektionen oder halt Übergangswiderstände (beim C).
 

Anhänge

  • 747376C9-4F2A-4B79-A5D9-5E3199424461.jpeg
    747376C9-4F2A-4B79-A5D9-5E3199424461.jpeg
    144,1 KB · Aufrufe: 141
  • 6C51E7F3-CE01-4A59-BAD1-0335B8D970FB.jpeg
    6C51E7F3-CE01-4A59-BAD1-0335B8D970FB.jpeg
    202,5 KB · Aufrufe: 141
Zuletzt bearbeitet:
Okay, dann nimm die beiden rams runter, und check nochmal mit Strom und Wärmebild
Speicher sterben nicht einfach so, da hat die defekte Phase sicherlich mal kurzzeitig zuviel saft in den Ram reingeschoben und der ist damit kaputt gegangen...wenn dem wirklich so ist, kannst du nur hoffen und beten, dass der Memcontroller in der GPU noch heile ist. Meist sind bei überspannung aber mehrere Rams defekt...hatte das mal bei einer GTX1060 - da waren 4 von 6 rams defekt. der MemController hats da aber erstaunlicherweise überlebt
 
Wieso hat er immer Recht!?:heul: jetzt wo die beiden „heissen“ RAMs runter sind, ist die Erwärmung am Rande der GPU zu erkennen. Also Memcontroller defekt?? Kurzschluss ist jedenfalls noch da.:wut:
Hat noch jemand ne 1080 GPU rumliegen?
 
Du wirst da auch alle rams tauschen müssen befürchte ich...wäre zumindest besser so...
Falls du das machen solltest, dann lieber ein paar sicherungen mit verbauen das das nicht wieder passiert.
 
Du wirst da auch alle rams tauschen müssen befürchte ich...wäre zumindest besser so...
Falls du das machen solltest, dann lieber ein paar sicherungen mit verbauen das das nicht wieder passiert.
Ich würde jetzt vor die beiden Spulen jeweils eine SMD Sicherung bauen zwischen Pad und abgeknipstem Spulenbein. Welchen Wert muss ich denn da nehmen? Finde im Datenblatt des Speichers nichts. Oder kann ich dir einfach Graka+VRAM+GPU zuschicken? :d
 
Was soll ich damit? ich habe keine Spender-GPU da ;-) und ich will das auch nicht mehr machen, weil zu zeitaufwändig
und sicerungen niemals zwischen Spule und Mosfet...immer vor dem Mosfet irgendwo da mit dazwischen packen
 
Ok danke. Eine Spenderkarte bräuchte man ja nicht wenn ich ne GPU und RAM mitschicke. Aber dass es Zeitaufwendig ist, ist natürlich ein gutes Argument. Außerdem lerne ich so ja auch nichts.

Zur Sicherung nochmal, einfach an den Mosfets orientieren für die Stromstärke?
 
vor den Speichermosfets reicht eine 10A Sicherung locker aus.
 
Hab hier mal wieder war, das das Thread-Posten eventuell wert ist wegen erfahrung und so ;)

Geht wie so meist um eine Gigabyte 980ti Gaming G1. Zu 80% ist ja bei der Gigabyte 980ti Windforce oder Gaming G1 die untere vMem Phase unten rechts in der ecke defekt, genauer gesagt die zwei SMD Filter welche mit der zeit hochohmiger werden...so auch hier an und für sich
Nebenbei - an Wärmeleitpaste Spart Gigabyte nicht ^^
IMG_20211220_155938.jpg

Hier die beiden besagten SMD Filter, welche schon stark mitgenommen aussehen aber zum glück hier noch nicht abgefackelt sind und das PCB da zu Kohle verarbeitet haben
IMG_20211220_155839.jpg IMG_20211220_155856.jpg IMG_20211220_155907.jpg

Nach kurzer Messung kam raus - die beiden die eigentlich Messtechnisch 0,0 - 0.1Ohm Widerstand haben sollten, haben hier schon um die 0.8Ohm, und das im Kalten zustand wohlgemerkt. Wenn Strom drüber fließt, werden die wärmer und damit auch Hochohmiger und damit noch Wärmer weil noch mehr Verluste...
Hier nach 3 sekunden nach der Treiberinitialisierung:
vlcsnap-2021-12-24-16h40m18s520.png
(Wärmebild & "normales" bild haben hier leider ein Offset, sieht man aber dass das Wärmebild ein paar Millimeter weiter nach links gedriftet ist)
Das sieht man erst nach der Treiberinitialisierung, weil erst dann kurzzeitig alle RAMs hoch Takten und damit erst die Phasen richtig belastet werden (erst dann arbeiten übrigens auch die restlichen 7 vGPU Phasen, sonst läuft nur die oberste der 8 Phasen)

Messtechnisch war aber erstaunlicherweise der untere DualN Mosfet noch heile, auch die Gate Pins sahen messtechnisch sauber aus. Also kurzerhand wie immer die beiden defekten SMD Filter getauscht gegen eine SMD Sicherung, damit auch da etwas Sicherheit ist falls der Mosfet sterben sollte
IMG_20211220_164509.jpg IMG_20211220_164517.jpg

Nochmal nachgemessen ob alles passt - sieht gut aus. Beide Phasen schwingen sauber lt. Oszilloskop. Also ab damit ins Testsystem ans Testen. Gesagt getan, der Treiber lies sich jetzt initialisieren, ich hatte kurz ein normales Bild - leider nur für ein paar Sekunden, dann war ruhe. Blackscreen und Netzteil hat abgeschaltet. Ich dachte mir schon - gut, okay, hat der untere DualN Mosfet vielleicht doch ein Treffer abbekommen gehabt und den hats jetzt ganz erlegt...
Nach einer Messung kam allerdings raus, das nicht der untere DualN Mosfet defekt war, sondern der von der oberen vMem Phase 😦
Die hats in den ganzen Jahren wo ich das hier schon mache bei den karten - noch nie zerlegt gehabt, und ich hatte von den Gigabyte schon sehr viele Karten aufm Tisch liegen...

Nix gut jedenfalls, und als meine Messspitze dann auf die R33 Spule wanderte um den Widerstand der Speicherspannungsversorgung zu Messen wo mich hier eigentlich um die 80-90Ohm angrinsen sollten (Hynix ram, Samsung karten liegen da bei um die 20Ohm) war meine Stimmung ganz am Boden wo ich nur noch jämmerliche 3Ohm gemessen hatte gegen Masse :(.

Wenn der Widerstand der vMem Rail so niederohmig ist, wars das eigentlich gewesen für den MemoryController in der GPU.
Mir ist absolut unklar, warum es die obere Phase zerschossen hat, und obwohl die vom PCIe Slot mit Strom versorgt wird wo werksseitig eine Sicherung drauf ist - hats dennoch gereicht damit die 12V durch den Mosfet durchgeschlagen haben bis in den Speicher und GPU hinein, das passiert alles innerhalb weniger Millisekunden bis das Netzteil abschaltet und die Sicherung auf dem PCB am Slot ebenfalls durchhaut.
Das ist eben der Nachteil von einem Synchronwandler - wenn der HighSide Mosfet kaputt geht, fließen die 12V am Eingang schön direkt hindurch

Aber ich wollte nix unversucht lassen, ich nahm erstmal einen einzelnen Speicher runter und habe diesen mal durchgemessen. Der Hynix Ram sollte eigentlich um die 5 kOhm haben - der abgelötete hatte nur noch 120 Ohm. Das gab mir ein minimalistischen Hoffnung Schimmer dass die GPU bzw. der Memory Controller in der GPU doch noch überlebt haben könnte.
Also nahm ich erstmal alle Speicher ab, auch die restlichen Ram Chips hatten alle ein Widerstand im bereich zwischen 100 und 150 Ohm. Ich hab danach mit meiner quick&dirty Methode erstmal provisorisch 3 neue gebrauchte Speicher von mir draufgepackt
IMG_20211223_193238.jpg

Zusätzlich habe ich die vMem Phase wieder repariert, zwei neue DualN Mosfets draufgepackt und die PCIe Eingangssicherung getauscht
Dann gings ans Testen mit MATS/MODS als zweitkarte, Ergebnis:
IMG_20211223_193051.jpg

ich traute meinen Augen nicht, genau die 3 Ram-Bänke wo ich provisorisch 3 Rams draufgepackt hatte - zeigten keine Fehler mehr.
Das gab mir Mut, doch mal alle Rams zu tauschen, also auf gings erstmal mit den 3 Rams wieder runter und Pads reinigen
IMG_20211224_094655.jpg

Danach die "neuen" gebrauchten Rams erstmal reballen (die stammen auch nur von Spenderkarten)
IMG_20211224_065111.jpg IMG_20211224_080709.jpg
Sind noch etwas schmutzig
IMG_20211224_081358.jpg

also ab damit ins Ultraschall-Bad
IMG_20211224_081443.jpg

Schon besser:
IMG_20211224_082643.jpg IMG_20211224_082623.jpg

Ab damit auf die Karte und nochmal testen.
Bild kommt wieder, MATS Test sieht gut aus:
IMG_20211224_101443.jpg

Aber der Schein trügt...schon bei den erweiterten Tests mit MODs wo auch der Speicher richtig belastet wird, steigt die karte aus :(
IMG_20211224_103515.jpg

Treiberinitialisierung geht ebenfalls nicht :(
IMG_20211224_101843.jpg


Tja, wie schon befürchtet - Memory Controller Tod - da hilft nur noch eine Spender GPU :(

Ich kann halt leider auch nicht alle Grafikkarten retten, aber ich habs wenigstens mal versucht, auch wenn der Stundenlange aufwand hier vergebens war.
Bei manchen karten habe ich das Gefühl, das die gar nicht mehr leben wollen xD

Ich denke man kann jetzt sagen - wenn es die vMem rail durchgeschossen hat und der Widerstand viel zu gering ist von der vMem rail und selbst wenn der Widerstand von der vMem rail wieder normal erscheint wenn man alle RAMs runtergenommen hat, so hat der Mem Controller dennoch ordentlich eins aufm Deckel bekommen und ist höchster Wahrscheinlichkeit - ebenfalls Tod.
 
Ich mach ja noch viele andere karten nebenbei
, aber ich schreib halt nicht bei jeder karte, da wo es nix besonderes ist, wo es Vieleicht nur ein paar weggerissen teile sind die ich wieder drauf packe oder wo die Reparatur halt mit einmal Speicher Tausch getan ist - da schreibe ich hier nix mehr, weils 0815 Reparaturen sind die eigentlich langweilig sind und es da nix neues gibt zu lernen.
Aber bei der Karte hier fand ich das verhalten der gpu halt interessant das die an und für sich ja wieder Bild bringt, aber nicht unter last, bzw wenn hochgetaktet wird...
Ist aber auch eine Art Wissens-Datenbank für mich hier ^^ aber ich wusste vorher schon, daß vMem rail durchschläge eigentlich immer den Tod des Memory Controllers bedeuten...
 
Hallo Zusammen,

ich bin neu im Bereich der Grafikartenreparatur. Habe mich bis vor kurzem mit Handy's beschäftigt.
Konnte die letzten Wochen einiges von euch lernen was das reparieren und die Technik der Karten angeht.
Danke an dieser Stelle an dich @AssassinWarlord. Deine Videos und Beschreibungen sind Klasse.
Nun habe ich eine Gainward GTX 1080 auf dem Tisch.
Die Karte wird im ersten PCIE Slot nicht erkannt. Im zweiten PCIE Slot läuft sie mit PCIE x8.
Sie tut dann ihren Dienst komplett auch unter Last.
Ich habe schon alles gemessen was ich weis. Alle Spannungen sind natürlich sauber da. Auch mit Oszi.
Auch die ganzen PCIE Lines habe ich geprüft. Alle Kondesatoren in den Lines sind ok.
Alle Lines haben im Diodenmodus auch Verbindung zur GPU.

Nun weis ich nicht mehr weiter. Denke es könnte an der GPU selbst liegen.
Wenn ich die Karte über Riser in Mats teste bekomme ich Fehler 143 - PCI Express bus error.

Vielleicht hat ja jemand noch Ideen dazu.

Danke vorab.
 
Wenn Sie mit pcie 8x Modus geht würde das zur Not auch reichen die so zu lassen, also die hinteren lanes abtrennen/abkleben... Ich hatte so ein Verhalten auch mal bei einer 1080ti.
Hast du wirklich alle Koppel-Kerkos gemessen vom hinteren slot Teil die die gpu anbinden? Und dann eben mal den Widerstand gegen Masse messen von jeder lane (natürlich hinter den Kerkos)
 
Ja. Habe alle gemessen. Liegen alle im gleichen Bereich. Hatte auch alle unten und die Kelkos einzeln gemessen. Alle ok.
Widerstand liegt immer zwischen 26,5-27,8 kOhm.
 
Dann wirds wohl die gpu selber sein :-/
Dann halt auf 8x umbauen und so nutzen. Die kleine 1080 verliert da nicht wirklich an performance
 
Ist manchmal ärgerlich dass man den Fehler nicht findet, ging mir damals bei der 1080ti genauso wo ich tagelang daran gesessen hatte, gegrübelt und gemessen hatte woran das legen kann und letztenendes doch nix gefunden. Hab dann auch einfach die hinteren lanes trennt sodass sie nur noch im 8x Modus lief, auch da war der Performance Verlust maximal messbar aber absolut nicht spürbar.
Von daher - wenn man ein Fehler nicht direkt findet, bringt auch nix da stundenlang Zeit zu investieren nur um Vieleicht 0,2% mehr Performance rauszuholen... Hauptsache die Karte lebt wieder und man kann sie wieder nutze. Da ist man noch mit einem blauen Auge davon gekommen sozusagen ;)
 
Hi,
habe eine RTX2080 auf dem Tisch.
Leider fehlt mir ein Mosfet. "NCP303151"
Weis jemand wo ich den auf die schnelle bekomme. Oder hat jemand einen zum abgeben. Natürlich gegen die Gegenleistung. ;-)
 
ebay China. Oder bei Digikey oder Mouser anfragen.
Ich hab da leider nix auf lager von denen
 
ok Danke. Ich finde auch keine im Land.
Bleibt wohl nur Ali... ;-)
Beitrag automatisch zusammengeführt:

Sind die ned so gängig.?
 
Nope, sind sie nicht, da die auch nur extrem selten kaputt gehen.
 
ok.
Hab den Mosfet auch bei Digikey gefunden.
Kannst du mir ein paar Bauteile nennen die öfter mal die Grätsche machen.
Dann würde ich die gleich mit bestellen. Bei Digikey ist ja Versand kostenlos ab 50€.
Ich will so in Zukunft alles ab GTX1060 machen.
Leider muss ich mich mit Kondensator und anderen kleinen Bauteilen eindecken, da ich bis jetzt nur eine Spenderkarte habe.
Auch sind z.B. Kondesator und Widerstände die ich da habe leider alle zu klein. ;-)
Wenn du auch noch was brauchst bestelle ich gerne mit und lasse es dir zukommen.!
 
Scher zu sagen was man braucht und was nicht...ist halt bei jeder karte unterschiedlich, auch die SMDs haben unterschiedliche größen...was immer geht sind einfache N Mosfets, oder gute 270 oder 330mF /16V Kondensatoren
Hab hier mal eine auflistung gemacht, welche N Mosfets richtig gut sind von Infineon, vorallem der BSC026NE2LS5 ist nen prima allrounder der überall geht
 

Anhänge

  • gute_standard_Mosfets.pdf
    50,1 KB · Aufrufe: 118
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh