PC Neustart unter Last / GPU?

Sadu1988 · 29.08.2021

Hallo liebe Luxxe,

ich bin am Verzweifeln und es zieht mein Gemüt ziemlich herab.

Mein System:
Ryzen 7 5800X
AMD Radeon 6900XT
Gigabyte Aorus B550 V2 Pro
Patriot Viper 4133 16GB
Corsair HX850i 850W
Wasserkühlung

Folgender Sachverhalt:
Wortwörtlich über Nacht kam es unter Last in Spielen zu einem Neustart ohne Fehlermeldung / BSOD oder ähnlichem!
Dabei spielt es keine Rolle, ob es sich um einen Kaltstart oder nach längerem "Ansein" zur Last kommt. Beobachtet werden konnte das Problem in Destiny 2, Path of Exile, aber auch in Risk of Rain, d.h. die Ansprüche an die Hardware stehen wenn nur minimal damit in Verbindung.

Folgendes wurde aktuell beobachtet:

Prime95 läuft ohne Probleme mit Small-FFTs
Der Fehler KANN mit dem Furmark Stresstest reproduziert werden, allerdings NICHT mit dem Stresstest der AMD-Treiber (läuft problemlos)
Spiele führen unter Last zu einem Systemneustart
Die Temperatur scheint keine Rolle zu spielen, da GPU maximal bei 60°C (76°C Junction), CPU bei 80°C max
Übertaktung scheint keinen Einfluss zu nehmen, Fehler auch unter Standard Bios-Werten
KEINE Grafikfehler auf dem Desktop oder in der Zeit vor dem Absturz

Folgendes wurde zur Fehlerbehebung unternommen:

Ram neu eingesetzt
Kabel überprüft
Bioswerte auf Standard gesetzt
Treiber neuinstalliert
V-Memory überprüft, fehlerfrei
Ein 750W Netzteil wurde (erfolglos) getestet, da ich zuerst gehofft hatte, dass mein Netzteil (älteste Komponente im System) das Problem sein könnte.

Zum jetztigen Punkt weiß ich leider nicht mehr, was ich noch unternehmen könnte. Als Kirsche oben auf hat sich mein Bios (trotz anderweitiger Anzeige) beim resetten auf Standard wieder in PCIGen4 gestellt, aber ich betreibe nur einen Gen3 Riser und müsste dementsprechend meinen Loop ablassen und umbauen, weshalb ich jetzt noch auf einen Gen4 Riser warte um weiter nach dem Fehler zu suchen. Trotzdem wäre es klasse, wenn mir jemand helfen könnte und mir den richtigen Denkanstoß gibt, was ich übersehe.

Danke Euch schonmal!

Viele Grüße

Holzmann · 29.08.2021

Gpu ist auch mit zwei einzelnen pcie Strängen vom nt verbunden?

Sadu1988 · 29.08.2021

Holzmann schrieb:
Gpu ist auch mit zwei einzelnen pcie Strängen vom nt verbunden?

Ja, hab auch explizit verschiedene Slots am NT, sowie Single- als auch Multirail getestet.
Ich habe noch Verlängerungskabel zwischengeschaltet, deren Funktionsfähigkeit ich dann nach Eintreffen des Riserkabels testen kann. Ich vermute aber, dass beides nicht defekt ist, da das System in der aktuellen Form ein viertel Jahr lang problemlos lief.

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
...ich betreibe nur einen Gen3 Riser und müsste dementsprechend meinen Loop ablassen und umbauen, weshalb ich jetzt noch auf einen Gen4 Riser warte um weiter nach dem Fehler zu suchen. Trotzdem wäre es klasse, wenn mir jemand helfen könnte und mir den richtigen Denkanstoß gibt, was ich übersehe.

Ganz einfache Sache, Gen4 funktioniert nicht wenn du ein Riser Kabel verwendest.
Im Uefi/Bios die PCIe Slot Configuration auf Gen3 stellen, sollte das Problem beheben.
Möglicherweise macht das Mainboard auch Probleme mit dem Riser Kabel, egal ob Gen3 oder Gen4 eingestellt ist oder ein Gen4 Riser Kabel verwendet wird.
Deshalb würde ich die Grafikkarte zum testen in den oberen PCIe Grafikkarten Slot stecken, wenn die Einstellung Gen3 im Uefi/Bios oder das Gen4 Riser Kabel nichts bringt.
Vielleicht funktioniert ja wenigstens PCIe Gen3 mit dem Gen4 Riser Kabel.

Die Gen3 Einstellung macht kaum einen fps Unterschied zu Gen4.

PCIe 4.0 vs. PCIe 3.0 GPU Benchmark

With the launch of the new GeForce 30 series, PCI Express 4.0 performance has come up into the discussion. To find out exactly what we're talking about,...

www.techspot.com

Edit:

Sadu1988 schrieb:
Patriot Viper 4133 16GB

Den Ram nur auf 3600 MHz laufen lassen, ein höherer takt bringt keine Mehrleistung.
Du kannst die Timings noch anpassen, CL16-16-16-36 sollte kein Problem sein bei 3600 MHz, meistens funktionieren Timings weit darunter auch noch Problemlos bei 3600 MHz und 1,35 Volt Ram Spannung.

Ist das aktuelle Mainboard Bios F13 vom 13 Juli 2021 ist installiert?
Das Bios Update am besten mit einem USB Stick im FAT32 Format im Uefi/Bios per Q-Flash machen, vor und nach dem Bios Update die Uefi defaults laden.

B550 AORUS PRO V2 (rev. 1.0) Support | Motherboard - GIGABYTE Global

Lasting Quality from GIGABYTE.GIGABYTE Ultra Durable™ motherboards bring together a unique blend of features and technologies that offer users the absolute ultimate platform fo...

www.gigabyte.com

Den Ram in Ram Slot A2 und B2 einbauen.

Sadu1988 · 30.08.2021

PCFreak69 schrieb:
Ganz einfache Sache, Gen4 funktioniert nicht wenn du ein Riser Kabel verwendest.
Im Uefi/Bios die PCIe Slot Configuration auf Gen3 stellen, sollte das Problem beheben.
Möglicherweise macht das Mainboard auch Probleme mit dem Riser Kabel, egal ob Gen3 oder Gen4 eingestellt ist oder ein Gen4 Riser Kabel verwendet wird.
Deshalb würde ich die Grafikkarte zum testen in den oberen PCIe Grafikkarten Slot stecken, wenn die Einstellung Gen3 im Uefi/Bios oder das Gen4 Riser Kabel nichts bringt.
Vielleicht funktioniert ja wenigstens PCIe Gen3 mit dem Gen4 Riser Kabel.

Erstmal Danke für das Feedback. Leider ist die Sache dann doch nicht so einfach wie gehofft!
Mir ist bewusst, dass ich zum Betrieb von PCIE Gen4 auch ein PCIE Gen4 Riserkabel benötige, diese gibt es aber.

Beim Resetten des Bios wurde (trotz anderweitiger Anzeige) Gen3 zurück auf Gen4 gestellt, weshalb jetzt natürlich kein Signal ankommt, was aber nicht der zu behebende Fehler ist, sondern nur ein logisches Ärgernis.
Ich kann mir auch nicht vorstellen, dass nach 3 Monaten stabilen Betriebs plötzlich das Riserkabel Ärger verursacht, zumal sowas eher in keinem Signal enden sollte, als wirklich in Neustarts.

Maximal hoch getakteter Ram bringt besonders bei Ryzen CPUs eine deutliche Mehrleistung, 3600 MHz beziehen sich auf die Standard Infinity Fabric Ratio von 1800 Mhz, allerdings läuft meine CPU ohne Probleme auf 1900 MHz Infinity Fabric Ratio, weshalb der Ram die ganze Zeit auf 3800 MHz mit schnelleren Timings lief, da hier deutlich mehr Leistung abzuholen ist im Vergleich zu 3600 MHz. Limitierender Faktor ist IF, aber Leistung ist nicht das Problem. Die RAM-Riegel sind richtig verbaut. Nichtsdestotrotz vermute ich auch hier nicht das Problem, da
a) der PC ein viertel Jahr lang mit den entsprechenden Einstellungen stabil lief
b) auch das zurücksetzten auf die vom Hersteller getesteten Standardwerte keine Besserung erbracht hat
c) Memtest fehlerfrei durchläuft. Ich bin hierbei zwar kein Profi, aber es gibt ein sehr gutes Tutorial, dass die verwendeten Settings als ausreichend ansieht um die Stabilität des RAMs zu gewährleisten.

Das BIOS-Update ist eine sehr gute Idee, auch wenn ich mir dadurch nicht den Ausfall über Nacht erklären kann.

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
Der Fehler KANN mit dem Furmark Stresstest reproduziert werden, allerdings NICHT mit dem Stresstest der AMD-Treiber (läuft problemlos)

Hast du bei den Furmark Settings den Haken bei Xtreme Burn-in gesetzt, oder stürzt der PC auch ohne diese Xtreme Burn-in Einstellung ab?
Möglicherweise überhitz der Grafikkarten Ram, hast du die RX 6900 XT auf Wasserkühlung umgerüstet?
Dann sitzt der Grafikkarten Kühler wahrscheinlich nicht mehr richtig auf dem Grafikkarten Ram.

Am besten neue bessere Wärmeleitpads auf dem Grafikkarten Ram verwenden, wenn du den Grafikkarten Kühler entfernst.

Sadu1988 · 30.08.2021

PCFreak69 schrieb:
Hast du bei den Furmark Settings den Haken bei Xtreme Burn-in gesetzt, oder stürzt der PC auch ohne diese Xtreme Burn-in Einstellung ab?
Möglicherweise überhitz der Grafikkarten Ram, hast du die RX 6900 XT auf Wasserkühlung umgerüstet?
Dann sitzt der Grafikkarten Kühler wahrscheinlich nicht mehr richtig auf dem Grafikkarten Ram.

Ich habe die Standardeinstellungen verwendet, also kein Xtreme Burn-In. Allerdings hatte ich den GPU Ram auch in Verdacht, würde das explizit zu einem Neustart des System führen? Die Ref. 6900XT hat leider keine Sensoren für den Ram :-/.
Im Einsatz ist der Wasserblock von Bykski, der schneidet eigentlich gut ab und die sonstigen Temperaturen sprechen eigentlich auch dafür, dass der Block gut sitzt. Ich wollte es zwar vermeiden, aber vermutlich muss ich an der Stelle nochmal nachprüfen, wäre zumindest ein passender Fehler. Ich werde berichten!

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
Im Einsatz ist der Wasserblock von Bykski, der schneidet eigentlich gut ab und die sonstigen Temperaturen sprechen eigentlich auch dafür, dass der Block gut sitzt.

Lass dich nicht von der guten GPU Temperatur täuschen, der Grafikkarten Ram kann trotzdem überhitzen, der PC stürzt dann einfach ab.

Sadu1988 schrieb:
...aber vermutlich muss ich an der Stelle nochmal nachprüfen, wäre zumindest ein passender Fehler. Ich werde berichten!

Prüfen wird da wahrscheinlich nichts bringen, direkt die Wärmeleitpads auf dem Grafikkarten Ram erneuern, wie schon erwähnt bessere Wärmeleitpads verwenden.

Zyxx · 30.08.2021

Falls die GPU übertaktet / undervolted war, hier für ein paar Tage auf Default laufen lassen und schauen was dann passiert.
Wenn das MPT im Einsatz war, dessen Einstellungen auch per Knopf löschen.
Ansonsten gab es hier im Forum auch Berichte das bei manchen auf einmal nach Monaten ohne Probleme WHEA Fehler inkl. Reboot auftraten:

Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

gibt es eigentlich noch Betroffene mit dem Whea Fehler inklusive Neustart bei den neuen Cpus ? vor allem tritt es scheinbar bei 5900X und 5950X auf ? bei mir lief es die ersten 3-4 Tage eigentlich problemlos und seit gestern hab ich immer wieder mal nen Random Reboot - bis jetzt immer nur im...

www.hardwareluxx.de

AMD gibt auf der hauseigenen Website an das maximal 3200er RAM unterstützt wird, daher würde eine 1600er IF ausreichen, alles darüber wäre Glück laut dieser Definition.
Andererseits sprach (so meine ich) AMD auch schon von einer IF 1866MHz als "Sweetspot" für die aktuelle Ryzen Generation bei einer Präsentation.
Dann läuft es einige Zeit mit einer IF von 1900+MHz, und auf einmal gehen Probleme los, die erst weniger werden wenn das entschärft wird.
Die WHEA Fehler sollten sich im Ereignisprotokoll von Windows finden lassen.

Um es eventuell einzugrenzen könnte es vielleicht aufschlussreich sein einen der RAM Riegel rauszunehmen, wenn es sich bei deinen Patriots um ein 2*8 Kit handelt.
Das würde Stress vom Speichercontroller der CPU nehmen. Andererseits ist mit 8GB dann schon vieles etwas klebrig.
Rein interessehalber, die SOC Spannung im BIOS wurde auf automatisch belassen?

Sadu1988 · 30.08.2021

PCFreak69 schrieb:
Lass dich nicht von der guten GPU Temperatur täuschen, der Grafikkarten Ram kann trotzdem überhitzen, der PC stürzt dann einfach ab.

Prüfen wird da wahrscheinlich nichts bringen, direkt die Wärmeleitpads auf dem Grafikkarten Ram erneuern, wie schon erwähnt bessere Wärmeleitpads verwenden.

Ja, hab gerade nochmal bisl nachgeforscht und im Bykski-Thread gibt es ja gerade eine Riesendiskussion bzgl. der Pads.

Vllt. sollte ich zu TechN wechseln, wobei denen wohl ein guter Mitarbeiter verstorben ist.

Zyxx schrieb:
Falls die GPU übertaktet / undervolted war, hier für ein paar Tage auf Default laufen lassen und schauen was dann passiert.
Wenn das MPT im Einsatz war, dessen Einstellungen auch per Knopf löschen.
Ansonsten gab es hier im Forum auch Berichte das bei manchen auf einmal nach Monaten ohne Probleme WHEA Fehler inkl. Reboot auftraten:

Ryzen 5000 Whea Fehler (inklusive Reboot) was tun....

gibt es eigentlich noch Betroffene mit dem Whea Fehler inklusive Neustart bei den neuen Cpus ? vor allem tritt es scheinbar bei 5900X und 5950X auf ? bei mir lief es die ersten 3-4 Tage eigentlich problemlos und seit gestern hab ich immer wieder mal nen Random Reboot - bis jetzt immer nur im...

www.hardwareluxx.de

Die GPU selbst war nie übertaktet. Der Fehler tritt aber bei Powerlimit -10% gefühlt erst später auf, d.h. es spricht schon etwas für Temperatur / Spannung.

Ein WHEA-Error würde ja immer in einem BSOD enden, oder? - Aber das Ereignisprotokoll zu durchforsten ist eine gute Idee!
Grundsätzlich wurde alles außer der GPU übertaktet / angepasst, d.h. PBO, SOC, Boostverhalten etc., allerdings besteht das Problem auch mit kompletten Defaultsettings (=IF 1600 MHz, SOC etc. auf Auto).

Nur 1 Ramriegel zu testen steht auch noch auf der ToDo-Liste, wobei der Memtest recht zuverlässig zu sein scheint, was es angeht Probleme hervorzurufen und das ist nicht geschehen.

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
...im Bykski-Thread gibt es ja gerade eine Riesendiskussion bzgl. der Pads.
Vllt. sollte ich zu TechN wechseln, wobei denen wohl ein guter Mitarbeiter verstorben ist.

Nur weil die Wärmeleitpads von Bykski nicht gut sind ist nicht automatisch der ganze Wasserblock von Bykski schlecht.
Das ist leider Heutzutage normal das an der Qualität der Wärmeleitpads und Wärmeleitpaste gespart wird in solchen Sets.

Sadu1988 · 30.08.2021

PCFreak69 schrieb:
Nur weil die Wärmeleitpads von Bykski nicht gut sind ist nicht automatisch der ganze Wasserblock von Bykski schlecht.
Das ist leider Heutzutage normal das an der Qualität der Wärmeleitpads und Wärmeleitpaste gespart wird in solchen Sets.

Dessen bin ich mir bewusst, nur war die Anleitung so grausam und der Zusammenbau auch relativ fragwürdig, so dass ich mir in den Arsch beißen würde, wenn ich wegen 100€ meine 1000€ GPU schrotten würde. Es ist nicht sehr aufbauend zu lesen, dass jetzt schon kostenfrei (worauf ich verzichten möchte) neue Pads ausgeliefert werden und bei den alten teilweise (wahrscheinlich) Silikonöl ausgetreten ist. Hinzu kommt, dass ich jetzt sowieso den Loop zerlegen müsste und eine gute Gelegenheit hätte auf ein deutsches Produkt auszuweichen. Auf die schnelle schlägt allerdings wieder die Verfügbarkeit zu, so dass ich vorerst neue Pads testen werde.

Der Teufel ist ein Eichhörnchen!

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
...nur war die Anleitung so grausam und der Zusammenbau auch relativ fragwürdig...

Beim zusammenschrauben musst du auf jeden Fall darauf achten das du die Schrauben vom GPU Kühler (Wasserblock) gleichmäßig anziehst.
Wenn z.B. die erste Schraube vom Wasserblock schon fast bis Anschlag festgezogen wird, wird der Grafikkarten Ram mit 100% Sicherheit nicht richtig gekühlt.

Sadu1988 · 30.08.2021

PCFreak69 schrieb:
Beim zusammenschrauben musst du auf jeden Fall darauf achten das du die Schrauben vom GPU Kühler (Wasserblock) gleichmäßig anziehst.
Wenn z.B. die erste Schraube vom Wasserblock schon fast bis Anschlag festgezogen wird, wird der Grafikkarten Ram mit 100% Sicherheit nicht richtig gekühlt.

Dann wäre der Fehler zumindest direkt erkenntlich, da ich dann zumindest einen deutlichen Hotspot auf der GPU messen könnte, was aktuell nicht Fall ist.

PCFreak69 · 30.08.2021

Sadu1988 schrieb:
Dann wäre der Fehler zumindest direkt erkenntlich, da ich dann zumindest einen deutlichen Hotspot auf der GPU messen könnte, was aktuell nicht Fall ist.

Die GPU ist meistens nicht betroffen bzw. die GPU Temperatur liegt im normalen bereich, wenn der GPU Kühler minimal verkantet angezogen wird.

Sadu1988 · 31.08.2021

PCFreak69 schrieb:
Die GPU ist meistens nicht betroffen bzw. die GPU Temperatur liegt im normalen bereich, wenn der GPU Kühler minimal verkantet angezogen wird.

Ich drücke mir selbst die Daumen, dass es das ist, weil grundsätzlich sollte sich der Kühler in den letzten 3 Monaten nicht so viel verzogen haben, so dass in dem Fall dann über Nacht gar kein Kontakt mehr besteht. Vielmehr hoffe ich, dass der Speicher keinen bleibenden Schaden genommen hat und die neuen Pads dann bald eintreffen. Jedenfalls ist man aktuell auch etwas schlauer was das Spulenfiepen angeht und welche Stellen auf der Karte nicht mit Pads überlappen sollen, so dass der erneute Zusammenbau nicht nur negative Aspekte mit sich bringt.
Das Wochenende wird spannend.

Sadu1988 · 05.09.2021

Update 5.9.21:
Der Loop wurde komplett zerlegt, die Kühler gereinigt und entsprechend neue Wärmepads installiert. Die Temperaturen haben sich um etwa 5°C gebessert, das Problem besteht leider immer noch :-(.

Zusätzlich wurden noch folgende Dinge getestet / ausgeschlossen:

RAM, mit anderem Kit getestet
Y-Cruncher, Prime95 = stabil = CPU unwahrscheinlich
Biosupdate, keine Änderung
Memtest / Speicherdiagnose: Keine Fehler

Bleiben effektiv auch nur noch Mainboard und GPU, wohingegen der Fehler in Spielen sehr reproduzierbar ist, wohingegen normaler Betrieb ohne Last (zB Internetnutzung) ohne Probleme funktioniert.
Vermutlich werde ich die GPU einschicken müssen.

Danke allen (besonders PCFreak69) für den nützlichen Input.

Majohandro · 06.09.2021

Sadu1988 schrieb:
Ich habe die Standardeinstellungen verwendet, also kein Xtreme Burn-In. Allerdings hatte ich den GPU Ram auch in Verdacht, würde das explizit zu einem Neustart des System führen? Die Ref. 6900XT hat leider keine Sensoren für den Ram :-/.
Im Einsatz ist der Wasserblock von Bykski, der schneidet eigentlich gut ab und die sonstigen Temperaturen sprechen eigentlich auch dafür, dass der Block gut sitzt. Ich wollte es zwar vermeiden, aber vermutlich muss ich an der Stelle nochmal nachprüfen, wäre zumindest ein passender Fehler. Ich werde berichten!

Mit HWinfo kann ich die RAM Temperatur meiner Rx 6800 Ref auslesen. Ich denke, dass das auch mit der 6900XT möglich ist.

Sadu1988 · 06.09.2021

Majohandro schrieb:
Mit HWinfo kann ich die RAM Temperatur meiner Rx 6800 Ref auslesen. Ich denke, dass das auch mit der 6900XT möglich ist.

Ja, hatte die ganze Zeit ein anderes Programm genutzt, aber auch die Speicher- bzw. Spannungssensoren zeigen nicht mehr als 55° C an. Die Temperatur ist es also definitiv nicht.

Majohandro · 06.09.2021

Sadu1988 schrieb:
Ja, hatte die ganze Zeit ein anderes Programm genutzt, aber auch die Speicher- bzw. Spannungssensoren zeigen nicht mehr als 55° C an. Die Temperatur ist es also definitiv nicht.

Die Temperaturen sind soweit im grünen Bereich.

Eventuell mal den Speicher und GPU Takt um 300 Mhz senken und schauen, was Furmark dann macht.

Sadu1988 · 07.09.2021

Majohandro schrieb:
Die Temperaturen sind soweit im grünen Bereich.

Eventuell mal den Speicher und GPU Takt um 300 Mhz senken und schauen, was Furmark dann macht.

Naja das Senken des PL auf -10% hat den Absturz etwas hinausgezögert, allerdings ist es ja nicht nur Furmark, sondern eben auch in Anwendungen. Ein Senken des GPU-Takts kommt daher nicht in Frage, da ich noch innerhalb der ersten 6 Monate der Gewährleistung bin und somit ein Austausch noch wenig Probleme machen sollte. Ich bin auch bereits im Kontakt mit der RMA-Abteilung von AMD, allerdings fangen die immer mit der Erfindung des Rads an, der aktuelle Wunsch ist ein Update des Chipsatztreibers, was vermutlich nichts bringen wird.

Hollemolle · 07.04.2022

Hi Sadu, hast du das Problem inzwischen gelöst?

Ich habe eine ähnliche Konfiguration wie du und auch hier ist das Problem, dass die GraKa einen Neustart des PC verursacht bei einigen Games (ca. nach 5 Minuten). Bei anderen wiederrum keine Probleme (z.b. Elden Ring). Kam quasi auch aus dem Nichts.

PC Neustart unter Last / GPU?

Experte

The Saint

Experte

Urgestein

Experte

Urgestein

Anhänge

Experte

Urgestein

Legende

Experte

Urgestein

Experte

Urgestein

Experte

Urgestein

Experte

Experte

Enthusiast

Experte

Enthusiast

Experte

Neuling

Ähnliche Themen