Rechner friert ein oder startet neu - Temperaturproblem?

LL0rd

Experte
Thread Starter
Mitglied seit
21.02.2018
Beiträge
103
Hallo Zusammen, ich brauche grade etwas Hilfe bei einem Problem.
Zum Rechner:

AMD Ryzen 9 5950X
GIGABYTE B550 AORUS PRO V2
128GB RAM
GIGABYTE GeForce RTX 3070 EAGLE OC 8G 2.0 (GV-N3070EAGLE OC-8GD)

PC_hwinfo.jpg

Aufgetreten ist das Problem das erste Mal vor ca. 2-3 Wochen. Über Nacht war der Rechner an, ich kam morgens an den Rechner und sah, dass die Monitore eingeschaltet waren, Hintergrundbeleuchtung war an, aber kein Bild und der Rechner hing.

Jetzt war ich 10 Tage im Urlaub. Als ich wiederkam und den Rechner nutzte, hing er nach ein paar Minuten. Nach einem Neustart das gleiche nach ein paar Minuten und irgendwann ging es dann, sodass ich den Rechner den ganzen Tag nutzen konnte. Für mich sah es etwas nach einem RAM-Fehler aus und so habe ich über Nacht den Memtest86+ laufen lassen. Lief bis heute 12 Uhr mit 3 kompletten Passes.

Als ich den Rechner neustarten wollte, kam ich zum Windows Login Screen. Dann war Schluss. Nach einem Reset kam ich nur noch zu diesem Ladekreis von Windows. Auf der anderen NVME im Mainboard ist Fedora Linux installiert. Ich wollte dann Fedora starten. Kam aber auch nicht weiter als zu diesem Lade-Kreis. Dem Gefühl nach ist der Rechner eingefroren, als er zum grafischen Login Interface umschalten wollte. Dann habe ich zum Schluss Linux noch einmal vom USB-Stick booten wollen, Da kam ich zum Login Screen, gab dort die Daten ein und dann ist der Rechner eingefroren.

Ich habe den Rechner jetzt 10 Minuten so stehen gelassen, dann nach einem Reset wieder Windows gestartet. Und nun läuft Windows wieder.

Was ich bisher versucht habe:
Memtest86+ mit 3 ganzen Passes
Furmark läuft gerade seit 20 Minuten.
Andere OS funktionieren auch nicht, wenn der Fehler auftritt.
Prime95 will ich gleich noch laufen lassen.

Ich vermute, dass ich ein thermisches Problem habe. Gerade wenn der Rechner nichts macht und kalt wird, wird das Problem schlimmer. Arbeite ich am Rechner intensiv, ist alles in Ordnung. Aber wie finde ich jetzt heraus, was wirklich an dem Problem schuld ist? Im Rechner ist ein Noctua Kühler verbaut, relativ groß. Und er macht es relativ schwierig Komponenten einfach mal so auf gut Glück aus und einzubauen. Und dass der Fehler so sporadisch auftritt, ist auch noch ein Problem, dass das Testen erschwert.

Wer hat da einen Rat?
 
Was für ein Netzteil ist verbaut?
Wenn es ein paar Jahre alt ist, würde ich testweise mal tauschen.
Ansonsten bliebe noch im BIOS nach Spannungen und Temp zu schauen.
Wenn es stabil booten würde: unter Linux mit lm_sensors nach den Temps schauen oder unter Windows mit hwinfo.
 
Was für ein Netzteil ist verbaut?
Wenn es ein paar Jahre alt ist, würde ich testweise mal tauschen.
Ansonsten bliebe noch im BIOS nach Spannungen und Temp zu schauen.
Wenn es stabil booten würde: unter Linux mit lm_sensors nach den Temps schauen oder unter Windows mit hwinfo.
Verbaut ist ein Seasonic Focus GX-850 Netzteil. Also auch kein Billigteil. Ich habe grade nachgeschaut, gekauft habe ich es im Januar 2022. Es ist also fast 3 Jahre alt, wobei der Rechner im ersten Jahr kaum verwendet wurde.

Hwinfo.jpg

Jetzt läuft das System grade einigermaßen stabil, wenn der Rechner belastet ist. Aktuell läuft Prime95 und es gibt keine Probleme.
Das Problem ist, ich möchte jetzt auch nicht wirklich auf gut Glück anfangen Komponenten zu tauschen. Ich habe leider aktuell kein anderes Netzteil, was ich mal einbauen könnte.
 
Verständlich. "Mal eben" ein Netzteil zu besorgen und zu tauschen ist besonders zur jetzigen Zeit nicht drin ^^.

Die maximal erreichten 90°C sollten nur bei synthetischer Vollast, besser gar nicht, auftreten.
Aber... die CPU boostet gerne da hin, kenne ich von meiner, was mich dann zu einer weiteren Frage bringt:

Wenn du in der gezeigten HWInfoansicht weiter nach unten scrollst, sollte dort ein Eintrag Namens Windows Hardware Error Fehler erscheinen. Steht dort alles auf Null?
 
Verständlich. "Mal eben" ein Netzteil zu besorgen und zu tauschen ist besonders zur jetzigen Zeit nicht drin ^^.

Die maximal erreichten 90°C sollten nur bei synthetischer Vollast, besser gar nicht, auftreten.
Aber... die CPU boostet gerne da hin, kenne ich von meiner, was mich dann zu einer weiteren Frage bringt:

Wenn du in der gezeigten HWInfoansicht weiter nach unten scrollst, sollte dort ein Eintrag Namens Windows Hardware Error Fehler erscheinen. Steht dort alles auf Null?
Die 90°C sind ja aufgetreten, als Prime95 lief. Bzw. es läuft immer noch. Und seit 1.5 Stunden läuft der Rechner einwandfrei. Ich glaube, ich darf einfach nicht mehr aufhören zu arbeiten, denn sonnst friert der Rechner ein. ;)

Ja, der Windows Hardware Error Counter steht auf 0. kA, aber kann es tatsächlich das Netzteil sein? Ich meine, dass Seasonic Teil ist ja nun mal kein Billig-Netzteil mit 10 Jahren Garantie. Dass der Rechner wieso auch immer auf einmal mehr Strom benötigt und das Netzteil diesen Strom einfach nicht liefern kann und dann die Kiste einfriert?

Oder es ist tatsächlich irgendeine Komponente, wie ein BGA, die eine kalte Lötstelle hat und dann einfach keinen Kontakt mehr hat. Und dann friert alles ein.
Oder es ist die Grafikkarte. Vor einiger Zeit ist mir da ein relativ komisches Verhalten aufgefallen.

Ich hatte in Windows eigentlich dauerhaft eine Nutzung von ca. 30% der GPU. Aber der GPU-Takt war bei 210 MHz. Der GPU-Takt erschien mir da etwas niedrig, dafür dass die GPU zu 30% ausgelastet war.
 

Anhänge

  • GPU2.jpg
    GPU2.jpg
    59,4 KB · Aufrufe: 12
  • GPU_Screenshot.jpg
    GPU_Screenshot.jpg
    102,4 KB · Aufrufe: 11
Tjoa, bei dem Fehlerbild ist es leider oft "tausch und guck", denn wenn Tests es nicht direkt zeigen, kann es Bauteilalterung sein wie du schon vermutest.
Wenn du die Grafik im Verdacht hast, dann wäre diese das nächste Ziel für einen Testtausch.
Ein Ort in dem es besonders kritisch und auch immer schön warm ist: Das Netzteil. Daher mein Verdacht darauf, das irgendwas im Teillast Betrieb nicht mehr mag.

Das die Fehler auf 0 sind ist jedenfalls schon ein gutes Zeichen.
Diese treten gerne auf wenn RAM, CPU und IPC nicht gut miteinander können, oder PBO seinen Tribut an der CPU fordert und diese langsam nicht mehr mit zu scharfen Curve Optimizer Werten auf ihren Kernen mag.
 
Tjoa, bei dem Fehlerbild ist es leider oft "tausch und guck", denn wenn Tests es nicht direkt zeigen, kann es Bauteilalterung sein wie du schon vermutest.
Wenn du die Grafik im Verdacht hast, dann wäre diese das nächste Ziel für einen Testtausch.
Ein Ort in dem es besonders kritisch und auch immer schön warm ist: Das Netzteil. Daher mein Verdacht darauf, das irgendwas im Teillast Betrieb nicht mehr mag.

Das die Fehler auf 0 sind ist jedenfalls schon ein gutes Zeichen.
Diese treten gerne auf wenn RAM, CPU und IPC nicht gut miteinander können, oder PBO seinen Tribut an der CPU fordert und diese langsam nicht mehr mit zu scharfen Curve Optimizer Werten auf ihren Kernen mag.
Ich glaube, ich fange damit an, dass ich heute Nacht einfach die Heizung hier im Raum eingeschaltet lasse. Seit 17:30 etwa bin ich wieder an der Kiste und arbeite. Und im Moment läuft alles stabil.

Das Problem am Teile Tauschen ist ja leider, dass wenn man die Teile jetzt sofort benötigt, man einen hohen Preis zahlen muss. Und wir reden ja jetzt hier nicht von kleinen Komponenten. Netzteil sind schon 150 EUR, Mainboard auch um den Bereich. CPU 400, Grafikkarte würde ich nicht tauschen, sondern upgraden auf eine 4080 Super. Ist auch nen Tausender im Angebot, 1.300 Normalpreis. Und irgendwann habe ich dann einen neuen Rechner hier stehen, wenn ich alles ausprobieren will.
 
Ich würde auch nicht gegen neu tauschen, sondern mit irgendwas ausm Regal / vom Kollegen. Nur um auszuschließen.
 
Über Nacht war der Rechner an, ich kam morgens an den Rechner und sah, dass die Monitore eingeschaltet waren, Hintergrundbeleuchtung war an, aber kein Bild und der Rechner hing. Im Rechner ist ein Noctua Kühler verbaut, relativ groß.
Und was genau hat dein Rechner über Nacht gemacht? Wie hoch ist die Temperatur im Raum, wo dein PC über Nacht stehen bleibt? Was die Kühlung angeht, so kann es natürlich auch "nachteilig" wirken, wenn die Temperaturen Außerhalb der Betriebstemperatur dauerhaft anwesend sind - gilt sowohl für "+", als auch für "-" über einen Normalzustand.

Wer hat da einen Rat?
Am einfachsten - PBO + CoreOffset am CPU und EXPO bei RAM komplett abschalten und schauen, ob es was bringt. Kannst zusätzlich auch bei GPU die Taktrate um 5-10% senken.

Lass mal HWInfo über Nacht oder mehrere Nächte den Log in einen File schreiben, damit man was für eine Auswertung hat.

Meine Vermutung - zu wenig Saft an eine bestimmte Lastspitze (wenn unter Last) oder den Rechner wird es zu kalt (wenn dauerhaft Standby bei Zimmertemperaturen <20C) und manche Halbleiter leiten dann nicht mehr und System (wahscheinlich Netzteil bzw. Motherboard) stürtzt ab, so dass du kein BSOD zu sehen bekommst.
 
Zuletzt bearbeitet:
Und was genau hat dein Rechner über Nacht gemacht? Wie hoch ist die Temperatur im Raum, wo dein PC über Nacht stehen bleibt? Was die Kühlung angeht, so kann es natürlich auch "nachteilig" wirken, wenn die Temperaturen Außerhalb der Betriebstemperatur dauerhaft anwesend sind - gilt sowohl für "+", als auch für "-" über einen Normalzustand.
Der Rechner ist über Nacht einfach nur eingeschaltet. Was er genau macht, ich glaube das weiß man bei Windows nicht. Aber der Browser ist offen. Diverse Programme laufen im Hintergrund. Ich würde jetzt nicht sagen, dass der Rechner komplett im Idle Zustand ist, aber er macht schon deutlich weniger, als wenn ich davor sitze. In dem Raum, in dem der Rechner steht, fällt in der Nacht die Temperatur auf +15°C. Die CPU ist aber dauerhaft eingeschaltet.

Am einfachsten - PBO + CoreOffset am CPU und EXPO bei RAM komplett abschalten und schauen, ob es was bringt. Kannst zusätzlich auch bei GPU die Taktrate um 5-10% senken.

Lass mal HWInfo über Nacht oder mehrere Nächte den Log in einen File schreiben, damit man was für eine Auswertung hat.

Meine Vermutung - zu wenig Saft an eine bestimmte Lastspitze (wenn unter Last) oder den Rechner wird es zu kalt (wenn dauerhaft Standby bei Zimmertemperaturen <20C) und manche Halbleiter leiten dann nicht mehr und System (wahscheinlich Netzteil bzw. Motherboard) stürtzt ab, so dass du kein BSOD zu sehen bekommst.

Ich habe PBO und EXPO ausgeschaltet. CoreOffset konnte ich in den Bios Einstellungen nicht finden.
Grundsätzlich ist, sobald der Rechner unter Last ist, also CPU oder GPU, ist alles wunderbar. Ich habe diverse Benchmarks ausprobiert. Sei es Prime95, OCCT, Cinebench, Memtest86+. Während keinem einzigen Benchmark ist der Rechner jemals eingefrohren. Nur eben oft entweder direkt bei Windows Ladescreen / Spinning Circle aber wenn man es erst einmal in Windows rein geschafft hat und den Benchmark ausführt, kann man den Rechner benutzen, als ob nichts wäre.

Was ich jetzt noch gemacht habe:
BIOS war nicht auf dem letzten Stand, ich habe ihn aktualisiert.
GPU durch eine Radeon RX 580G ersetzt.
Alle RAM Module bis auf eins entfernt und das dann durch ein anderes getauscht
NVMEs rausgenommen und Linux per USB-Stick gebootet.
Zum Schluss habe ich noch den Kühler entfernt, die CPU herausgenommen und noch einmal neu eingesetzt. Und dann mit neuer Wärmeleitpaste eingesetzt.

Ein Test-Netzteil habe ich aktuell leider nicht. Ich habe mal ein neues bestellt, kommt aber erst nächste Woche. Oder ich probiere es mit einem anderen Netzteil aus, das aktuell im Fileserver verbaut ist. So richtig Lust, die Kiste auseinander zu nehmen, habe ich allerdings nicht.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh