Festplatte aufgegangen - wie einfach wieder aufhängen?

Leider ist der Rechner wieder abgestürzt. Mensch was ein Stress und warum will er einfach nicht mehr durchlaufen.

Kann denn keiner hier die Logs lesen? An welcher Komponente hängt es?

1698088716696.png


Habe mal die SSD getauscht, auch wenn eigentlich dorthin per swappiness von 0 nichts reingeschrieben wird.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Aber welche HDD genau wäre es? Wie wäre diese ausfindig zu machen? Habe zwei engere Kandidaten, es können aber auch die anderen sein.
 
Zuletzt bearbeitet:
Die wahrscheinlichste Ursache ist nach wie vor die Spannungsversorgung.

Wie dein System aussieht können wir bisher nur raten.
 
Der Rechner ist leider wieder abgestürzt. Mensch ist das ärgerlich. Habe mal noch eine weitere Maschine aufgesetzt und dorthin die vermutlich defekte Festplatte hingesteckt. Bin gespannt wie beide Maschinen nun durchlaufen. Es kann noch der RAM sein. Habe zum Glück auch da Austauschriegel da.
 
Die wahrscheinlichste Ursache ist nach wie vor die Spannungsversorgung.

Wie dein System aussieht können wir bisher nur raten.
Ne das ist alles sicher. Sind doch zwei Stränge zu je 4 Festplatten. Das läuft stabil auch auf den anderen Maschinen.
Beitrag automatisch zusammengeführt:

Aber nachschauen und nachrechnen willst du nach wie vor nicht? :d
Was genau soll ich nachrechnen. Es sieht alles gut aus von der Stromversorgung.
 
Habe gestern den Rechner in zwei geteilt und in den zweiten die mögliche defekte Festplatte gesteckt.

Habe auf dem ersten großen Rechner dann noch eine Kernelpanik erhalten und diesmal sieht es nach dem RAM aus:

1698217818841.png
 
diesmal sieht es nach dem RAM aus
Bei RAM Fehlern steht leider nie dabei das es RAM Fehler sind, außer man hat eben ECC RAM und die entsprechende Plattform, wo man dann eben auslesen kann wie viele RAM Fehler korrigiert wurden und auch auf unkorrigierbare Fehler reagieren kann, so dass man also weiß, wann es RAM Fehler gibt und z.B. ein Riegel ausfällt. Storage Server ohne ECC RAM sind sowieso ein Nogo, da alle Daten ins RAM gehen bevor sie gespeichert werden und wieder im RAM landen, wenn sie gelesen und z.B. übers Netzwerk weitergesendet werden und dabei immer korrupt werden können, wenn das RAM Fehler hat. Noch schlimmer: Wenn die Metadaten des Filesystems die ja auch ins RAM geladen und wenn man eine Daten schreibt oder löscht, verändert wieder auf geschrieben werden, dann wegen RAM Fehlern korrupt werden, kann man im schlimmsten Fall das ganze Filesystem verlieren.
 
Die ECC-Fehler sind in der Praxis selten. Eher stecken die Module nicht richtig. Obwohl man sie fest reindrückt bleiben immer noch kleine Schlitze und Spalte. Das ist mit DDR4 besonders ärgerlich. Bin schon auf DDR5 gespannt, da setze ich auch noch eine Maschine auf.

Ansonsten tausche ich die RAM-Riegel oder reinige nochmal die Plätze und setze die nochmal richtig rein. Aber bislang läuft alles und die obige Kernel-Panik hat nicht zum Systemabsturz geführt.
 
Die ECC-Fehler sind in der Praxis selten. Eher stecken die Module nicht richtig.
Da habe ich meine Zweifel. Ich hatte schon öfter Fälle wo Memtest86 dann im ersten Pass keine Fehler hatte, aber nach mehreren, zuletzt war es ein Fall wo es ab Pass 7 dann massiv Fehler gab und immer wieder das gleiche Bit betroffen war. Kontaktprobleme halte ich da für unwahrscheinlich, diese würden nicht erst im Pass 7, also nach vielen Stunden auftreten.
 
Doch genauso habe ich es auch im Bezug zu der Kernel-Fehlermeldung gelesen.

Hier noch eine offizielle Tainted-Doku, falls Interesse da ist:


Wie gesagt warte ich nun erstmal ab.

Edit: @Holt Kennst jemand noch weitere RAM-Testanwendungen außer Memtest86? Wäre gut wenn es noch mehr gäbe. Wenn die Riegel defekt sind, ist es ja in Ordnung dann wurde das Problem erfolgreich ganz genau identifiziert.
 
Zuletzt bearbeitet:
Welches Netzteil und Welche HDD-Modelle sind denn überhaupt verbaut?
Auch wenn es hier nun scheinbar zu RAM-Fehlern geht, DAS mit dem NT würde mich auch mal interessieren.. welcher 6-Pin hat denn 5V mit drauf?
Habe hier absolut nix zur Hardware gefunden, aber sowas ist mir bisher nur Herstellerspezifisch untergekommen (HP/Dell SpaWa auf dem Board oder so).
Wüsste nicht, dass ich das schon mal an nem normalen ATX-Netzteil gesehen hab.
 
Mensch das MemTest86 ist ja mal eine klasse Anwendung.

Bin ja richtig begeistert. Habe es mal zum Austesten auf dem neuen i9-14900K betrieben und es sieht so aus:

mt86Screen-20231025-145927.png
mt86Screen-20231025-150022.png

Edit: Weiß jemand wie das MemTest auf die Timings 8-8-28 kommt? Eigentlich ist es CL22-22-22.
 
Memtest86 und Memtest86+ sind vor allen dazu da die RAMs auf Fehler zu testen. Hast Du das mal gemacht?
 
Mit dem PassMark Memtest86 habe ich das mal gemacht. Keine Fehler bei 2 Durchläufen gefunden. MemTest86+ habe ich noch nicht ausprobiert.
 
Memtest86+ ist das gleiche in grün, nur eben Open Source. Ich meine das war mal ein Fork, aber die genaue Geschichte müsste ich auch erst googlen.
 
Auch wenn es hier nun scheinbar zu RAM-Fehlern geht, DAS mit dem NT würde mich auch mal interessieren.. welcher 6-Pin hat denn 5V mit drauf?
Habe hier absolut nix zur Hardware gefunden, aber sowas ist mir bisher nur Herstellerspezifisch untergekommen (HP/Dell SpaWa auf dem Board oder so).
Wüsste nicht, dass ich das schon mal an nem normalen ATX-Netzteil gesehen hab.
Das kommt auf die Netzgerät-Serie und dessen Hersteller an. Bei Seasonic sitzt der 5 V unten rechts. Zu sehen im Pinout der jeweiligen Serie:

PSU_Pinout_Voltage_-_Seasonic_FOCUS_SGX.png

Wie man auf dem Pinout gut sieht, fehlt bei Molex mit seinen 4-Pins die 3,3 V Verbindung. Die 5-Pin SATA-Verbindung hat diese noch.
 
6 Pin bezog sich also auf die Buchse des Netzteils und nicht die Buchse am anderen Ende des Kabels, da wären 6 pins nur für GPU und da eben ohne 5V, wie man links unten sieht. Du hast aber den Molex Anschluss genommen und jetzt dann den SATA unten ganz rechts, wenn Du den Molex SATA Adapter entfernt hast. Da die Buchsen und Pinbelegungen modularer Netzteil auf der Netzteilseite nicht genormt sind, bezieht sich niemand auf diese bzw. die Anzahl der Pins dort und man sollte daher auch nie die Kabel von einem anderen Netzteil nehmen, sondern immer die Kabelstränge zusammen mit dem Netzteil ersetzen, außer man kann wirklich 100%ig sicher sein das diese passen.
 
Genau deshalb war ich auch so verwirrt, den 6 Pin gibt es (wie auf dem Bild auch zu sehen) als "Ausgang" an ATX-NTs nur als PCIe-6 Pin - und der hat nunmal nur 12V. Aber es gibt ja trotzdem aus China alle möglichen Adapter, da hatte ich schon Befürchtungen.
D.h. hast du an den ganz normalen Molex-Anschlüssen des NTs (die du durch das Kabelmanagement auch als Adapter bezeichnet hast) die SATA-Adapter angeschlossen..
Aber für das dem Bild nach Seasonic Focus SGX gibt es doch auch Kabel mit 4xSATA, wenn das unbekannte Netzteile dann noch zwei Ausgänge dafür hat, würde das die Adapter-Verbindungen als Fehlerquelle schon mal reduzieren ;-)
 
So der Rechner ist nun nach einem RAM-Ausbau und dessen Reinigung wieder bislang stabil und fast vier Tage lang durchgelaufen. Es war dann wie zuletzt vermutet ein nicht richtig steckendes RAM-Modul. Wahrscheinlich steckte das Modul-2 nicht richtig im Platz drin.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh