Festplatte aufgegangen - wie einfach wieder aufhängen?

Nemetron

Experte
Thread Starter
Mitglied seit
31.12.2021
Beiträge
1.133
Hallo zusammen,

heute Nacht hat sich einfach eine Festplatte so aufgegangen. Im Linux war sie gar nicht mehr in der lsblk zu sehen. Wurde sie dann in der fstab gemountet kam der Fehler, das der Ordner nicht existiert. Trotz kaltem echten Neustart mit shutdown -r now war die Festplatte ebenfalls nicht zu sehen. Erst ein physischer Ausbau und Wiedereinbau in ein unRAID-Testsystem hat diese wieder erkennen lassen und ich konnte sie danach wieder zurückeinsetzen und sie ging wieder zu mounten.

Kennt jemand dieses Aufhängen-Problem? Ich hatte das schonmal mit einer Toshiba MG09 18 TB und dort ging es auch nur mit einem pysischen Aus- und Einbau. Weiß einer wie man das Problem elegant lösen kann? Es nervt gewaltig nur für diese Festplatte alles umzubauen. Da hängen bis zu 24 andere Festplatten dran und die müssen weiterlaufen.

Danke und Gruß,
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Klingt nach nem Kontaktproblem bei den Sata-Anschlüssen oder schlechtem Sata-/SAS-Kabel. Oder schlechten/defekten Kontakten in ner Backplane, wo die HDDs drin stecken.
Ich hatte z.B. schon Probleme mit 2,5"-Backplanes, wo SSDs regelmässig aus dem ZPool fielen, aber direkt am Sata-Kabel keine Probleme machten.

Prüfe bei der betreffenden Platte mal die Smart-Daten; evtl. siehst Du da CRC-Übertragungsfehler. Attribut ist in der Regel Nr. 199 (Hex C7). Wenn das <>0 ist, hattest Du schon Übertragungsprobleme zu dieser Platte.
Btw, das Attribut wird nicht zurückgesetzt, sondern zählt einfach hoch. Wenn es also weiter ansteigt, dann existiert das Übertragungsproblem weiter.

Kann natürlich auch andere Ursachen haben, z.B. ein Defekt an der HDD selber. Aber Übertragungsprobleme sind da erstmal einfacher zu prüfen und IMO auch wahrscheinlicher.
 
Zuletzt bearbeitet:
Die Festplatte hat keinerlei SMART-Fehler, auch keine CRC-Fehler. Kann es mir auch nicht erklären, deswegen frage ich.
 
Heute Nacht gab es leider wieder das gleiche Problem und folgendes ist genau passiert:

1. Der ganze Rechner ist nicht mehr ansprechbar gewesen
2. Ich fahre diesen per Ausschalter runter
3. Fahre ihn wieder hoch und zwei Festplatten laufen nicht. Die fstab ist natürlich die gleiche. Bei mount -a kamen Fehlermeldungen, die ich leider nicht mehr auffinden kann. Wenn man fsck getätigt hat, kamen Meldungen, das der Superblock nicht funktioniert. Habe dann e2fsck -835, bin mir bei der Zahl nicht sicher, eingegeben und es kamen wieder Fehlermeldungen.
4. Habe dann die Festplatten ausgebaut und an ein unRAID-System angeschlossen. Wurden sofort erkannt und auch der Festplatten-Inhalt.
5. Daraufhin unRAID wieder runter und an den Rechner angeschlossen und die Festplatten laufen wieder

Also das gibs doch nicht. Und diesmal hats den ganzen Rechner lahmgelegt und für Stunden von Ausfällen gesorgt. :/
 
Du hast 25 Festplatten..? Wie sind die mit Strom versorgt? Zufällig y-Kabel an y-Kabel an y-Kabel...?
 
Da schaut ich generell dauernd rein
Code:
dmesg

und. Das läuft bei mir andauernd in einer shell

Code:
tail -f /var/log/messages

--

Kontaktfehler kann ausgeschlossen werden?
Ist Hotswap aktiv vom Mainboard und auch vom linux kern unterstützt?
 
Du hast 25 Festplatten..? Wie sind die mit Strom versorgt? Zufällig y-Kabel an y-Kabel an y-Kabel...?
Nicht ganz aber es ist eine verdichtete Konstruktion. Das könnte den Absturz verursacht haben. Ich schaue es mir weiter an.
Beitrag automatisch zusammengeführt:

Da schaut ich generell dauernd rein
Code:
dmesg

und. Das läuft bei mir andauernd in einer shell

Code:
tail -f /var/log/messages

--

Kontaktfehler kann ausgeschlossen werden?
Ist Hotswap aktiv vom Mainboard und auch vom linux kern unterstützt?
Die Warnmeldungen sind alle weg, seitdem ich ein Live-Debian benutzt habe und mit fsck alle Partionen überprüft habe. Es wurde auf dem BS-Festspeicher auch einiges gefunden und repariert.

Jetzt läuft wieder alles. Auch die zwei Festplatten, die mal ausgebaut waren, laufen wieder. Sieht jetzt alles gut aus. Schauen wir mal weiter.
 
defekten superblock hatte ich mal an einem BTRFS System nach defekt vom Cache und anschließendem ausschalten über Taster.

Ergebnis war bei mir kompletter Datenverlust. (ein hoch aufs Backup)
 
Du hast 25 Festplatten..? Wie sind die mit Strom versorgt? Zufällig y-Kabel an y-Kabel an y-Kabel...?
Die sind per 6 Pin zu Molex > dann Molex zu SATA > und SATA x1 zu SATA x 4. Das zwei Mal, also 8 Festplatten pro 6 Pin.
Beitrag automatisch zusammengeführt:

defekten superblock hatte ich mal an einem BTRFS System nach defekt vom Cache und anschließendem ausschalten über Taster.

Ergebnis war bei mir kompletter Datenverlust. (ein hoch aufs Backup)
Die Meldung konnte ich nachstellen. Das war ein einfacher Anfängerfehler. Nicht das Gerät ist zu überprüfen sondern die Partition. Also nicht /dev/sda sondern /dev/sda1.
 
Die sind per 6 Pin zu Molex > dann Molex zu SATA > und SATA x1 zu SATA x 4. Das zwei Mal, also 8 Festplatten pro 6 Pin.
In dem Fall würd ich da mal ansetzen - sind die ausgefallenen Festplatten am selben Strang versorgt gewesen?
 
In dem Fall würd ich da mal ansetzen - sind die ausgefallenen Festplatten am selben Strang versorgt gewesen?
Genau, ist alles ein Strang. Dein Betrag war klasse. Kann mir leider auch vorstellen, das es daran liegt. Leider muss der Build dann richtig umgebaut werden, arg. :/

Edit-1:

So sieht der Strang aus:

1697800683471.jpeg


Edit-2:

Meinst du denn 6 Pin zu SATA x2 oder SATA x4 und dann SATA zu SATA x4, max. zwei mal würde gehen?
 
Zuletzt bearbeitet:
Gute Frage - Von der Stromstärke sollte das ja passen auf nem 6-Pin.
Viele Adapter bringen auch ein höheres Fehlerpotential. Ich würd erstmal schauen ob einfach einer der Adapter nicht ordentlich funktioniert.

Aber ich bin da echt kein Spezialist - vllt meldet sich ja jemand der sich da besser auskennt.. :d
 
Das sieht nach Problemen aus!

Ja, aber passen die Ströme der einzelnen Stränge und Verbindungen? Gerade die des Molex auf SATA? Die des Stränge des Netzteils?
Eigentlich passt alles und es läuft meistens störungsfrei. Vorne an der 6 Pin Buchse wird es auch nicht zu heiß. Weiß nicht was ich sonst noch wie messen soll?
 
Eigentlich passt alles und es läuft meistens störungsfrei.
Meistens, aber wenn es dann mal nicht störungsfrei läuft, machst Du hier einen Thread auf und zeigst damit, dass es Dich ja doch stört.
Vorne an der 6 Pin Buchse wird es auch nicht zu heiß.
Die wäre auch weniger meine Sorge als der Molex auf SATA Adapter, der ja nur dafür ausgelegt sein dürfte ein SATA Laufwerk zu versorgen und nicht gleich 4. Außerdem sind solche Adapter genau wie Y-Kabel generell mit Vorsicht zu genießen, die Qualität ist oft unterirdisch und ich habe da von Verschmorungen gesehen, weil die Verbindungen offenbar nicht optimal waren. Man kann sich das alles zurechtbasteln, aber es bleibt eine Bastellösung und da muss man immer mit Problemen rechnen.
 
Ja, aber passen die Ströme der einzelnen Stränge und Verbindungen? Gerade die des Molex auf SATA? Die des Stränge des Netzteils?
Joah, hab ich ja geschrieben... bringen viel Fehlerpotential und ist nicht mein Fachbereich...
 
Mir ist der Rechner heute wieder abgestürzt. :/

Nun war es die Kombination 6-Pin-zu-SATA-x4 und dort an zwei SATA-Steckern je einen SATA-zu-SATA-x4 Kabel angeschlossen, also insgesamt nur drei Kabel. Habe jetzt zwei Kabel mit 6-Pun-zu-SATA-x4 angeschlossen und hoffe das es durchläuft. Ansonsten ist es was anderes.
 
Schau doch mal ob die betroffenen Platten unerwartete Spannungsabfälle registrieren, wenn dies passiert. Wie sind die Platten eigentlich von der Datenseite her angeschlossen?
 
Mit welchen Mitteln soll ich denn registrieren ob unerwartete Spannungsabfälle auftreten? Sind alle per SATA angeschlossen.
Beitrag automatisch zusammengeführt:

Mir ist noch aufgefallen, das die 6-Pin-Buchse aus fünf Leitern belegt ist. Die SATA-zu-SATA-x4-Kabel haben dann aber nur vier Kabel. So als ob die 3,3V oder 5V Leitung einfach weggelassen wurde?

Edit:

Das sind nämlich diese Kabel hier:

1697964982776.png


Und wie gesagt führen da nur vier Kabel raus, eigentlich müssten es fünf sein.
 
Zuletzt bearbeitet:
Habe mich etwas schlau gemacht. Der fünfte graue Pin wäre wahrscheinlich der 3,3 V. Der findet bei den Festplatten aber ohnehin keine Anwendung. Also nur 12 V und 5 V. Es bleibt rätselhaft. Eigentlich sollten doch 8 Festplatten an einem P/SATA-6-Pin-Strang 24/7 möglich sein? Oder ist das zuviel Leistung?
 
estplatten an einem P/SATA-6-Pin-Strang 24/7 möglich sein
Dein P/SATA-Strang hängt doch an Molex-Stecker, oder? Molex kann je nach Ausführung zwischen 60 und 132W anliefern, aber hier ist uter anderen auch die PIN-Größe und Kabelquerschnitt entscheidend. Ich würde also generell mit ca. 60W ohne es nachzumessen ausgehen, damit du mehr oder weniger sicher bist.

Und jetzt kommet es auf deine Platten und dessen Arbeits- und Anlaufströme an, ob du 4 Stück davon je Anbindung gleichzeitig betreiben kannst oder nicht. Typischerweise würde ich ad hoc 2A (in der Regel weniger) je Platte berechnen, sprich (2A*12V*4=96W -> eher nö, als ja. Zumal sollte man nicht nur die 12V, sondern auch die 5V-Anbindung auch bedenken, wenn es sich um 3,5Zoll-Platten handelt.

heute Nacht hat sich einfach eine Festplatte so aufgegangen.
Nach Molex kommt bei dir der P/SATA-Strang - hier hast du z.B. für 12V drei Pins, die mit je 1,5A beliefert werden, sprich max 54W je Connector, was du dann weiter unter deinen Platten mit etwas Verlust noch weiter aufteilen willst... also doppelt nö, als ja und wird ggf. auch erklären warum für eine Platte dann es doch zu wenig war.
 
Zuletzt bearbeitet:
Dein P/SATA-Strang hängt doch an Molex-Stecker, oder? Molex kann je nach Ausführung zwischen 60 und 132W anliefern, aber hier ist uter anderen auch die PIN-Größe und Kabelquerschnitt entscheidend. Ich würde also generell mit ca. 60W ohne es nachzumessen ausgehen, damit du mehr oder weniger sicher bist.

Und jetzt kommet es auf deine Platten und dessen Arbeits- und Anlaufströme an, ob du 4 Stück davon je Anbindung gleichzeitig betreiben kannst oder nicht. Typischerweise würde ich ad hoc 2A (in der Regel weniger) je Platte berechnen, sprich (2A*12V*4=96W -> eher nö, als ja.
Nicht mehr, das wurde umgebaut. Sondern der hängt direkt an der 6-Pin SATA/PATA-Buchse.
 
Du must halt bedenken, dass sowohl Molex, als auch SATA-Buchse für genau einen Connector an Gegenstelle mit genügend Leistung für die Zukunft entwickelt waren. Ich meine selbst die größten Platten verbrauchen z.Z. in der Regel weniger als 40W für Anlauf, wodurch man immer noch Reserven nach oben hat, aber je nach Festplatte kann es schon mit zwei Stück je Adapter kritisch werden.

Also schau dir genau deine Platten an und rechne nach, ob es noch past - falls ja, dann ok, falls nein (wovon ich ausgehe), dann muss du nochmal umbauen. :)
 
Mit welchen Mitteln soll ich denn registrieren ob unerwartete Spannungsabfälle auftreten?
Das kann man in den S.M.A.R.T. Werte auslesen.

So als ob die 3,3V oder 5V Leitung einfach weggelassen wurde?
Das sieht man doch an den Farben!

Der fünfte graue Pin wäre wahrscheinlich der 3,3 V.
Richtig, denn der wäre orange und ja, nur 1,8" HDDs haben die 3,3V benötigt, die wurden aber schnell von den (mSATA) SSDs gekillt und es dürfte kaum je eine den Weg in einen Desktop gefunden haben. Die 3,3V wurden inzwischen ja auch von den SATA Stromsteckern entfernt und die Bedeutung der Pins an den Platten umdefiniert.

Die Frage wie die Platten von der Datenseite her angebunden sind, ist leider noch nicht beantwortet.
Molex kann je nach Ausführung zwischen 60 und 132W anliefern, aber hier ist uter anderen auch die PIN-Größe und Kabelquerschnitt entscheidend.
Eben, genau da liegt vermutlich das Problem, es gibt zwar Hersteller die solche Adapter anbieten, aber die scheren sich eben nicht um die Spezifikationen, sondern darauf muss der User selbst achten, die wollen mit sowas wie einem 4-fach SATA Adapter eben einfach Geld verdienen.

Typischerweise würde ich ad hoc 2A (in der Regel weniger) je Platte berechnen, sprich (2A*12V*4=96W -> eher nö, als ja.
Bei Enterprise HDDs können es auch mehr als 2A sein.

Zumal sollte man nicht nur die 12V, sondern auch die 5V-Anbindung auch bedenken, wenn es sich um 3,5Zoll-Platten handelt.
Eben.
 
Das sieht man doch an den Farben!
Naja aber nur wenn unterschiedliche Farben verwendet werden. Oft sind es ja nur schwarze Kabel.
Richtig, denn der wäre orange und ja, nur 1,8" HDDs haben die 3,3V benötigt, die wurden aber schnell von den (mSATA) SSDs gekillt und es dürfte kaum je eine den Weg in einen Desktop gefunden haben. Die 3,3V wurden inzwischen ja auch von den SATA Stromsteckern entfernt und die Bedeutung der Pins an den Platten umdefiniert.
Interessant.
Die Frage wie die Platten von der Datenseite her angebunden sind, ist leider noch nicht beantwortet.
Doch sind alles SATA-Festplatten, angeschlossen an 8-SATA-Buchsen direkt an die Hauptplatine. Keine Adapterkarte.
Eben, genau da liegt vermutlich das Problem, es gibt zwar Hersteller die solche Adapter anbieten, aber die scheren sich eben nicht um die Spezifikationen, sondern darauf muss der User selbst achten, die wollen mit sowas wie einem 4-fach SATA Adapter eben einfach Geld verdienen.
Wie gesagt läuft der Rechner nun mit 6-PIN-SATA/PATA zu SATA x4 und davon zwei Stück. Das muss auf jeden Fall funktionieren, ansonsten ist es was anderes.
 
Da hängen bis zu 24 andere Festplatten dran und die müssen weiterlaufen
Für sowas nimmt man nach Möglichkeit keine Adapterkabel, sondern einen HBA (bspw. LSI 3008)+SAS-Expander-Backplane.

So sieht der Strang aus:

1697800683471.jpeg
Diese SATA-und 4-Pin-Molex Adapterkabel sind in der Regel mit zu "dünnen" Kabeln (18AWG) hergestellt und können bis 30°C max. 9,5A pro Leitung ab. Deshalb ist es keine gute Idee, daran 8 Festplatten gleichzeitig anzuschließen. Hinweis: bei Storage-Servern verwendet man jeweils einen 16AWG-Kabelstrang pro 8 Festplatten. - Jede 16AWG-Leitung ist bis 30°C mit 20A max. belastbar. 16AWG bei Molex>SATA Adaptern findet man leider selten.

Wo kommen >9A her, wenn die Festplatte "nur 5W" ziehen soll?:

Zum Vergleich mal der Energieverbrauch einer relativ genügsamen 10TB-SAS-Festplatte, Typ Ultrastar He10 Datenblatt S.36. Wie zu sehen, können grade beim Anlaufen/Random 4KB Lesen+Schreiben recht hohe Lastspitzen auftreten.
1698006940250.png


Überprüfe mal, was eine einzelne Festplatte an Strom auf der 5V/12V Leitung an A braucht und rechne das für alle verwendeten Platten zusammen.

Zum Netzteil:
- Dann vergleiche die benötigten A auf der 5V-/12V-Leitung mit dem, was das Netzteil liefert.
Übersteigt die benötigte Energie das, was dein Netzteil dauerhaft liefern kann, bricht die Spannung in der Lastspitze ein.
Bricht die Spannung zu sehr ein, reicht die Versorgungsspannung eventuell nicht mehr aus. Vgl. typische Spannungstoleranz für o.g. Festplatte (S.35).:
1698009354982.png

Ob die Spannung des Netzteils auf der 5V- oder 12V-Leitung zu weit einbricht, lässt sich auch mit einer Spannungsmessung (per Multimeter, oder besser Oszilloskop) überprüfen.

Zusammenfassung
Wahrscheinlich hängt das "Verschwinden" der Festplatte mit der Stromversorgung zusammen.
Abhilfe:

+Festplatten auf mehrere Kabel verteilen, bei 18AWG-Adapterkabeln nicht mehr, als 4 Platten anschließen, Steckverbinder reduzieren
+Netzteil Ampere auf 5V/12V checken (siehe Aufkleber auf Netzteil), mit benötigtem Laststrom der verwendeten Festplatten (s. Datenblatt) vergleichen. Ggf. Messung der Netzteil-Spannungsstabilität. Eventuell stärkeres Netzteil beschaffen
 
Zuletzt bearbeitet:
Für sowas nimmt man nach Möglichkeit keine Adapterkabel, sondern einen HBA (bspw. LSI 3008)+SAS-Expander-Backplane.
Die Adapter sind ja auch der Stromseite, ein HBA wäre für die Datenseite und da hat Nemetron ja gerade darüber geschrieben:
Doch sind alles SATA-Festplatten, angeschlossen an 8-SATA-Buchsen direkt an die Hauptplatine. Keine Adapterkarte.

Wie zu sehen, können grade beim Anlaufen/Random 4KB Lesen+Schreiben recht hohe Lastspitzen auftreten.
Ja, wäre auch interessant zu wissen ob die Platten durchlaufen oder in den Standby versetzt werden, wenn länger nicht darauf zugegriffen wird.
 
Welches Netzteil und Welche HDD-Modelle sind denn überhaupt verbaut?

Zusammenfassung
Wahrscheinlich hängt das "Verschwinden" der Festplatte mit der Stromversorgung zusammen.
Abhilfe:

+Festplatten auf mehrere Kabel verteilen, bei 18AWG-Adapterkabeln nicht mehr, als 4 Platten anschließen, Steckverbinder reduzieren
+Netzteil Ampere auf 5V/12V checken (siehe Aufkleber auf Netzteil), mit benötigtem Laststrom der verwendeten Festplatten (s. Datenblatt) vergleichen. Ggf. Messung der Netzteil-Spannungsstabilität. Eventuell stärkeres Netzteil beschaffen
+ Prüfen, ob das Netzteil mehrere Rails hat und ob ggf. auf einer Schiene zu viele Platten angeklemmt sind.

Je nachdem wie wichtig das System ist, würde ich nicht lange Fackeln und Adapterkabel und Netzteil direkt austauschen. Beim Netzteil vorher wie von corross vorgeschlagen genau hinschauen / berechnen, welche Stromstärken das Netzteil liefern können muss.
 
Mir ist der Rechner vorhin vor meiner Nase noch in einer aktiven ssh-Sitzung wieder abgestürzt und das mit 2*4 SATA-Strängen. Das wird was anderes sein. Habe mit
dmesg

herausgefunden, das eine Festplatte fsck-Fehler hatte. Habe diese dann lösen lassen:

1698048181311.png


Und habe noch eine weitere Festplatte ausgebaut. Die hat den SMART-Fehler 191 G_Sense_Error_Rate von 2. Prüfe die auf einem anderen Rechner auch noch mit fsck. Hoffe das wars dann.

Verstehe leider immer noch nicht, wie eine oder zwei Festplatten das BS in htop 400 bringen und es dann ganz abstürzen lassen. Dachte eigentlich Linux wäre resilienter.
 
Zuletzt bearbeitet:
Und habe noch eine weitere Festplatte ausgebaut. Die hat den SMART-Fehler 191 G_Sense_Error_Rate von 2.
Wie schwerwiegend dies ist, hängt davon ab was für eine HDD das ist. Es habe einige Seagate Platten bei denen ist der Sensor extrem geradezu hysterisch und der Zähler dreht schneller als die Plattern. Generell sollte man aber auf eine ordentliche Befestigung der Platten achten. Aber zwei Auslösungen des G-Sensors sind sicher nicht dafür verantwortlich das die Platten verschwinden.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh