RAID-5 entwickelt Eigenleben

datengrab

Neuling
Thread Starter
Mitglied seit
01.03.2012
Beiträge
4
Hoi zusammen,

Ich hab da ein eigenartigen Fall von Eigenleben bei einem Sharkoon RAID-5 Bay. Verbaut sind 5x3TB WD RED (alle HDDs vor Benutzung auf Sektorenfehler überprüft) und ist noch mit TrueCrypt verschlüsselt.

Seit einem Monat bricht die Übertragung auf den Speicher ein. Egal wie oft ich die Übertragung neu starte, nach übertragenen x-GB bricht die Übertragung ein. 2x war das Filesystem angeknackst und konnte aber wieder geflickt werden. Danach ging das auch wieder mit Übertragung.

Jetzt ist es so, dass es wieder hängt aber Filesystem ist laut chkdsk in alles Ordnung. Wenn eine HDD kaputt gehen würde, würde das Teil fiepen wie ein Feuermelder macht es nicht. SMART-Werte kann ich bei einem RAID ja nicht überprüfen. Gibt sonst irgendwelche Software mit dem man ein RAID auf Fehler checken kann ? Mir fällt jetzt nurnoch chkdsk mit zusätzlicher Sektorenüberprüfung ein, bin da aber unsicher ob das bei einem RAID-5 überhaupt sinn macht ?!? Das Teil müsste dann 3 Tage durchlaufen ... yay :-[

Greetz
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ich tippe da eher auf das Sharkoon RAID-5 Bay das Probleme macht anstatt die Platten.
 
Das RAIDs keine Backups ersetzen, ist Dir hoffentlich bekannt und wenn nicht, dann erstelle Backups zumindest der wichtigen Dateien auf dem RAID. Dann schau mal ob Du die S.M.A.R.T. Werte auslesen kannstm und poste sie hier. Was man als den günen Tod bei den WD Green bezeichnet weißt Du? Die Red wurden eine Zeitlang mit den gleichen 8s Defaulteinstellung für den Unload-Timer ausgeliefert, von den 5 Red 3TB die ich in meinem N54L verbaut habe, hatten 4 den Timer deaktiviert, bei der 5. war er auf eben diese 8s eingestellt und das war die mit der höchsten Seriennummer. Den Unload habe ich dann damals mit WDIDILE3 deaktiviert.

Das könnte hier auch die Ursache sein, aber das kann nur ein Blick auf die S.M.A.R.T. Werte zeigen. Es gibt inwischen auch das das "WD5741 utility" um den LLC Timer der Red einzustellen. Bzgl. der Überprüfung: Ein Scrubbing im Rythmus von einem oder zwei Monaten sollten bei einem RAID 5 bei Heimanwendern eigentlich Standard sein, aber den Zustand der Platten sollte man auch regelmäßig anhand der S.M.A.R.T. Werte überwachen.
 
Zuletzt bearbeitet:
So einer einer kleinen Ewigkeit melde ich mich zurück. Vielen Dank für die Kommentare ;) haben mir ein Stück weit weiter geholten.

Bei der Fehlersuche ist mir aufgefallen, das die RAID5-BOX mit Seagate Barracudas (Firmware CC4C), bestückt sind und keine WD Red Platten drin sind, die sind in der anderen RAID5-Box von mir und werden untersucht sobald das hier wieder richtig läuft. Alle Festplatten hab jetzt durch den "qucik test" + "extended test" der WD Utility: Data Lifeguard Diagnostic for Windows laufen lassen. Gab keine Fehlermeldung, auch nicht beim Quicktest von dem Seagate Tool "Seatools".

Hier die SMART-Werte der 5 Barracudas:
#1
1#_HDD_11-Dezember-2015_11-34.png1#_HDD_SeaTools.PNG1#_HDD_WD_1.PNG1#_HDD_WD_2.PNG

#2
2#_HDD_11-Dezember-2015_02-37.png2#_HDD_SeaTools.PNG2#_HDD_WD_1.PNG2#_HDD_WD_2.PNG

#3
3#_HDD_08-Dezember-2015_16-05.png3#_HDD_SeaTools.PNG3#_HDD_WD_1.PNG3#_HDD_WD_2.PNG

#4
4#_HDD_08-Dezember-2015_16-00.png4#_HDD_SeaTools.PNG4#_HDD_WD_1.PNG4#_HDD_WD_2.PNG

#5
5#_HDD_05-Dezember-2015_01-28.png5#_HDD_SeaTools.PNG5#_HDD_WD_1.PNG5#_HDD_WD_2.PNG

Manche SMART-Werte sind ja schon ziemlich groß, sind die Werte für Platten im RAID normal oder darüber hinaus ?

Nach Unload-Timing für Barracudas geschaut, konnte dazu aber nichts finden.

Firmware kann ich noch updaten, allerdings weis ich nicht ob man das bei Platten aus einem RAID so ohne weiteres machen kann ?
Das werde ich wohl bei einer Platte mach versuchen, updaten und reinstecken, gehts nicht rebuild von der Platte machen lassen. Sollte theoretisch ja funktionieren.

Morgen stecke ich die Barracudas mal in das andere Baugleiche Sharkoon RAID-5 Gehäuse. Mal sehen wie es dann aussieht.

Greetz datengrab

PS: Bild 2 ist eine Aufnahme von den Werte die mir die SeaTools ausgespuckt haben. Angeschlossen über USB3.
 
Zuletzt bearbeitet:
Rohwerte sollte man sich bei Seagate HDDs immer hexadezimal anzeigen lassen, die dezimale Anzeige ist für einige Attribut unvorteilhaft, so werden z.B. bei den Lese- und Suchfehlern die Anzahl der Fehler und die der Vorgänge in verschiedenen Bytes im Rohwert angezeigt, aber das kann man eben nur unterschieden, wenn man es sich hexadezimal anzeigen lässt. Einige Platten wurden schon zu warm und bei zweien gab oder gibt es Kommunikationsprobleme mit dem Host Controller.

Es gibt keine schwebenden oder wiederzugewiesenen Sektoren, die Platten sind also in Ordnung, aber die Barracuda sind keine geeignetne Platten für RAID Betrieb, das sind einfache, billige Desktopplatten. Für den Einsatz wären NAS Platten wie die Seagate NAS oder WD Red(Pro) besser.

PS: Wenn möglich dann solltest Du CrystalDiskInfo bevorzugen, die Portable Standard Edition reicht und ist frei von Werbung, einfach auf den Link der Portable klicken, warten bis die zip Datein automatisch downgeloaded wird, die zip speichern und irgendwohin komplett entpacken, dann DiskInfo.exe dort starten.
 
Zuletzt bearbeitet:
Vielen Dank für die Antwort, bei den SMART-Werten werde ich das so in Zukunft machen!

Hab jetzt weiter recherchiert und bin dann auf 3 interessante Berichte gestoßen:
Known issues with Seagate Barracuda 7200.14 Desktop Drives
https://www.backblaze.com/blog/3tb-hard-drive-failure/
https://www.backblaze.com/blog/hard-drive-reliability-q3-2015/

Haben das gleiche Model im Einsatz gehabt: bis zu 43% Ausfallquote. Bei der Firmware haben die Bockmist gebaut. Neuste Firmware aufgespielt und getestet, läuft soweit wieder. 75Gb rüber kopiert und CRC-Checksummen sind die gleichen. Noch keine Abweichung.

1x RAID 5 hab ich 2012 mit 5x Barracuda bestückt was nicht besonder klug war. Danach kamen die WD Red und die hab ich dann auch in mein zweites RAID5 gepackt. Das macht noch keine zicken, schau ich mir die Tage aber dennoch an. Sicher ist sicher.

Greetz
 
Das mit der Ausfallquote liegt an der unpassenden Auswahl für die Nutzung bei Backblaze, die Desktop HDDs vertragen eben keinen Dauerbetrieb, die sind nur auf 2400 Betriebsstunden pro Jahr ausgelegt und haben auch keine Sensoren um die Vibrationen der anderen Platten zu kompensieren.

In den ersten beiden Jahren im Betrieb waren die Ausfallraten auch nicht sehr hoch, erst danach sind sie massiv ausgefallen:
Die haben dann aber auch so viele Betriebsstunden runter wie in über 7 Jahren bei vorgesehener Nutzung. Statt wilde Spekulationen anzustellen, hätte Backblaze einfach anerkennen sollen, das die Platten eben nach 2 Jahren Bauerbetrieb und vermutlich hohem Workload einfach aufgeschlissen waren.

Billige Platten haben eben nicht die Haltbarkeit wie Enterprise Platten, dafür kosten sie auch weniger und Backblaze möchte eben billig Platten nutzen um billigen Online Backup Speicherplatz anzubieten. Was man daraus lernen kann ist, das man die für den Einsatzzweck passende Platte nehmen sollte oder mit weniger Haltbarkeit rechnen und damit die Platten früher austauschen muss. Was am Ende günstiger kommt, muss jeder selbst wissen und hängt natürlich auch davon ab, wie sich die Preise entwickeln. Immerhin setzt Backblaze nun statt der günstigsteren WD Green (auch eine einfache Desktopplatte) nun die WD Red ein, die immerhin für Dauerbetrieb zugelassen ist und auch Vibrationssensoren hat, wenn auch nur für bis zu 8 Platten in einem Gehäuse.

Zicken machen Platten im RAID nicht nur wenn sie keine Vibrationssensoren haben sondern auch, wenn sie keine TLER haben, bzw. bei Seagate ERC. Damit meit man den Timeout bei Problemen, also wie lange die Platte z.B. maximal versucht eine problematischen Sektor doch noch zu lesen und dazu wiederholen sie eben den Lesevorgang bis der Timeout erfolgt. Bei Platten mit TLER ist der einstellbar und meist ab Werk auf einen geringeren Wert voreingestellt, so z.B. bei der WD Red auf 7s statt bei der Green auf 14s. Die meisten HW-RAID Controller haben einen Timeout von 8s, die warten also maximal 8s auf eine Antwort der Platte und wenn diese nicht kommt, dann halten sie die Platte für defekt und werfen sie aus dem RAID. Das kann bei der Red also z.B. nicht passieren, weil die ja spätestens nach 7s aufgibt und einen Fehler meldet.

RAID fähige Platten gab es auch schon vor der WD Red, nur sind und waren die eben teurer und die Barracuda wurde vor allem deshalb gerne überall eingesetzt, weil sie lange die billigste aller Platten war und mit 7200rpm auch noch eine sehr schnelle.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh