ZFS Raid-Z2 HDD ausgefallen

esquire1968

Experte
Thread Starter
Mitglied seit
30.03.2015
Beiträge
170
Hallo zusammen!

Auf meinem Server (OmniOS, napp-it) laufen 6 HDD's in einem Raid Z2 Verbund. Offensichtlich ist eine Platte ausgefallen, die ich jetzt mit einer baugleichen ersetzen möchte.

Code:
NAME                       STATE     READ WRITE CKSUM      CAP            Product /napp-it   SN/LUN           IOstat mess       SMART
    tank                       DEGRADED     0     0     0
      raidz2-0                 DEGRADED     0     0     0
        c0t5000C500A4D1390Ad0  ONLINE       0     0     0      4 TB           ST4000VN008-2DR1   ZGY0X88C         S:0 H:0 T:0       -
        c0t5000C500A4D15D91d0  ONLINE       0     0     0      4 TB           ST4000VN008-2DR1   ZGY0X6XR         S:0 H:0 T:0       -
        c0t5000C500A4D15DC5d0  ONLINE       0     0     0      4 TB           ST4000VN008-2DR1   ZGY0X6PN         S:0 H:0 T:0       -
        c0t5000C500A4D1653Ad0  ONLINE       0     0     0      4 TB           ST4000VN008-2DR1   ZGY0X85D         S:0 H:0 T:0       -
        c0t5000C500A4D16D14d0  ONLINE       0     0     0      4 TB           ST4000VN008-2DR1   ZGY0X7C0         S:0 H:0 T:0       -
        c0t5000C500AFC829E9d0  UNAVAIL      0     0     0  cannot open                                                               -

errors: No known data errors

Wie ist die richtige Vorgangsweise?
  • Platte entfernen - napp-it Menü: Platten<>Entfernen (Platte auswählen, Pool angeben?)
  • Server herunterfahren
  • Platte tauschen
  • Server hochfahren
  • Platte aktivieren - napp-it Menü: Platten<>Hinzufügen (neue Platte auswählen)
Stimmt das so?

Danke vorab und beste Grüße!
Thomas
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ja schon klar. Die SN der „guten“ Platten habe ich ja auf der Pool Übersicht, dann bleibt ja eine übrig.

Stimmt der Ablauf wie beschrieben? Z. B. Platter „hinzufügen“ oder „replace“?
 
Wenn Du dann genau weisst, welche Platte betroffen:

Prio 1 : Prüfen ob vielleicht nur Stromversorgung der Platte und Sata-Kabel sauber sitzen. Evtl. auch einfach abziehen, Kontakte ggf. mit Isopropanol reinigen und wieder dran damit.
Evtl. auch Sata-Kabel tauschen. Strom weg vorher natürlich, nicht nur soft-off !
Vielleicht ist ja auch einfach nur ein Kabel nicht sauber gesteckt.

Ich hatte schon einige ZFS Fehler einfach wg. Kontakt. oder Kabelproblem. Sowohl an SSD/HDD als auch an Backplanes.
 
Wenn das System hotplug kann z.B. SAS Kontroller + Backplane/Wechseleinschub:
- Defekte Platte "hot" ziehen und neue "hot" einsetzen
- Menü Disk > Replace starten um Platte zu ersetzen (defekt > neu)

Wenn das System kein hotplug kann:
- Server herunterfahren, defekte ausbauen, neue einbauen, starten
- Menü Disk > Replace starten um Platte zu ersetzen (defekt > neu)

Platte entfernen geht nur bei Mirror, Slog, L2Arc und special vdev
Platte hinzufügen geht um aus single vdev einen Mirror zu machen oder einen Mirror um n+1 zu erweitern

Tipp:
nach dem erstmaligen Einrichten WWN oder SN/Slot aufschreiben oder eine Disk > Map erstellen und ausdrucken
 

Anhänge

  • map.png
    map.png
    73,5 KB · Aufrufe: 111
Habe die Platte mal getrennt, die Stecker gereinigt und neu verbunden. Danach war der ganze Pool weg. Mit
Code:
zpool import tank
war der Pool dann wieder da. Nachdem "resilvered" funktioniert auch alles wieder. Allerdings beunruhigen mich dieses Werte.

1627923465581.png

Habe ich da ein Problem???
 
Das dürften die ID-Nummern von Smart-Attributen in den Überschriften sein (ich vermute es, ich bin kein NappIT-User). Das wären dann wohl:
5 = Reallocated_Sector_Count
187 =Reported_Uncorrectable_Errors
188 = Command_Timeout

Ich bin kein Seagate-Experte und Seagate hat teilw. besondere Bitcodierung in manchen ihrer Smart-Werten (ich vermute bei #188 trifft das zu),

Aber mein Bauch sagt: ja, Probleme. Mindestens bei denen mit #5 und #187 ungleich 0. die #188 kann ich nicht einschätzen.

Wie alt sind die Platten?
 
Zuletzt bearbeitet:
Ich würde den Platten (besonders #5 und #187 >0) auch erst wieder trauen nachdem die mit einem Intensivtest als gut befunden werden (WD data live, Seatools). Mindestens einen long smart test würde ich da drüber laufen lassen. Ein Intensiv Test der alle Sektoren schreibt/liest ist aber aussagekräftiger.

ps
Mit Klick unter "Details" kann man das komplette Smartprotokoll sehen
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh