WD MyBook 12TB - hinüber oder gibt's noch irgendwas zu retten?

Pillendreher · 23.08.2022

Hallo in die Runde,

lange Rede, kurzer Sinn: Meine 12TB WD MyBook Platte hat es wohl komplett zerschossen.

Smart-Informationen:

Code:

[root@sysrescue ~]# smartctl -a /dev/sda
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-5.15.58-2-lts] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD120EMFZ-11A6JA0
Serial Number:    xxxxxxxx
LU WWN Device Id: 5 000cca 264d4a35b
Firmware Version: 81.00A81
User Capacity:    12,000,138,625,024 bytes [12.0 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database 7.3/5319
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Aug 16 19:05:56 2022 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Read SMART Thresholds failed: scsi error medium or hardware error (serious)

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (  101) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (1280) minutes.
SCT capabilities:            (0x003d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   ---    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0004   135   135   ---    Old_age   Offline      -       108
  3 Spin_Up_Time            0x0007   081   081   ---    Pre-fail  Always       -       378 (Average 385)
  4 Start_Stop_Count        0x0012   095   095   ---    Old_age   Always       -       2306
  5 Reallocated_Sector_Ct   0x0033   100   100   ---    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   075   075   ---    Old_age   Always       -       65552
  8 Seek_Time_Performance   0x0004   133   133   ---    Old_age   Offline      -       18
  9 Power_On_Hours          0x0012   100   100   ---    Old_age   Always       -       4490
 10 Spin_Retry_Count        0x0012   100   100   ---    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   092   092   ---    Old_age   Always       -       555
 22 Helium_Level            0x0023   100   100   ---    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   100   100   ---    Old_age   Always       -       2980
193 Load_Cycle_Count        0x0012   100   100   ---    Old_age   Always       -       2980
194 Temperature_Celsius     0x0002   054   054   ---    Old_age   Always       -       30 (Min/Max 16/51)
196 Reallocated_Event_Count 0x0032   100   100   ---    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   ---    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   ---    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   100   100   ---    Old_age   Always       -       0

Read SMART Log Directory failed: scsi error medium or hardware error (serious)

Read SMART Error Log failed: scsi error medium or hardware error (serious)

Read SMART Self-test Log failed: scsi error medium or hardware error (serious)

Read SMART Selective Self-test Log failed: scsi error medium or hardware error (serious)

Fehler im Log beim Mount-Versuch:

Code:

root@sysrescue /mnt]# sudo dmesg
[...]
[  332.890562] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  332.890573] ata2.00: irq_stat 0x40000001
[  332.890578] ata2.00: failed command: READ DMA EXT
[  332.890580] ata2.00: cmd 25/00:08:80:ff:ff/00:00:74:05:00/e0 tag 0 dma 4096 in
                        res 53/40:08:80:ff:ff/00:00:74:05:00/40 Emask 0x9 (media error)
[  332.890592] ata2.00: status: { DRDY SENSE ERR }
[  332.890595] ata2.00: error: { UNC }
[  332.895919] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  332.896459] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  332.907985] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  332.908512] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  332.909985] ata2.00: configured for UDMA/133
[  332.910031] sd 1:0:0:0: [sda] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  332.910037] sd 1:0:0:0: [sda] tag#0 Sense Key : Medium Error [current]
[  332.910041] sd 1:0:0:0: [sda] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed
[  332.910046] sd 1:0:0:0: [sda] tag#0 CDB: Read(16) 88 00 00 00 00 05 74 ff ff 80 00 00 00 08 00 00
[  332.910048] blk_update_request: I/O error, dev sda, sector 23437770624 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
[  332.910071] ata2: EH complete
[  333.020420] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  333.020431] ata2.00: irq_stat 0x40000001
[  333.020436] ata2.00: failed command: READ DMA EXT
[  333.020438] ata2.00: cmd 25/00:08:80:ff:ff/00:00:74:05:00/e0 tag 19 dma 4096 in
                        res 53/40:08:80:ff:ff/00:00:74:05:00/40 Emask 0x9 (media error)
[  333.020450] ata2.00: status: { DRDY SENSE ERR }
[  333.020453] ata2.00: error: { UNC }
[  333.130464] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  333.130969] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  333.142592] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  333.143100] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  333.144577] ata2.00: configured for UDMA/133
[  333.144611] sd 1:0:0:0: [sda] tag#19 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  333.144616] sd 1:0:0:0: [sda] tag#19 Sense Key : Medium Error [current]
[  333.144620] sd 1:0:0:0: [sda] tag#19 Add. Sense: Unrecovered read error - auto reallocate failed
[  333.144625] sd 1:0:0:0: [sda] tag#19 CDB: Read(16) 88 00 00 00 00 05 74 ff ff 80 00 00 00 08 00 00
[  333.144627] blk_update_request: I/O error, dev sda, sector 23437770624 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
[  333.144636] Buffer I/O error on dev sda, logical block 2929721328, async page read
[  333.144657] ata2: EH complete
[  333.280188] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  333.280201] ata2.00: irq_stat 0x40000001
[  333.280206] ata2.00: failed command: READ DMA
[  333.280209] ata2.00: cmd c8/00:01:00:00:00/00:00:00:00:00/e0 tag 27 dma 512 in
                        res 53/40:01:00:00:00/00:00:00:00:00/40 Emask 0x9 (media error)
[  333.280223] ata2.00: status: { DRDY SENSE ERR }
[  333.280227] ata2.00: error: { UNC }
[  333.285375] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  333.285888] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  333.451722] ata2.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  333.452228] ata2.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  333.453708] ata2.00: configured for UDMA/133
[  333.453740] sd 1:0:0:0: [sda] tag#27 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  333.453746] sd 1:0:0:0: [sda] tag#27 Sense Key : Medium Error [current]
[  333.453750] sd 1:0:0:0: [sda] tag#27 Add. Sense: Unrecovered read error - auto reallocate failed
[  333.453754] sd 1:0:0:0: [sda] tag#27 CDB: Read(16) 88 00 00 00 00 00 00 00 00 00 00 00 00 01 00 00
[  333.453757] blk_update_request: I/O error, dev sda, sector 0 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
[  333.453787] ata2: EH complete
[  333.453879] FAT-fs (sda): unable to read boot sector

Komplett erfolgloser ddrescue-Versuch (habs nach ner Stunde abgebrochen, weiterhin ohne auch nur ein einziges wiederhergestelltes Byte):

Und so sah das Unraid-Log währenddessen aus:

Kann man die im Hinterhof verscharren, oder kann man vielleicht doch noch einen letzten Wiederherstellungsversuch starten? Da war nix drauf, was nicht ersetzt werden kann, aber es wäre natürlich schön, wenn ich nicht 10TB an Blurays wieder ausm Keller holen und erneut auf dem Server ablegen müsste.

PS: Parityplatte gibt's jetzt. Manchmal muss man sich erst die Finger verbrennen...

Holt · 23.08.2022

Pillendreher schrieb:
Meine 12TB WD MyBook Platte hat es wohl komplett zerschossen.

Also den einzigen Fehler den ich sehe ich dieser:

Pillendreher schrieb:
7 Seek_Error_Rate 0x000a 075 075 --- Old_age Always - 65552

Wobei 65552 hexadezimal 0x010010 sind und Rohwerte oft mehr als einen Zähler enthalten, so dass die dezimale Anzeige oft in die Irre führt. Wurden die Werte vor oder nach dem Versuch mit ddrescue gemacht? Wenn davor, dann poste bitte noch mal die Werte danach.

Wobei die Frage ist, wie weit man den Werten nach trauen kann, wenn man dies liest:

Pillendreher schrieb:
Read SMART Log Directory failed: scsi error medium or hardware error (serious)

Read SMART Error Log failed: scsi error medium or hardware error (serious)

Read SMART Self-test Log failed: scsi error medium or hardware error (serious)

Read SMART Selective Self-test Log failed: scsi error medium or hardware error (serious)

Ist die Platte vielleicht um- oder gar runtergefallen? Da reicht schon wenige cm wenn man Pech hat.

Pillendreher · 24.08.2022

Holt schrieb:
Also den einzigen Fehler den ich sehe ich dieser:
Wobei 65552 hexadezimal 0x010010 sind und Rohwerte oft mehr als einen Zähler enthalten, so dass die dezimale Anzeige oft in die Irre führt. Wurden die Werte vor oder nach dem Versuch mit ddrescue gemacht? Wenn davor, dann poste bitte noch mal die Werte danach.

Vor dem Einsatz von ddrescue. So sehen die Werte nach dem ddrescue-Versuch aus:

Code:

[root@sysrescue ~]# smartctl -a /dev/sda
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-5.15.58-2-lts] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD120EMFZ-11A6JA0
Serial Number:    xxxxxxxx
LU WWN Device Id: 5 000cca 264d4a35b
Firmware Version: 81.00A81
User Capacity:    12,000,138,625,024 bytes [12.0 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database 7.3/5319
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Aug 24 23:02:34 2022 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Read SMART Thresholds failed: scsi error medium or hardware error (serious)

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (  101) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (1280) minutes.
SCT capabilities:            (0x003d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   ---    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0004   135   135   ---    Old_age   Offline      -       108
  3 Spin_Up_Time            0x0007   081   081   ---    Pre-fail  Always       -       374 (Average 378)
  4 Start_Stop_Count        0x0012   095   095   ---    Old_age   Always       -       2313
  5 Reallocated_Sector_Ct   0x0033   100   100   ---    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   100   100   ---    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0004   133   133   ---    Old_age   Offline      -       18
  9 Power_On_Hours          0x0012   100   100   ---    Old_age   Always       -       4493
 10 Spin_Retry_Count        0x0012   100   100   ---    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   092   092   ---    Old_age   Always       -       562
 22 Helium_Level            0x0023   100   100   ---    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   100   100   ---    Old_age   Always       -       2989
193 Load_Cycle_Count        0x0012   100   100   ---    Old_age   Always       -       2989
194 Temperature_Celsius     0x0002   062   062   ---    Old_age   Always       -       25 (Min/Max 16/51)
196 Reallocated_Event_Count 0x0032   100   100   ---    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   ---    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   ---    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   100   100   ---    Old_age   Always       -       0

Read SMART Log Directory failed: scsi error medium or hardware error (serious)

Read SMART Error Log failed: scsi error medium or hardware error (serious)

Read SMART Self-test Log failed: scsi error medium or hardware error (serious)

Read SMART Selective Self-test Log failed: scsi error medium or hardware error (serious)

Die Seek_Error_Rate ist verschwunden?!

Über fdisk -l wird mir die Platte übrigens gar nicht erst angezeigt.

Holt schrieb:
Wobei die Frage ist, wie weit man den Werten nach trauen kann, wenn man dies liest:
Ist die Platte vielleicht um- oder gar runtergefallen? Da reicht schon wenige cm wenn man Pech hat.

Nicht dass ich wüsste, die war seit Monaten fest im Server verbaut.

Holt · 25.08.2022

Pillendreher schrieb:
So sehen die Werte nach dem ddrescue-Versuch aus:

Seltsam:

Pillendreher schrieb:
7 Seek_Error_Rate 0x000a 100 100 --- Old_age Always - 0

Der Rohwert ist nun 0, der aktuelle Wert 100 und vor allem ist auch der Schlechteste Wert nun 100, obwohl der Wert vorher schon geringer war. Keine Ahnung wie sehr man den S,M.A.R.T. Werten trauen kann, zumal die Platte ja offenbar massive Probleme macht und manchmal gibt sowas es eben, wenn der Bereich in dem die Platte diese speichert ebenfalls Probleme bereitet. Aber diese Werte scheinen ja immerhin zu passen:

Pillendreher schrieb:
4 Start_Stop_Count 0x0012 095 095 --- Old_age Always - 2313
9 Power_On_Hours 0x0012 100 100 --- Old_age Always - 4493

Denn vorher waren es:

Pillendreher schrieb:
4 Start_Stop_Count 0x0012 095 095 --- Old_age Always - 2306
9 Power_On_Hours 0x0012 100 100 --- Old_age Always - 4490

Wobei 7 Einschaltvorgänge bei 3 Betriebsstunden, kann dies angehen? Wenn nichts, könnte es vielleicht ein Problem mit dem Netzteil, dessen Kabel oder Stecker, ggf. auch der Buchse im Gehäuse sein? Der Teufel ist ja manchmal ein Eichhörnchen und wenn die Platten dann immer wieder keinen Strom bekommt, könnte dies vielleicht die I/O Fehler erklären.

Die Platte schon sicher auf einem stabilen Schreibtisch stehen und es sollte keine Vibrationen geben, auch keinen Bass in der Nähe oder sowas, dies kann auch Probleme bereiten.

Pillendreher · 25.08.2022

Holt schrieb:
Wobei 7 Einschaltvorgänge bei 3 Betriebsstunden, kann dies angehen? Wenn nichts, könnte es vielleicht ein Problem mit dem Netzteil, dessen Kabel oder Stecker, ggf. auch der Buchse im Gehäuse sein? Der Teufel ist ja manchmal ein Eichhörnchen und wenn die Platten dann immer wieder keinen Strom bekommt, könnte dies vielleicht die I/O Fehler erklären.

Das hatte ich mir bei diesen ganzen "Reset-Meldungen" während des ddrescue Versuchs auch gedacht. Wobei man aber auch sagen muss: Wie wahrscheinlich ist es, dass es an externen Komponenten liegt, wenn alle anderen Festplatten problemlos im Server laufen und diese nunmehr defekte Platte auch im Desktop-PC letztlich dieselben Probleme hat? Der Stecker vom Netzteil sitzt auch soweit ich das beurteilen kann fest auf dem Anschluss der Festplatte. Und es hört sich auch nicht so an, als würde die Platte ständig neu hochfahren weil die Stromverbindung unterbricht.

Holt schrieb:
Die Platte schon sicher auf einem stabilen Schreibtisch stehen und es sollte keine Vibrationen geben, auch keinen Bass in der Nähe oder sowas, dies kann auch Probleme bereiten.

Gibt es nicht. Der Server steht zwar im Wohnzimmer, jedoch steht der Subwoofer gute 3-4 Meter entfernt und ist auch so eingestellt (insb. über das Einmesssystem des AVR), dass der hier nicht die Scheiben zum Klirren bringt.

Holt · 25.08.2022

Pillendreher schrieb:
Wobei man aber auch sagen muss: Wie wahrscheinlich ist es, dass es an externen Komponenten liegt, wenn alle anderen Festplatten problemlos im Server laufen

Auch wenn sie intern verbaut ist, so kann es immer an den blödesten Dingen liegen, z.B. an einfachen Y.Kabeln für die Spannungsversorgung. Am Ende kannst nur Du wissen ob es angehen kann oder nicht. Schau halt wie die Anzahl der Einschaltungen aller Platten und wenn die bei dieser schneller als bei den anderen steigt, dann weißt Du das gegen die Wahrscheinlichkeit bei der Platte irgendwas mit der Spannungsversorgung nicht stimmt. Ob das an den Kabeln, Steckern oder einem Haarriss auf deren Platine liegt, ist eine andere Frage.

Beachte übrigens, dass die HDDs in den MyBook nicht für den internen Einsatz mit mehreren HDDs in einem Server geeignet sein müssen, es sind eben keine Ultrastar, sondern White Label Platten und es reicht wenn WD die Vibrationssensoren per FW deaktiviert um Probleme zu bekommen. Vielleicht sind es auch Platten die die QC für Ultrastars nicht geschafft haben und zu White Label downgegraded wurden. WD garantiert jedenfalls nur die Kapazität und sonst nichts, außer der üblichen Garantie von ich meine 2 Jahren (Elements) bzw. 3 Jahren (MyBook).

Pillendreher schrieb:
jedoch steht der Subwoofer gute 3-4 Meter entfernt

Kennst Du das Video "Shouting in the Datacenter"? Da sieht man den Effekt und die Empfindlichkeit der Vibrationssensoren und ich würde einfach mal beim nächsten Versuch mir ddrescue die Lautstärke deutlich reduzieren bzw. die Musik mal ganz ausmachen.

Pillendreher · 25.08.2022

Holt schrieb:
Auch wenn sie intern verbaut ist, so kann es immer an den blödesten Dingen liegen, z.B. an einfachen Y.Kabeln für die Spannungsversorgung. Am Ende kannst nur Du wissen ob es angehen kann oder nicht. Schau halt wie die Anzahl der Einschaltungen aller Platten und wenn die bei dieser schneller als bei den anderen steigt, dann weißt Du das gegen die Wahrscheinlichkeit bei der Platte irgendwas mit der Spannungsversorgung nicht stimmt. Ob das an den Kabeln, Steckern oder einem Haarriss auf deren Platine liegt, ist eine andere Frage.

Hab gerade gesehen dass der Stecker vom Netzteil nicht richtig saß; ein kleiner Teil der "seitlichen Umrahmung" des Stromsteckers auf der Festplatte war abgebrochen (keine Ahnung wie das passiert ist; ich habe nie mit Gewaltaufwendung den Stromstecker draufgesteckt...). Jedenfalls sitzt er nun bombenfest, aber geändert hat sich leider nichts:

Code:

[root@sysrescue ~]# smartctl -a /dev/sda
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-5.15.58-2-lts] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD120EMFZ-11A6JA0
Serial Number:    xxxxxxxx
LU WWN Device Id: 5 000cca 264d4a35b
Firmware Version: 81.00A81
User Capacity:    12,000,138,625,024 bytes [12.0 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database 7.3/5319
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Aug 25 19:20:17 2022 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Read SMART Thresholds failed: scsi error medium or hardware error (serious)

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever
                    been run.
Total time to complete Offline
data collection:         (  101) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (1280) minutes.
SCT capabilities:            (0x003d)    SCT Status supported.
                    SCT Error Recovery Control supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   ---    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0004   135   135   ---    Old_age   Offline      -       108
  3 Spin_Up_Time            0x0007   082   082   ---    Pre-fail  Always       -       371 (Average 374)
  4 Start_Stop_Count        0x0012   095   095   ---    Old_age   Always       -       2314
  5 Reallocated_Sector_Ct   0x0033   100   100   ---    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000a   100   100   ---    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0004   133   133   ---    Old_age   Offline      -       18
  9 Power_On_Hours          0x0012   100   100   ---    Old_age   Always       -       4493
 10 Spin_Retry_Count        0x0012   100   100   ---    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   092   092   ---    Old_age   Always       -       563
 22 Helium_Level            0x0023   100   100   ---    Pre-fail  Always       -       100
192 Power-Off_Retract_Count 0x0032   100   100   ---    Old_age   Always       -       2990
193 Load_Cycle_Count        0x0012   100   100   ---    Old_age   Always       -       2990
194 Temperature_Celsius     0x0002   060   060   ---    Old_age   Always       -       26 (Min/Max 16/51)
196 Reallocated_Event_Count 0x0032   100   100   ---    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   ---    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   ---    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   100   100   ---    Old_age   Always       -       0

Read SMART Log Directory failed: scsi error medium or hardware error (serious)

Read SMART Error Log failed: scsi error medium or hardware error (serious)

Read SMART Self-test Log failed: scsi error medium or hardware error (serious)

Read SMART Selective Self-test Log failed: scsi error medium or hardware error (serious)

Code:

[root@sysrescue ~]# mount /dev/sda /mnt/HDD
mount: /mnt/HDD: can't read superblock on /dev/sda.
       dmesg(1) may have more information after failed mount system call.

Code:

[  376.480440] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  376.480451] ata1.00: irq_stat 0x40000001
[  376.480456] ata1.00: failed command: READ DMA EXT
[  376.480458] ata1.00: cmd 25/00:08:80:ff:ff/00:00:74:05:00/e0 tag 4 dma 4096 in
                        res 53/40:08:80:ff:ff/00:00:74:05:00/40 Emask 0x9 (media error)
[  376.480470] ata1.00: status: { DRDY SENSE ERR }
[  376.480473] ata1.00: error: { UNC }
[  376.485519] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  376.486024] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  376.496946] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  376.497453] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  376.498919] ata1.00: configured for UDMA/133
[  376.498951] sd 0:0:0:0: [sda] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  376.498957] sd 0:0:0:0: [sda] tag#4 Sense Key : Medium Error [current]
[  376.498961] sd 0:0:0:0: [sda] tag#4 Add. Sense: Unrecovered read error - auto reallocate failed
[  376.498965] sd 0:0:0:0: [sda] tag#4 CDB: Read(16) 88 00 00 00 00 05 74 ff ff 80 00 00 00 08 00 00
[  376.498967] blk_update_request: I/O error, dev sda, sector 23437770624 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
[  376.498995] ata1: EH complete
[  376.600396] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  376.600406] ata1.00: irq_stat 0x40000001
[  376.600411] ata1.00: failed command: READ DMA EXT
[  376.600413] ata1.00: cmd 25/00:08:80:ff:ff/00:00:74:05:00/e0 tag 14 dma 4096 in
                        res 53/40:08:80:ff:ff/00:00:74:05:00/40 Emask 0x9 (media error)
[  376.600425] ata1.00: status: { DRDY SENSE ERR }
[  376.600428] ata1.00: error: { UNC }
[  376.727090] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  376.727591] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  376.738544] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  376.739052] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  376.740532] ata1.00: configured for UDMA/133
[  376.740563] sd 0:0:0:0: [sda] tag#14 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  376.740568] sd 0:0:0:0: [sda] tag#14 Sense Key : Medium Error [current]
[  376.740572] sd 0:0:0:0: [sda] tag#14 Add. Sense: Unrecovered read error - auto reallocate failed
[  376.740577] sd 0:0:0:0: [sda] tag#14 CDB: Read(16) 88 00 00 00 00 05 74 ff ff 80 00 00 00 08 00 00
[  376.740579] blk_update_request: I/O error, dev sda, sector 23437770624 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
[  376.740588] Buffer I/O error on dev sda, logical block 2929721328, async page read
[  376.740602] ata1: EH complete
[  376.890163] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[  376.890174] ata1.00: irq_stat 0x40000001
[  376.890178] ata1.00: failed command: READ DMA
[  376.890181] ata1.00: cmd c8/00:01:00:00:00/00:00:00:00:00/e0 tag 12 dma 512 in
                        res 53/40:01:00:00:00/00:00:00:00:00/40 Emask 0x9 (media error)
[  376.890192] ata1.00: status: { DRDY SENSE ERR }
[  376.890195] ata1.00: error: { UNC }
[  376.895229] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  376.895737] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  377.064982] ata1.00: Read log 0x13 page 0x00 failed, Emask 0x1
[  377.065491] ata1.00: Read log 0x12 page 0x00 failed, Emask 0x1
[  377.066983] ata1.00: configured for UDMA/133
[  377.067014] sd 0:0:0:0: [sda] tag#12 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[  377.067019] sd 0:0:0:0: [sda] tag#12 Sense Key : Medium Error [current]
[  377.067023] sd 0:0:0:0: [sda] tag#12 Add. Sense: Unrecovered read error - auto reallocate failed
[  377.067027] sd 0:0:0:0: [sda] tag#12 CDB: Read(16) 88 00 00 00 00 00 00 00 00 00 00 00 00 01 00 00
[  377.067030] blk_update_request: I/O error, dev sda, sector 0 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
[  377.067053] ata1: EH complete
[  377.067112] FAT-fs (sda): unable to read boot sector

Holt schrieb:
Beachte übrigens, dass die HDDs in den MyBook nicht für den internen Einsatz mit mehreren HDDs in einem Server geeignet sein müssen, es sind eben keine Ultrastar, sondern White Label Platten und es reicht wenn WD die Vibrationssensoren per FW deaktiviert um Probleme zu bekommen. Vielleicht sind es auch Platten die die QC für Ultrastars nicht geschafft haben und zu White Label downgegraded wurden. WD garantiert jedenfalls nur die Kapazität und sonst nichts, außer der üblichen Garantie von ich meine 2 Jahren (Elements) bzw. 3 Jahren (MyBook).

Kann das auch relevant sein, wenn die Platten - wie bei mir - grundsätzlich die ganze Zeit über schlafen? "Power On Hours" kann eigentlich nur die Zeit meinen, in der mein Server nich in S3 schlummert, denn Unraid ist so eingestellt, dass die Platten nach 15 Minuten Leerlauf schlafen gehen; da komme ich mit fast 4500 Stunden seit Juni 2021 nicht mal ansatzweise hin, denn die Platte ist nie im Leben gut 10h am Tag richtig "gelaufen" - das wäre mir aufgefallen.

Holt schrieb:
Kennst Du das Video "Shouting in the Datacenter"? Da sieht man den Effekt und die Empfindlichkeit der Vibrationssensoren und ich würde einfach mal beim nächsten Versuch mir ddrescue die Lautstärke deutlich reduzieren bzw. die Musik mal ganz ausmachen.

Hab das Video in der Tat letztens zufällig gesehen. Aber keine Sorge: Es lief keine Musik.

EDIT:

Gerade mal testweise die Place in ein USB-Gehäuse gesteckt, welches selber tadellos funktioniert:

Code:

[  388.040118] usb 3-2-port3: Cannot enable. Maybe the USB cable is bad?
[  389.120547] usb 3-2-port3: Cannot enable. Maybe the USB cable is bad?
[  389.120921] usb 3-2-port3: attempt power cycle
[  390.527688] usb 3-2-port3: Cannot enable. Maybe the USB cable is bad?
[  391.608437] usb 3-2-port3: Cannot enable. Maybe the USB cable is bad?
[  391.608839] usb 3-2-port3: unable to enumerate USB device

EDIT2: Hier im USB Gehäuse am Desktop-Rechner

Code:

[ 1660.734081] usb 2-1: new SuperSpeed Plus Gen 2x1 USB device number 3 using xhci_hcd
[ 1660.773375] usb 2-1: New USB device found, idVendor=174c, idProduct=55aa, bcdDevice= 1.00
[ 1660.773385] usb 2-1: New USB device strings: Mfr=2, Product=3, SerialNumber=1
[ 1660.773389] usb 2-1: Product: USB3.1 Storage Device
[ 1660.773392] usb 2-1: Manufacturer: Space keys
[ 1660.773395] usb 2-1: SerialNumber: 6RYP85HX0000
[ 1660.795918] scsi host10: uas
[ 1660.805460] scsi 10:0:0:0: Direct-Access     WDC WD12 0EMFZ-11A6JA0    0    PQ: 0 ANSI: 6
[ 1660.806268] sd 10:0:0:0: Attached scsi generic sg1 type 0
[ 1660.806917] sd 10:0:0:0: [sdb] 23437770752 512-byte logical blocks: (12.0 TB/10.9 TiB)
[ 1660.806924] sd 10:0:0:0: [sdb] 4096-byte physical blocks
[ 1660.806998] sd 10:0:0:0: [sdb] Write Protect is off
[ 1660.807002] sd 10:0:0:0: [sdb] Mode Sense: 43 00 00 00
[ 1660.807160] sd 10:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[ 1660.807736] sd 10:0:0:0: [sdb] Optimal transfer size 33553920 bytes not a multiple of physical block size (4096 bytes)
[ 1661.813229] sd 10:0:0:0: [sdb] tag#5 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_OK cmd_age=0s
[ 1661.813235] sd 10:0:0:0: [sdb] tag#5 Sense Key : Hardware Error [current] 
[ 1661.813238] sd 10:0:0:0: [sdb] tag#5 Add. Sense: Internal target failure
[ 1661.813241] sd 10:0:0:0: [sdb] tag#5 CDB: Read(16) 88 00 00 00 00 00 00 00 00 00 00 00 00 08 00 00
[ 1661.813243] blk_update_request: critical target error, dev sdb, sector 0 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
[ 1661.813248] Buffer I/O error on dev sdb, logical block 0, async page read

smartctl läuft übers Gehäuse gar nicht erst, und auch der mount Befehl spuckt nicht einmal nen Fehler aus.

Holt · 25.08.2022

Pillendreher schrieb:
aber geändert hat sich leider nichts:

Dann hat sie womöglich einen Schaden. Funktioniert eigentlich "Read SMART Log Directory" bei den anderen Platten im Server? Wenn ja, sind das die gleichen Modelle oder andere, wenn letzteres welche?

Pillendreher schrieb:
Kann das auch relevant sein, wenn die Platten - wie bei mir - grundsätzlich die ganze Zeit über schlafen?

Es geht ja auch um die Vibrationen wenn mehrere HDDs im gleichen Gehäuse arbeiten.

Pillendreher schrieb:
"Power On Hours" kann eigentlich nur die Zeit meinen, in der mein Server nich in S3 schlummert

Leider habe ich noch nirgends gelesen ob diese Zeit einbezogen wird, aber im Prinzip ja, denn dann liegt auch Spannung an.

Pillendreher · 25.08.2022

Holt schrieb:
Dann hat sie womöglich einen Schaden. Funktioniert eigentlich "Read SMART Log Directory" bei den anderen Platten im Server? Wenn ja, sind das die gleichen Modelle oder andere, wenn letzteres welche?

Im Moment sind folgende Platten verbaut:

3x WD Ultrastar DC HC550 18TB
1x WD MyBook 14TB
1x WD MyBook 10TB

Ich habe gerade jede einzelne per "smartctl -a" abgefragt, und bei keiner einzigen einen "Read SMART Log Directory failed:" Fehler ausgespuckt bekommen.

Holt schrieb:
Es geht ja auch um die Vibrationen wenn mehrere HDDs im gleichen Gehäuse arbeiten.

Interessanter Hinweis. Daran hatte ich ehrlich gesagt nie gedacht. Die meisten Aussagen zu "White Label" Platten ging eher in die Richtung "Klar, wieso sollen die nicht verwendet werden können"...

Holt schrieb:
Leider habe ich noch nirgends gelesen ob diese Zeit einbezogen wird, aber im Prinzip ja, denn dann liegt auch Spannung an.

Klingt schlüssig.

Holt · 25.08.2022

Pillendreher schrieb:
Die meisten Aussagen zu "White Label" Platten ging eher in die Richtung "Klar, wieso sollen die nicht verwendet werden können"...

Also so nach dem Motto: Esst mehr Mist, Milliarden Fliegen können nicht irren!

Jemand hatte mal berichtet, dass er nach so 3 Jahren mit dem White Label im Server Probleme bekommen hat. Ich weiß das die MyBook lange günstiger waren als eine interne HDD, aber ich denke dies hatte schon seine Gründe und würde eher auf Restverwertung tippen als darauf einfach nur den Absatz steigern zu wollen. Interessanterweise ist es ja bei den 18TB anderes, da kostet die Ultrastar HC550 ab320€ und ist damit ein gutes Stück günstiger als die MyBook und Elements und ebenso in 20TB, wo die Ultrastar HC 560 ab 387€ deutlich günstiger al die Elements 20TB ist. Da könnten wirklich echte Ultrastar drin sein, aber dies wird bei den Preisen wohl keiner ausprobieren wollen. Offenbar hat WD erkennt, wie schlecht es für das Image ist, wenn die Leute dann haufenweise im Netz schreiben ihre Ultrastar würden früh verrecken, wenn sie eigentlich die White Label meinem.

Suche

WD MyBook 12TB - hinüber oder gibt's noch irgendwas zu retten?

Pillendreher

Enthusiast

Holt

Legende

Pillendreher

Enthusiast

Holt

Legende

Pillendreher

Enthusiast

Holt

Legende

Pillendreher

Enthusiast

Holt

Legende

Pillendreher

Enthusiast

Holt

Legende