Samsung SM863 mit Problem?

Trambahner

Urgestein
Thread Starter
Mitglied seit
14.08.2014
Beiträge
3.173
Ort
Serverraum
Ich hab heute festgestellt, dass eine meiner SM863 in nem Zpool wohl Ärger bereitet:
Code:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       334
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       120
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       1
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0013   100   100   010    Pre-fail  Always       -       7742
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   048   044   000    Old_age   Always       -       52
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   100   100   000    Old_age   Always       -       0
202 Exception_Mode_Status   0x0033   001   001   010    Pre-fail  Always   FAILING_NOW 16
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       96
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       2438532123
242 Total_LBAs_Read         0x0032   099   099   000    Old_age   Always       -       8051421108
243 SATA_Downshift_Ct       0x0032   100   100   000    Old_age   Always       -       0
244 Thermal_Throttle_St     0x0032   100   100   000    Old_age   Always       -       0
245 Timed_Workld_Media_Wear 0x0032   100   100   000    Old_age   Always       -       65535
246 Timed_Workld_RdWr_Ratio 0x0032   100   100   000    Old_age   Always       -       65535
247 Timed_Workld_Timer      0x0032   100   100   000    Old_age   Always       -       65535
251 NAND_Writes             0x0032   100   100   000    Old_age   Always       -       258048

Ist dieses Attribut 202 Exception_Mode_Status kritisch? Was besagt dieses genau?

Eine im gleichen Pool verbaute SM863 wirft per smartctl aus:
Code:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       335
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       126
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       1
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0013   100   100   010    Pre-fail  Always       -       7735
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
184 End-to-End_Error        0x0033   100   100   097    Pre-fail  Always       -       0
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   043   039   000    Old_age   Always       -       57
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   100   100   000    Old_age   Always       -       0
202 Exception_Mode_Status   0x0033   100   100   010    Pre-fail  Always       -       0
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       72
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       2444150985
242 Total_LBAs_Read         0x0032   099   099   000    Old_age   Always       -       8096975375
243 SATA_Downshift_Ct       0x0032   100   100   000    Old_age   Always       -       0
244 Thermal_Throttle_St     0x0032   100   100   000    Old_age   Always       -       0
245 Timed_Workld_Media_Wear 0x0032   100   100   000    Old_age   Always       -       65535
246 Timed_Workld_RdWr_Ratio 0x0032   100   100   000    Old_age   Always       -       65535
247 Timed_Workld_Timer      0x0032   100   100   000    Old_age   Always       -       65535
251 NAND_Writes             0x0032   100   100   000    Old_age   Always       -       3677951792

Die "NAND_Writes" der 1. SSD schauen auch komisch aus vs. der zweiten. Die beiden Teile wurden zeitgleich in einen Zpool verbaut.
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ok, habs in den Samsung manuals gefunden. Dort heisst das Attribut allerdings "SSD Mode Status".

Der Wert 16 bedeutet, dass der Stützkondensator für Powerloss-Protection ausgefallen ist.
 
Zuletzt bearbeitet:
Die Namen der Attribute kommen im Gegensatz zu den übrigen Informationen in der Liste nicht vom Controller, die muss das Tool welches die S.M.A.R.T. Werte also für jede Platte selbst kennen und in seiner Hintergrunddatenbank haben. Die Tools der Hersteller selbst sollten sie kennen, die bei 3rd Party Tools sind sie leider öfter mal nicht korrekt. Im Zweifel sollte man aus den Dokumenten vom Hersteller selbst nachschlagen.
 
Ok, habs in den Samsung manuals gefunden. Dort heisst das Attribut allerdings "SSD Mode Status".

Der Wert 16 bedeutet, dass der Stützkondensator für Powerloss-Protection ausgefallen ist.

Wo hast du das gefunden? Ich habe in verschiedenen Manuals keine Liste der Fehler gefunden.
 
Ich meine, das war ein PDF von Samsung mit sehr detailierten technischen Details für Datacenter für die Enterprise-SSDs. Frag mich aber nicht mehr nach dem Link, das hab ich nicht gebookmarked.

Gemerkt hab ich das Problem, da ZFS in dem Mirror-Pool wo diese SSD drin war auf dieses Devices fast nichts mehr geschrieben hat und die Belegung der anderen Mirror-vdevs merkbar höher war. Nur noch 30-40 Mb/s gingen (bzw. gehen wenn man sie an einen x-beliebigen Sata-Anschluss hängt) schreibend sequentiell, lesen geht fullspeed.
Ich vermute, der Controller wartet da aus Sicherheitsgründen jeden einzelnen Schreibvorgang in einen Flashbaustein ab, damit ohne die Powerloss Protection nichts verloren gehen kann. Damit ist das Ding halt quasi nur noch als Bootmedium für Betriebssysteme tauglich, die nicht oder fast nicht auf das Bootmedium schreiben.

(Btw, die damals betroffene SSD ist mittlerweile eh ausrangiert und durch eine Sm883 ersetzt. Dank Zpool replace eine entspannte und schnelle Sache)
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh