Nachdem Holt dargelegt hat, dass die vom Backblaze-Artikel übernommenen Empfehlungswerte "Blödsinn" sind, (weil vom Hersteller/Festplattenmodell/persönlicher Fehlertoleranz abhängig), korrigiere ich das mal oben, damit es nicht der Nächste unreflektiert übernimmt. - Allgemeingültige Faustregeln zum Festplattentausch wären ja auch zu einfach gewesen.
Mich hat gewundert warum CDI den Parameter 187 trotz einer Menge Fehler noch für Ok hat.
Zur Frage, wie hohe S.M.A.R.T.-Rohwerte zustande kommen... (s.a.: Post#1, Bild 2, Wert #187: gemeldete unkorrigierbare Fehler=720899 in der Dezimalausgabe von Argus)
- Das hängt davon ab, wie der Hersteller Samsung das S.M.A.R.T-Attribut#187 definiert und wird leider selten bekannt gegeben. Ergibt die Hex>Dec-Umrechnung merkwürdige Werte, ziehen wir die Hexadezimalen Rohwerte, S.M.A.R.T-Attributspezifikationen des Herstellers und die Min/Max/Grenzwerte zu Rate.
Hier sind 2 Beispiele für Seagate Festplatten, wie zu hoch erscheinende Rohwerte in Hex umgerechnet und anhand der vorliegenden S.M.A.R.T.-Spezifikation in kleinere Zahlengruppen aufgeteilt werden können. Der Hersteller kann so mehrere Zahlen in einem S.M.A.R.T.-Rohwert speichern.
- Für deine Samsung HD500LJ liegen mir leider keine S.M.A.R.T-Attributspezifikation vor.
Holt vermutet eine Aufteilung des Rohwerts 0xB0003 in 0x000B=11 und 0x0003=3. Das ist höchstwahrscheinlich korrekt.
Ich vermute, dass der Min/Max Wert eine Art Prozentsatz für die noch möglichen unkorrigierbaren ECC-Fehler darstellt, der von 100% auf den Grenzwert 0% absinkt. Darauf komme ich, weil mir die Werte des Parameters #187 von anderen Laufwerken bekannt sind (begrenzt vergleichbar, aber nicht das selbe Laufwerksmodell):
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0............................................................Device Model: Samsung SSD 860 PRO 256GB (fehlerfreie Samsung SSD)
187 Reported_Uncorrect 0x0032 099 099 000 Old_age Always - 1............................................................Device Model: ST33000651AS (diese Seagate Barracuda XT musste inzwischen ersetzt werden)
187 Reported_Uncorrect 0x0032 098 098 000 Old_age Always - 720899...............................................Device Model: Samsung HD500LJ (deine Festplatte, angefügt zum Vergleich)
Ein
Zusammenhang zwischen steigender
Ausfallwahrscheinlichkeit von Festplatten und Erhöhung der im
Artikel beschriebenen
S.M.A.R.T.-Rohwerte besteht dennoch, während andere Rohwerte weniger kritisch sind.
Beim
> Auslesen dieser Werte vorher,
> "Abklopfen" in Form eines vollständigen Schreib-Lese-Tests wie h2testw oder
badblocks -b 4096 -ws /dev/sdX,
> Auslesen dieser Werte nachher,
ist also besonders darauf zu achten, ob sich da etwas geändert hat.
Die Empfehlungen habe ich ersetzt mit Links zu den Diagrammen von backblaze. Da kann man eine eigene Meinung bilden. Ob man ein Laufwerk mit erhöhter Ausfallwahrscheinlichkeit weiter betreibt, hängt schließlich auch vom Einsatzzweck/Einsatzzeit/vorhandener Redundanz/- Parität ab. Ein 24/7-Betrieb, wie bei Cloudanbietern - das kommt bei den meisten Benutzern wohl kaum vor.