ZFS checkusm errors - Verdacht auf Ursache plausibel?

me777

Enthusiast
Thread Starter
Mitglied seit
07.04.2009
Beiträge
403
Mein ZFS ist recht neu aufgesetzt nachdem ich neue Festplatten eingebaut habe.
Bis jetzt kamen 5 mal "I/O errors", die ersten 3 sind bei einer anderen Platte gewesen und weg gegangen nachdem ich einen andere Einschub genommen habe - da habve ich gedacht naja, hat halt des Kabel warscheinlich ein Problem und des is jetzt gut.
Aber dann wieder 2 mal I/O und schlieslich dieser checksum bei dieser Platte.

mein Verdacht sind die billigen Kabel
Ist da plausibel oder soll ich ehr die Festplatten genauer testen?

The number of I/O errors associated with a ZFS device exceeded
acceptable levels. ZFS has marked the device as faulted.

impact: Fault tolerance of the pool may be compromised.
eid: 326
class: statechange
state: FAULTED
host: xeon
time: 2022-04-03 11:47:25+0200
vpath: /dev/disk/by-id/ata-ST18000NM000J-2TV103_WR50086Y-part1
vphys: pci-0000:01:00.0-sas-phy7-lun-0
vguid: 0xE1E981E99738D2FC
devid: ata-ST18000NM000J-2TV103_WR50086Y-part1
pool: 0xAF4AF39A5586D097

The number of checkusm errors associated with a ZFS device
exceeded acceptable levels. ZFS has marked the device as
degraded.

impact: Fault tolerance of the pool may be compromised.
eid: 30
class: statechange
state: DEGRADED
host: xeon
time: 2022-04-10 01:59:02+0200
vpath: /dev/disk/by-id/ata-ST18000NM000J-2TV103_WR50086Y-part1
vphys: pci-0000:01:00.0-sas-phy7-lun-0
vguid: 0xE1E981E99738D2FC
devid: ata-ST18000NM000J-2TV103_WR50086Y-part1
pool: 0xAF4AF39A5586D097

Hardware/Software:
ASUS Controller PIKE II 3008-8i
Wechselrahmen Silverstone Sst-FS305-12G
5* Festplatte 18TB Seagate Exos X X18
Debian 11.3
zfs-2.0.3-9
Danke für alle Tipps.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Typischerweise
- Kabelverbindung (nicht richtig gesteckt)
- Kabel (Bruch, schlechte Qualität)
- Controller firmware (hatte ich Mal bei LSI2008 mit firmware 20.0.0.4 oder so)
 
mein Verdacht sind die billigen Kabel
Ist da plausibel oder soll ich ehr die Festplatten genauer testen?

Ich nutze genau die gleichen Kabel (2 mal im Hauptsystem, von Onboard zu SilverStone Backplane, 2 mal im Backup vom Dell Hba330 zu SilverStone Backplane) seit über 2 Jahren völlig problemlos. Deine können natürlich trotzdem fehlerhaft sein, aber grundsätzlich kann man mit diesen günstigen Kabeln auch problemlos leben.
 
Kann schon das Kabel sein, hatte ich auch schon mal mit genau den gleichen.
 
Danke.

Ich habe die Stecker nochmal reingedrückt, die waren eigentlich alle fest.
Ansonsten habe ich einen smart test angestoßen und wenn der nichts bringt werde ich wohl andere Kabel testen;
Die von broadcom können anscheinend sogar 12G SAS und sind nicht so teuer.
 
mein Verdacht sind die billigen Kabel
Ist da plausibel oder soll ich ehr die Festplatten genauer testen?
Schau halt auf die S.M.A.R.T. Werte der Platten, alle SATA HDDs haben das Attribut 0xC7 = 199 für Kommunikationsfehler mit dem Host Controller. Der Rohwert sollte 0 sein oder, wenn er nicht mehr 0 ist, zumindest mehr steigen. Da es ein Lebenszeitzähler ist, wird er nicht mehr auf 0 fallen, wenn die Ursache (fast immer Kabel oder Backplane) behoben ist, aber wenn er nicht steigt, sollte alles passen. Wobei manche Platten den Wert bei jedem Fehler erhöhen, während andere dies offenbar nur beim ersten Fehler für jedes Power-On machen und danach bei weiteren Fehlern bis zum Ausschalten nicht wieder.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh